😚🤫🫠🤥😶Lesswrong — это онлайн-сообщество и блог, где люди обсуждают способы думать эффективнее, принимать более обоснованные решения и минимизировать когнитивные искажения. 😚Не знаю как я на него попал, но он часто в рассылке подкидывает мне статьи и методы от которых у меня кипит мозг, и похоже создает новые нейронные связи. 😚И сегодня в одной из таких рассылок было про Теорему о хорошем регуляторе.Теорема о хорошем регуляторе — это теорема, разработанная Роджером К. Конантом и У. Россом Эшби, которая является центральной в кибернетике. Изначально она была сформулирована так: «Каждый хороший регулятор системы должен быть моделью этой системы». Это означает, что любой регулятор, который является максимально простым среди оптимальных регуляторов, должен вести себя как образ этой системы при гомоморфизме.😚🥵Вот и я ничего не понял. Потому я попросил Gemini 2.5 pro описать это попонятнее для обычных людей, вот что получилось:😚😗😙😚Представьте себе двух поваров, которым дали одну и ту же задачу: приготовить идеальный стейк на гриле.😚😶🌫️Агент — это повар.😚😶🌫️Среда — это гриль, стейк, температура воздуха и т.д.😚😶🌫️Целенаправленная задача — приготовить стейк определенной прожарки (например, medium rare).😚Повар №1 (Простой регулятор, без модели)Этот повар действует по простой инструкции: «Положи стейк на гриль, держи 3 минуты, переверни, держи еще 3 минуты, снимай».😚😶🌫️Одна задача: Он умеет выполнять только этот один, строго заданный алгоритм.😚😶🌫️Нет обобщения: Если вы дадите ему стейк потолще, или на улице будет холоднее и гриль быстрее остынет, он все равно будет слепо следовать инструкции "3 минуты + 3 минуты". Результат будет уже не идеальным (стейк будет сырым). Он не может адаптироваться.😚😶🌫️Нет модели: У него нет внутреннего понимания («модели») того, как жарится мясо. Он не понимает, что толщина мяса, начальная температура, жар углей — все это влияет на время готовки. Он просто робот, выполняющий одну программу.😚Повар №2 (Хороший регулятор, с неявной моделью)Этот повар — опытный. Ему можно ставить разнообразные задачи: "сделай medium rare", "а теперь well-done", "а этот тонкий кусок сделай medium".Как он этого добивается? Он изучил неявную прогностическую модель своей среды. Это значит, что в его голове (в его навыках) заложены знания, которые позволяют ему предсказывать результат.😚Эта «модель» состоит из множества наблюдений и связей:😚😶🌫️Прогноз по толщине: Он смотрит на стейк и думает: "Ага, этот кусок толстый, ему понадобится больше времени, примерно по 5 минут на сторону".😚😶🌫️Прогноз по жару: Он подносит руку к грилю и чувствует жар. "Угли сегодня не очень горячие, значит, нужно держать мясо чуть дольше или опустить решетку ниже".😚😶🌫️Прогноз по звуку и виду: Он слышит шипение, видит, как образуется корочка, и по этим признакам предсказывает, что происходит внутри куска.😚😶🌫️Прогноз по упругости: Он нажимает на стейк пальцем или щипцами. По упругости мяса он может точно предсказать степень прожарки внутри, не разрезая его.Самое главное — эта модель неявная. Повар не решает в уме дифференциальные уравнения теплопередачи. Он просто знает, что если стейк упругий, как подушечка большого пальца, — это medium rare. Его опыт и навыки и есть эта встроенная, рабочая модель.😚Вывод и связь с теоремойОпытный повар (агент), чтобы быть способным к обобщению (готовить разные стейки в разных условиях), был вынужден изучить неявную прогностическую модель своей среды (понять, как толщина, жар и время влияют на прожарку).Он не просто реагирует, он предсказывает. Он заранее понимает, что если он оставит толстый стейк на 3 минуты, результат будет плохим. Именно это умение предсказывать на основе внутренней «карты мира» и делает его «хорошим регулятором».Точно так же любой сложный AI, будь то автопилот в машине или умный термостат в доме, чтобы эффективно работать в меняющихся условиях, должен не просто следовать инструкциям, а построить внутри себя модель своей среды и научиться предсказывать последствия своих действий.🎃😺😸😹😻
Оставить комментарий/отзыв