Новости

Дарвин, Гёдель и ИИ: эволюция вместо экстенсивного роста?

Примерно к середине 2025 года команда учёных из Колумбийского университета, получившая частичное финансирование от Агентства перспективных оборонных исследовательских проектов (DARPA — той самой организации, благодаря которой, в частности, появился интернет), создала «машины, способные увеличиваться за счёт использования других машин». Речь, разумеется, идёт не о буквальном переваривании, а скорее об интуитивной автоматической сборке: базовые цилиндрические роботы Truss Link, которые передвигаются благодаря выдвижным магнитным стержням на концах своих трубчатых корпусов, сначала беспорядочно носятся по поверхности, затем случайным образом соединяются друг с другом — и оказывается, что в виде упорядоченных структур (треугольников, затем тетраэдров и так далее) им энергетически выгоднее менять своё положение в пространстве как единому целому. «Поглотив» таким образом несколько исходных роботов — фактически собрав себя из них, — получившийся трансформер движется быстрее и элегантнее, чем раньше. Более того, этот механический вольвокс обрёл способность расти, восстанавливаться и приспосабливаться к окружающей среде — благодаря программному процессу, который его создатели назвали «роботизированным метаболизмом». Это прямой шаг по пути, проложенному биологической эволюцией: для живых существ умение адаптироваться является критерием выживания. Исследователи проводят параллель с аминокислотами: поедая другие организмы (и усваивая, в частности, те самые аминокислоты в процессе пищеварения) или напрямую встраивая в себя чужой генетический код, живые существа улучшают свою способность к адаптации. «В конечном счёте нам придётся обучить роботов делать то же самое — интегрировать в себя других роботов частично или полностью, — заявил Ход Липсон (Hod Lipson), директор Лаборатории креативного машиностроения при Колумбийском университете. — Только представьте себе безграничный творческий потенциал в мире, где ИИ сможет создавать физические конструкции из роботов с той же лёгкостью, с какой сегодня он составляет для вас электронные письма!»

 Трёхмерный робот в форме тетраэдра, к которому присоединилось дополнительное звено, использовал это самое звено в качестве опоры при спуске по наклонной плоскости — и преодолел эту трассу на 66,5% быстрее «чистого» тетраэдра, составленного из тех же элементов Truss Link (источник: Columbia University)

Объёмный робот, выполненный в виде тетраэдра, после присоединения дополнительного сегмента задействовал его как точку опоры при движении вниз по наклонной поверхности. В результате он прошёл этот маршрут на 66,5% быстрее, чем «чистый» тетраэдр, собранный из тех же компонентов Truss Link (источник: Columbia University)

Очевидно, что обучить цифровые сущности взаимодействию и развитию в виртуальной среде даже легче, чем в реальном мире. Главное — создать для них подходящую среду для обмена фрагментами (в данном случае исключительно информационными). В мае 2026 года стало известно о планах Linux Foundation изменить общепринятую сегодня распределённую открытую инфраструктуру системы доменных имён (DNS), чтобы упростить для ИИ-агентов поиск себе подобных в интернете. Вместо традиционного сканирования портов и обращения к человекочитаемым веб-страницам, что увеличивает нагрузку на сетевую инфраструктуру, агенты и серверы, использующие протокол контекста модели (MCP), в рамках предлагаемого проекта DNS-AID смогут применять DNS как глобальный и децентрализованный реестр взаимного доступа — своего рода телефонный справочник для прямых коммуникаций между ботами. В частности, DNS-AID предполагает создание специального адреса в формате _index._agents.{domain}, который станет отправной точкой для обращения агентов к веб-ресурсам, чтобы обнаруживать друг друга и налаживать взаимодействие. Это, в свою очередь, приведёт к дообучению агентных моделей, позволяя им приобретать свойства и возможности, изначально отсутствовавшие в их тренировочных данных.

И это лишь два относительно недавних примера того, как на практике реализуется идея внедрения эволюционного подхода в развитие генеративного искусственного интеллекта. Большие языковые модели (БЯМ) становятся настолько масштабными и сложными, что проектировать их дальнейшее совершенствование вручную с каждым годом всё труднее и дороже. Поэтому логично опереться на естественную эволюционную концепцию, в успешности которой — на собственном примере — у человечества нет причин сомневаться.

Типичная иллюстрация традиционного метода оптимизации модели ИИ: функция потерь показывает, насколько точными оказываются прогнозы, сделанные моделью. Во время тренировки корректирующий механизм (к примеру, метод обратного распространения ошибки) применяет градиент функции потерь по отношению к весам нейросети, чтобы изменить эти веса и снизить потери, что в итоге повышает эффективность модели на обучающей выборке. (источник: DataCamp)

Стандартная схема оптимизации ИИ-модели: функция потерь служит индикатором точности предсказаний, которые делает модель. В ходе обучения корректирующий алгоритм (такой как обратное распространение ошибки) использует градиент функции потерь по параметрам сети, чтобы подправить эти параметры и уменьшить потери, тем самым улучшая работу модели на имеющемся наборе данных (источник: DataCamp)

#Всё как у зверей

Как сегодня оценивают, насколько хорош или плох алгоритм ИИ (напомним, что машинное обучение по сути сводится к созданию внутри нейросети именно алгоритмов — пусть и неявно заданных, с трудом поддающихся интерпретации человеком; их можно называть статистическими процессами, основанными на данных)? Разумеется, существует множество специализированных тестов, сложных реальных задач (например, математических проблем Эрдёша), статистики практического применения в разных сферах и так далее. Однако наиболее общее представление о качестве работы нейросети даёт оценка того, насколько эффективно она минимизирует функцию потерь — математическое выражение, которое показывает, насколько прогнозы модели отличаются от желаемых результатов. Будет не большим преувеличением сказать, что алгоритмы, лежащие в основе современных больших языковых моделей, отбираются (не разработчиками вручную, конечно, а в процессе обучения модели) главным образом по критерию качества реализации традиционного градиентного спуска. Да, существуют и ограниченно применимые исключения — генетические алгоритмы, байесовская оптимизация, — но, поскольку обучение крупной универсальной нейросети сводится к поиску оптимумов функции в пространствах её параметров с очень высокой размерностью, градиентный спуск по-прежнему играет ключевую роль.

Нейроэволюционный метод — это практическое применение идей дарвиновской эволюции (наследственности и изменчивости под воздействием внешних условий) для улучшения алгоритмов ИИ — формально не требует полного отказа от градиентного спуска. Однако акцент переносится с совершенствования самого алгоритма на улучшение итоговых результатов, получаемых с его помощью; на оценку относительной эффективности БЯМ — которая может измеряться баллами по синтетическим тестам, количеством решённых за определённое время задач Эрдёша, снижением частоты галлюцинаций в ответах и так далее. Иначе говоря, на передний план выходит симуляция естественного отбора: алгоритмы ИИ, возникающие в ходе обучения модели, должны мутировать, а затем проходить отбор так же, как это происходит с живыми организмами в их естественной среде.

 Принцип работы машины Дарвина-Гёделя: слева — отдельный гёделевский «цифровой организм»; справа — группа таких «организмов», участвующих в дарвиновском отборе (источник: Sakana.ai)

Принцип работы машины Дарвина–Гёделя: слева — отдельный гёделевский «цифровой организм»; справа — группа таких «организмов», участвующих в дарвиновском отборе (источник: Sakana.ai)

С технической точки зрения реализация такой симуляции сводится к нескольким вполне понятным этапам:

  • запуск, при котором произвольным (это критично!) способом формируется совокупность разнородных потенциально скрещиваемых (с точки зрения дальнейшего объединения) ИИ-алгоритмов или даже целых готовых моделей;
  • проверка через тестирование каждой из созданных на предыдущем этапе моделей на определённой задаче (например, распознавание образов, прохождение видеоигры и т. д.), где существуют ясные численные показатели успешности выполнения;
  • селекция путём прямого сравнения моделей по числу баллов, набранных на втором этапе: модели, демонстрирующие наилучшие результаты, признаются «выжившими» и перемещаются на следующий уровень;
  • изменчивость и передача признаков: отобранные модели копируются с добавлением случайных вариаций (аналог биологических мутаций) и/или объединяются (скрещивание), создавая новое поколение —
  • пригодность которого снова оценивается в следующем цикле, полностью повторяющем только что завершённый.

На первый взгляд, звучит действительно просто — однако такие повторяющиеся циклы, которые в конечном счёте привели к появлению на Земле существ с достаточно развитым интеллектом, биологическим организмам пришлось воспроизводить на протяжении примерно 4,1 миллиарда лет. Хочется надеяться, что в виртуальной среде компьютерной памяти нейроэволюция будет продвигаться куда более обнадёживающими темпами, тем более что стартует она не с цифровых версий каких-нибудь архей и вирусов, а сразу с контура, имитирующего достаточно сложные мыслительные процессы.

 Динамическая схема функционирования машины Дарвина-Гёделя —  самосовершенствующегося агента-программиста, который переписывает свой собственный код для повышения производительности решаемых им задач. Он порождает потомков (child), интегрируя в них как различные улучшения, так и историю предыдущих модификаций — включая причины отказа от новшеств, если те выходили неудачными (источник: Sakana.ai)

Иллюстрация динамического принципа работы машины Дарвина–Гёделя — саморазвивающегося программного агента, который модифицирует собственный код для улучшения результатов при решении поставленных задач. Этот агент создаёт дочерние версии (child), встраивая в них как новые усовершенствования, так и историю всех предшествующих изменений, включая обоснования отказа от неудачных экспериментов (источник: Sakana.ai)

Для чего вообще необходима машинная нейроэволюция, если материальные издержки на конкурентное развитие множества моделей со схожими аппаратными требованиями окажутся колоссальными? Ответ кроется в той самой способности к изменениям под влиянием внешних условий, которую даёт дарвиновский метод. Абсолютное большинство современных больших языковых моделей остаются неизменными после завершения обучения и не могут самостоятельно совершенствоваться без вмешательства человека. Агентные архитектуры отчасти решают эту задачу, однако их фундаментом по-прежнему служат те же крупные модели с постоянными весовыми коэффициентами. Именно поэтому агенты, несмотря на всю свою очевидную гибкость (включая возможность оперативного, в реальном времени, дообучения), продолжают испытывать проблемы с галлюцинациями, «потерей памяти» при смене сессий и накоплением случайных ошибок, которые зачастую распространяются по многоступенчатым рабочим процессам. Специалисты, работающие в этой сфере, склонны рассматривать ИИ-агенты скорее как автоматизированные надстройки, которые неспособны компенсировать внутренние ограничения базовой языковой модели, а не как по-настоящему эволюционирующие, адекватно дообучаемые (и, что важно, фиксирующие в своей структуре доказавшие эффективность нововведения) нейросети.

Действительно революционным достижением в данной сфере может стать не так давно представленная, весной 2025 года, машина Дарвина–Гёделя, чьё название объединяет «отца теории эволюции» Чарльза Дарвина (Charles Darwin) и Курта Фридриха Гёделя (Kurt Friedrich Gödel), создателя знаменитой теоремы о неполноте, которого Эйнштейн назвал «величайшим логиком со времён Аристотеля». Напомним, что основным недостатком современных больших языковых моделей является их неспособность изменять собственную структуру. Речь идёт не о настройке отдельных весов, а о модификации самой конфигурации перцептронных слоёв и других рабочих компонентов нейросети — хотя технически это вполне осуществимо, ведь такая сеть в любом случае эмулируется в памяти сервера (или более простого компьютера, если речь о малых языковых моделях). Перспективный саморазвивающийся ИИ должен быть лишён этого ограничения, обладая способностью улучшать собственную архитектуру, адаптируясь к эффективному решению всё более сложных задач — точно так же, как живые организмы из поколения в поколение приспосабливаются к более успешному развитию (а точнее, к более эффективной передаче генетического кода, пусть и с изменениями, следующим поколениям) в своей среде обитания.

 Машина Дарвина-Гёделя итеративно формирует растущий архив агентов, используя принципы недетерминированного поиска (open-ended exploration). Новые агенты создаются и оцениваются не исходя из каких-то предварительных предположений о конкретном направлении их совершенствования, но путём чередования самомодификации с последующей оценкой результатов (источник: Sakana.ai)

Машина Дарвина–Гёделя итеративно формирует растущий архив агентов, используя принципы недетерминированного поиска (open-ended exploration). Новые агенты создаются и оцениваются не исходя из каких-то предварительных предположений о конкретном направлении их совершенствования, но путём чередования самомодификации с последующей оценкой результатов (источник: Sakana.ai)

#Настала пора задуматься

Ладно; с Дарвином всё ясно. Но при чём же здесь Гёдель? А суть в том, что — кроме биологической эволюции — существует ещё один весьма успешный механизм формирования исключительно сложных структур, причём нематериальных, напрямую связанных с нейросетями, которые воспроизводятся в компьютерной памяти. Речь идёт о научном способе познания мира, чья история, правда, короче дарвиновской (её начало обычно относят к Древней Греции; VI−IV века до н. э.), однако его результативность просто невероятна. Если с биологической точки зрения современный человек практически не отличается от кроманьонца, который пришёл в Европу 40−45 тысяч лет назад, то в плане образа жизни различия между этими двумя представителями одного вида Homo sapiens колоссальны — благодаря стремительным темпам социального развития, а за последние 2−3 тысячи лет — ещё и благодаря открытию того самого научного метода, а затем его успешному применению.

В научной сфере прогресс, под которым понимается накопление и расширение объективно подтверждённого знания о природных явлениях и процессах, осуществляется через выдвижение гипотез, их последующую проверку и использование предсказательной силы теорий (которые, по сути, поднимаются на новый уровень после подтверждения гипотез практикой) для дальнейшего движения вперёд. В то же время эволюция — снова обращаясь к Дарвину — улучшает биологические организмы (точнее, биологические виды; не случайно в названии главного труда этого учёного говорится о происхождении видов, а не отдельных существ) через изменчивость и отбор. Идея Дженни Чжан (Jenny Zhang) и её коллег из Университета Британской Колумбии и стартапа Sakana.ai, описанная в работе «Машина Дарвина–Гёделя: открытая эволюция самосовершенствующихся агентов», заключается в создании такого ИИ, который сможет динамически изменять (переписывать, да — ведь генерация программного кода большими языковыми моделями уже освоена если не идеально, то весьма уверенно) свою собственную структуру, тестировать её на реальных задачах, а затем тщательно дорабатывать собственный программный код. При этом ставится цель максимально устранить те моменты, которые омрачают образ современных больших языковых моделей: галлюцинации, уязвимость к атакам противника (adversarial attacks) и другие крайне досадные несовершенства. Несовершенства существуют и в живой природе, это верно, — но именно в этом проявляется очищающая сила дарвиновского отбора: из поколения в поколение выживают всё более приспособленные к своей среде организмы. ИИ с аналогичной динамикой развития будет полностью заслуживать названия саморазвивающегося.

 Самосовершенствование в сочетании с недетерминированным приобретением изменений позволяют DGM постоянно совершенствоваться, улучшая свои показатели. Всё более совершенные с каждым поколением агенты-программисты демонстрируют последовательно улучшающиеся результаты в тестах SWE-bench (слева) и Polyglot (справа). Они превосходят усечённые модели, в которых отсутствует либо самосовершенствование, либо open-ended exploration, что наглядно демонстрирует необходимость обои этих компонентов (источник: Sakana.ai)
Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории
Популярные новости