ИИтоги мая 2026: Искусственный интеллект ошибается, но не признаётся

Новости Hardware

ИИтоги мая 2026: Искусственный интеллект ошибается, но не признаётся

25-06-2026 00:01
0

Получив в качестве подсказки вопрос о том, является ли гипотеза Эрдёша (что максимальное число единичных расстояний между n точками на плоскости растёт чуть быстрее линейной функции) истинной, генеративная модель, направляемая сотрудниками OpenAI, опровергла это утверждение. Для некоторого фиксированного δ > 0, как выяснилось, всегда выполнено неравенство ν(n) ≥ n 1+δ, где ν(P) — число неупорядоченных пар единичных расстояний в конечном планарном множестве P (источник: Nature)

Когда генеративная модель, управляемая специалистами OpenAI, получила в качестве подсказки вопрос об истинности гипотезы Эрдёша (согласно которой максимальное количество единичных расстояний между n точками на плоскости возрастает лишь немного быстрее линейной функции), она опровергла данное утверждение. Как оказалось, для некоторого фиксированного δ > 0 всегда справедливо неравенство ν(n) ≥ n 1+δ, где ν(P) обозначает количество неупорядоченных пар единичных расстояний в конечном плоском множестве P (источник: Nature)

⇡#Надо только правильно спросить

Похоже, что поиск нестандартных подходов к самым сложным математическим задачам, позволяющий выйти за рамки традиционных методов, разработанных поколениями учёных, является настоящей сильной стороной генеративных моделей искусственного интеллекта. Меньше чем за месяц разработки OpenAI успешно справились с двумя задачами из широко известного в научном сообществе списка, составленного венгерским математиком Палом Эрдёшем (Paul Erdős), который к концу прошлого века собрал «свои самые любимые» нерешённые вопросы из комбинаторики, теории чисел и дискретной геометрии. На момент написания этой статьи из 1217 задач Эрдёша, представленных в онлайн-репозитории, было решено 550 (45%) — и вполне вероятно, что к моменту публикации «ИИтогов мая» это число возрастёт, в том числе благодаря активному использованию генеративных моделей.

В конце апреля издание Scientific American опубликовало заметку о том, как 23-летний энтузиаст Лиам Прайс (Liam Price), не имеющий профессионального математического образования, но оформивший подписку на ChatGPT Pro, сумел найти ответ для одной из задач Эрдёша, которая оставалась нерешённой почти шесть десятилетий. Прайс отправил GPT-5.4 Pro единственный запрос с описанием проблемы Эрдёша, связанной с особыми множествами целых чисел, где ни одно число не делится нацело на другое; такие множества называют «примитивными». Ещё в 1935 году сам Эрдёш ввёл понятие «суммы» для подобного множества (Erdős sum — которая вычисляется не простым сложением всех элементов, а несколько более сложным способом) и доказал, что эта величина всегда конечна для любого конечного примитивного множества, каким бы обширным оно ни было. В 1988 году тот же математик выдвинул гипотезу, что для всего множества простых чисел (бесконечного, как и сам натуральный ряд) сумма Эрдёша стремится к некоему конечному числу — примерно 1,6366; строгое доказательство этого предположения появилось только в 2022 году.

И вот Лиам Прайс, не зная, что задача уже решена профессионалом, изложил её ChatGPT — и получил некий результат, который затем передал знакомым математикам для проверки. Те подтвердили: решение не просто верное, но и нестандартное, то есть не заимствованное ИИ из тренировочного массива данных (куда материалы 2022 года вполне могли попасть — они ведь не секретные). Раньше все, кто пытался решить эту проблему, подходили к ней с определённых общепринятых и полностью логичных позиций, тогда как ИИ-бот начал свои рассуждения с формулы, хорошо известной в смежных областях математики, но ранее не применявшейся именно к изучению сумм Эрдёша. Да, GPT-5.4 Pro не выдала сразу математически безупречное доказательство, но зато указала математикам новый путь для размышлений — и те (включая самого Джареда Лихтмана, Jared Lichtman, автора «классического» подтверждения гипотезы Эрдёша 2022 года) довольно быстро довели решение до полноты и строгости. При этом они отметили, что ИИ «открыл для них новый способ думать о больших числах и их структуре», — вот вам, учёные кожаные мешки!

Прошло меньше месяца, и во второй половине мая стало известно, что модель OpenAI решила ещё одну задачу Эрдёша — на этот раз с почти 80-летней историей. Суть её можно описать так: возьмём произвольное множество точек на плоскости и соединим каждую пару отрезком. Длина некоторых из этих отрезков может совпадать с условной единицей. В 1946 году Эрдёш задался вопросом: каково максимальное количество пар точек с единичным расстоянием для любых возможных конфигураций из n точек? Пока n невелико, задача решается почти на лету: например, 9 точек, расположенных в вершинах правильного девятиугольника, дают 9 единичных пар, а если разместить их в узлах квадратной решётки 3×3, таких пар становится 12 — и это, видимо, предел. А что насчёт больших n? Вот тут-то и пригодился ИИ: раньше математики полагали, что решение следует искать среди равномерно упорядоченных структур, таких как квадратные сетки. Однако в OpenAI (на этот раз это достижение именно внутренней команды компании; как именно GPT строил своё доказательство, исследователи не разглашают, хотя окончательный результат его «рассуждений» уже независимо подтверждён) с помощью генеративного оракула выяснили, что здесь применимы методы алгебраической теории чисел, позволяющие выбирать точки с координатами, которые являются решениями определённых уравнений. Том Троттер (Tom Trotter) из Технологического института Джорджии в Атланте, ранее работавший в соавторстве с Эрдёшем, был искренне удивлён смелостью найденного машиной решения: «Если бы Эрдёш был жив, я уверен, он пришёл бы в восторг от этих выкладок». Вот вам ещё один урок, кожаные мешки, — учитесь правильно формулировать вопросы! И не жалуйтесь, если ИИ выдаёт бессмыслицу: правило GIGO (garbage in — garbage out) остаётся краеугольным камнем всей генеративной индустрии, без каких-либо исключений.

Над запросом о помощи в разработке финансового плана с целью приобрести дом неподалёку от нынешнего местопребывания пользователя в течение в ближайших пяти лет умный бот думал аж 27 секунд, причём все необходимые для оценки данные подтянул из Plaid и из истории общения с данным конкретным человеком самостоятельно. Какой риэлтор справился бы быстрее — и честнее? (Источник: OpenAI)

Интеллектуальный помощник потратил целых 27 секунд на обработку запроса о составлении финансового плана для покупки жилья рядом с текущим местом проживания пользователя в течение ближайших пяти лет. При этом все необходимые сведения он самостоятельно извлёк из Plaid и истории взаимодействия с этим конкретным человеком. Нашёлся бы хоть один риелтор, который справился бы быстрее и честнее? (Источник: OpenAI)

⇡#Просто не мешайте, человеки

Вполне действенный метод сократить объём «мусора на входе» (garbage in) генеративных моделей — ограничить влияние на них недобросовестных конечных пользователей ИИ-сервисов. Иными словами, обучение с прямым подкреплением в рамках текущего сеанса, учёт истории запросов, персонализация выдачи и прочие модные проявления интерактивности — это, безусловно, хорошо, однако существуют сферы, где всё это нейросетям, отлично разбирающимся в своём деле, совершенно не нужно. Возьмём, к примеру, обнаружение видео на YouTube, созданных с помощью ИИ; точнее, тех, что несут следы «значительного» применения нейросетевых моделей — пусть не для полной генерации роликов, а для их редактирования. И цель здесь благородная: гарантировать зрителям, что перед ними — кадры, снятые именно вживую, а в противном случае чётко указать на вмешательство ИИ. Другое дело, что ещё до того, как генеративные модели вышли на широкую сцену, кинематографисты придумали множество способов приукрашивать реальность, показываемую на экране, — от каскадёров и многочисленных дублей до комбинированных съёмок; достоверно распознавать профессиональное человеческое коварство на таком уровне машина (пока?) не в силах.

Однако видео — это лишь цветочки: в мае OpenAI объявила, что готовится предложить подписчикам ChatGPT Pro новую услугу, а именно — безопасное (разумеется!) подключение умного бота к банковским учётным записям пользователя через платформу Plaid, которая служит промежуточным звеном для связи тысяч финансовых учреждений с приложениями на клиентских устройствах. Как утверждают разработчики бота, услуга не будет восприниматься как навязанная: по их статистике, ежемесячно более 200 миллионов человек уже обращаются к ChatGPT за советом по личным финансам, передавая машине данные об остатках на своих счетах и другую конфиденциальную информацию.

«Отныне каждый сможет без риска привязать свои банковские счета к Plaid, получив благодаря мощным аналитическим инструментам OpenAI исчерпывающую картину собственных финансов — и всё это в привязке к личным целям, образу жизни и приоритетам, которыми пользователь уже поделился с ChatGPT», — сообщают создатели. Подписчики ChatGPT Pro из США (за 200 долл. в месяц) получат в окне чата доступ к детализированной истории трат, включая все активные подписки, с которыми вечно столько хлопот (и не только в Штатах). Кроме того, они смогут обратиться к боту-консультанту по финансовым вопросам за советом в принятии серьёзных решений — например, при покупке жилья или оформлении новой кредитной карты. Правда, хотя пользователям гарантируют полный контроль над данными, OpenAI оставляет за собой 30-дневный срок для окончательного удаления финансовой информации клиента, который дал такую команду, из своих систем. И разработчик совершенно точно заверяет, что ChatGPT не сможет вносить какие-либо изменения в банковские счета. По крайней мере, пока не возникнет общественный запрос на финансовые услуги такого рода: в конце концов, должным образом обученный генеративный ИИ наверняка окажется финансово грамотнее среднего человека, — и рано или поздно это станет очевидным для большинства. Так зачем же искусственно замедлять прогресс?

Установленная на сотовой вышке умная камера Pano AI — элемент комплексной системы мониторинга, включающей также спутниковые данные, датчики задымления и т. д. С 2020 года такие системы развёртываются в Австралии, Канаде и 17 штатах США, и только за 2025-й в Соединённых Штатах ими были оперативно обнаружены 725 лесных пожаров (источник: Associated Press)

⇡#Практическая польза

Время от времени в новостях проскальзывают истории о неудачливых владельцах криптовалютных кошельков, которые по разным причинам забыли свой пароль — и теперь кусают локти, глядя на текущий курс того же биткоина и понимая, что не могут превратить зашифрованный набор символов, имеющийся у них, в реальные деньги. Искусственный интеллект и здесь готов прийти на выручку: в мае бот Claude помог одному бедолаге, известному в X под ником cprkrn, снова получить доступ к кошельку с целыми пятью биткоинами — это почти 400 тыс. долларов по текущему курсу. Более десяти лет назад этот человек заблокировал свой программный криптокошелёк, находясь в состоянии добровольного помутнения рассудка (осуждаем!). Важно, что обошлось без перебора паролей: незадолго до обращения к боту пользователь сам нашёл в старой тетради прежнюю кодовую фразу, которую использовал при создании пароля, но с её помощью извлечь данные из закодированного файла — используя специально предназначенную для этого утилиту btcrecover и открытый ключ — не удалось. Тогда cprkrn просто загрузил все файлы со своего университетского компьютера в Claude, и тот обнаружил среди них резервную копию того же самого кошелька (с прежним, ещё не изменённым, паролем) от 2019 года — а заодно выявил дополнительную проблему, связанную с тем, как именно пользователь загружал данные в btcrecover. В итоге, введя кодовую фразу в нужном формате, пользователь наконец смог расшифровать закрытый ключ. Растроганный cprkrn пообещал в X назвать наследника в честь Дарио Амодеи (Dario Amodei), главы Anthropic. Хотя по-хорошему стоило бы выбрать имя Клод!

Когда же речь доходит до проверки надёжности программных продуктов, ИИ оказывается поистине непревзойдённым в скорости выявления действительно опасных уязвимостей. Всего за один месяц модель Claude Mythos Preview, доступ к которой по очевидным причинам строго ограничен, выявила в разнообразном программном обеспечении свыше 10 тысяч уязвимостей — в том числе две критически опасные ошибки в macOS, используя которые совместно, ИИ самостоятельно сформировал совершенно новый и крайне неприятный для специалистов по информационной безопасности вектор атаки. Особенно радует, что с каждым месяцем искусственный интеллект находит всё больше практических применений за пределами программной сферы. Например, он начал внимательно контролировать пожарную обстановку в обширных лесах Аризоны: установленные на вышках сотовой связи интеллектуальные камеры мгновенно фиксируют первые струйки дыма, поднимающиеся над кронами деревьев, что позволяет пожарным прибывать на место вовремя — ещё до того, как пламя охватит десятки и сотни гектаров заповедного леса, и его заметят люди. Компания Arizona Public Service уже эксплуатирует около 40 камер с искусственным интеллектом для обнаружения дыма — и намерена к концу текущего лета увеличить их количество до 71.

«Роко! Смотри, Роко! У меня пять пальцев на этой руке! А на плечевой сустав пока не смотри, он на следующем кадре получше вышел!» (источник: скриншот трейлера фильма Hell Grind с YouTube)

⇡#Четвёртым справа в кепке бот лежал

В мае на Каннском кинофестивале среди прочих (около)артхаусных работ показали едва ли не первый в мире полнометражный фильм (95 минут!), на четыре пятых созданный искусственным интеллектом. Эта доля рассчитана из вполне практических соображений: общий бюджет картины Hell Grind составил около полумиллиона долларов, тогда как на аренду компьютерных мощностей для её производства — в основном именно доступа к генеративной модели Google Veo 3 и ряду других умных инструментов — ушло порядка 400 тыс. долл. Проект Hell Grind интересен не столько сам по себе, сколько как пример масштабного использования ИИ в творческой работе: несколько недель его команда составляла подробные подсказки (в среднем по 3 тыс. слов в каждой — с детальнейшим описанием художественного стиля, освещения, типа камеры, визуальных эффектов и т. д.) и итерация за итерацией улучшала неудачные кадры. Безусловно, участие человека в съёмках по-прежнему остаётся очень важным: каждый запрос создавал лишь около 15 секунд видеоматериала, и на долю профессиональных режиссёра, оператора, сценариста, монтажёра приходилось составление из этих сцен цельного высокохудожественного (ну тут уж как получилось) визуального повествования. Серьёзной проблемой, кстати, было сохранить визуальные образы сгенерированных актёров на протяжении всего фильма, поскольку ИИ склонен допускать при повторной генерации лиц, фигур и одежды немалые вольности (character consistency problem). Отрадно, что создателям фильма удалось систематизировать свой опыт, создав инструмент — опять же на основе ИИ, — который переводит привычные для киношников сценарные заметки (с комментариями режиссёра и оператора) в набор детализированных запросов, позволяющих генеративной привлечённой модели выдавать серию видеороликов пригодного для последующей доработки качества.

Стоит подчеркнуть, что применение искусственного интеллекта сегодня считается вполне приемлемым не только в игровых, но и в документальных фильмах. На том же Каннском фестивале Стивен Содерберг представил ленту о последнем интервью Джона Леннона, которое легендарный участник The Beatles дал за несколько часов до своей смерти 8 декабря 1980 года. Аудиодорожка этого двухчасового фильма является подлинной, лишь с улучшенным качеством звука, однако визуальный ряд — пусть и всего на 10% — был создан большими языковыми моделями. Справедливости ради следует отметить, что ИИ использовался не для создания псевдодокументальных кадров самого Леннона, а для полуабстрактной визуализации философских идей, которые он, среди прочего, обсуждал в интервью. Однако, несмотря на то, что такие сгенерированные вставки почти не отличаются от классических спецэффектов, создаваемых вручную, Содерберг столкнулся с серьёзной критикой со стороны пуристов, утверждающих, что бездушной машине не место в священном храме искусства даже на пороге, не говоря уже о главном зале. В ответ режиссёр вполне разумно заметил: «Как узнать, где проходит граница, пока кто-то её не пересечёт?»

Многие эксперты сравнивают нынешнюю настороженность CEO в отношении ИИ с сорокалетней давности «парадоксом Солоу», сформулированного экономистом, Нобелевским лауреатом Робертом Солоу (Robert Solow): «Компьютерный век наступил, спору нет, его проявления объективно фиксируются повсюду — кроме разве что статистических отчётов по части производительности труда» (источник: Medium)

Вот переписанный HTML-контент на русском языке с сохранением всех тегов и смысла, но с изменёнными словами и структурой предложений:

⇡#Куда все бегут, не знаю, но отстать боюсь

Возможно, истерическое отторжение искусственного интеллекта объясняется не столько его текущими недостатками (которые во многих сферах фиксируются вполне объективно, что уж скрывать), сколько простым непониманием принципов его работы, границ применимости и возможностей развития? Аарон Леви (Aaron Levie), сооснователь и генеральный директор корпоративной облачной платформы для управления контентом Box (которая за два десятилетия выросла из студенческого проекта в серьёзную бизнес-структуру с более чем 180 тысячами корпоративных клиентов), прямо заявляет, что многие руководители сегодня страдают от «психоза ИИ» (suffering from AI psychosis). Суть этого нервного расстройства кроется в скрытом страхе перед слишком большим разрывом между той заманчивой перспективой, когда генеративные модели начнут приносить инвестировавшим в них компаниям колоссальные прибыли, и текущим положением дел, при котором и самим CEO, и их командам приходится усердно трудиться.