Новости Software

ChatGPT, Gemini и Claude не сошлись в прогнозах: какие профессии убьет ИИ — ученые предупреждают о лженауке

Три языковые модели искусственного интеллекта — ChatGPT-5, Gemini 2.5 и Claude 4.5 — дали различные оценки того, какие профессии наиболее уязвимы перед автоматизацией с помощью ИИ. Эти разногласия ставят под сомнение достоверность так называемых индексов подверженности влиянию ИИ — числовых показателей, определяющих степень риска автоматизации для конкретной специальности. Именно на такие индексы полагаются политики и работодатели, принимая ключевые решения.

 Источник изображения: Nguyen Dang Hoang Nhu / unsplash.com

Источник изображения: Nguyen Dang Hoang Nhu / unsplash.com

К такому выводу пришли экономисты Мишель Инь (Michelle Yin) и Хоа Ву (Hoa Vu) из Северо-Западного университета (NU), а также Клаудия Персико (Claudia Persico) из Американского университета (AU). В своей предварительной научной работе исследователи попросили три модели ИИ определить, какие профессии наиболее подвержены влиянию искусственного интеллекта, и зачастую получали несовпадающие результаты. Claude присвоил профессии бухгалтера высокий уровень уязвимости, тогда как Gemini оценил его значительно ниже. Модели также разошлись в оценках уязвимости рекламных менеджеров и топ-менеджеров. ChatGPT и Gemini оказались наиболее согласованными друг с другом, но и их мнения расходились примерно в четверти случаев.

Часть расхождений объясняется различиями между самими моделями ИИ, однако экономисты выявили и другой фактор: на оценки влияло то, какие специалисты уже активно используют ИИ. Первопроходцы, такие как финансовые аналитики, активно работают с нейросетями, создавая тем самым больше данных для обучения будущих моделей. Это, в свою очередь, сказывается на том, как модели оценивают подобные профессии.

Индексы подверженности ИИ строятся тремя способами: вручную, когда эксперты оценивают, насколько ИИ ускоряет выполнение рабочих задач; с помощью опросов сотрудников, использующих ИИ-платформы; или с помощью самих больших языковых моделей (LLM). Ручные оценки могут быть весьма субъективными, а опросы отражают мнение пользователей лишь одной платформы и не обязательно представляют весь рынок труда. Тем не менее эти индексы широко применяются в аналитических записках, консалтинговых отчётах и докладах, подготовленных для обоснования политических решений.

Расхождения между разными версиями быстро развивающейся технологии сами по себе неудивительны. К тому же пока неясно, оценивают ли ИИ-модели подверженность автоматизации хуже или лучше, чем другие методы. Однако проблема, по словам авторов исследования, заключается в том, что некоторые политики и работодатели могут принимать такие оценки за чистую монету.

По мнению экономистов, исследователям стоит опираться на данные сразу нескольких ИИ-моделей, а не на одну, а также чётко обозначать степень неопределённости полученных результатов. В итоге, как они полагают, более надёжную информацию можно получить из опросов о реальном внедрении ИИ в экономику и о том, для решения каких задач его применяют. «Я бы лично не стала полагаться на какой-то один показатель, чтобы принять решение: „Мне нужно менять профессию“ или „Моему ребёнку нужно выбирать другую специальность“», — заявила Инь.

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории
Популярные новости