Новости

Gartner: запуск ИИ подешевеет в 10 раз, но за умный ИИ придется платить

Согласно прогнозу аналитической компании Gartner, к 2030 году затраты на инференс крупных языковых моделей с триллионом параметров для поставщиков ИИ-услуг сократятся более чем на 90% по сравнению с уровнем 2025 года. Однако это не приведёт к повсеместной доступности высокопроизводительных вычислений.

В исследовании Gartner стоимость каждого токена оценивается в 3,5 байта, что примерно эквивалентно четырём символам английского текста. Специалисты полагают, что снижение издержек станет следствием нескольких факторов: роста эффективности специализированных ИИ-чипов и поддерживающей инфраструктуры, прогресса в архитектуре моделей, оптимизации использования процессоров, внедрения специализированных ускорителей для инференса, а также развития периферийных вычислений для конкретных применений.

Как ожидается, к 2030 году крупные языковые модели станут в 100 раз более рентабельными по сравнению с первыми моделями сопоставимого размера, появившимися в 2022 году. По расчётам Gartner, эксплуатация моделей на современном ИИ-оборудовании будет предсказуемо намного дешевле, чем на устаревших или гибридных системах, использующих более доступные, но менее мощные полупроводники. Об этом, например, неоднократно упоминает NVIDIA.

 Источник изображения: Gartner

Источник изображения: Gartner

Тем не менее, удешевление токенов не сделает передовые технологии доступными для всех. Во-первых, сокращение издержек для провайдеров ИИ не обязательно приведёт к пропорциональному снижению цен для корпоративных заказчиков. Кроме того, современным ИИ-системам потребуется значительно больше токенов, чем сегодня. Например, автономные ИИ-агенты используют на одну задачу в 5–30 раз больше токенов, чем обычный чат-бот, и способны решать гораздо больше задач, чем человек, применяющий ИИ-инструменты.

Несмотря на расширение функциональности искусственного интеллекта, это приведёт к «непропорционально высокому» увеличению потребности в токенах. Их расход растёт опережающими темпами по сравнению со снижением цены, что, как ожидается, повысит расходы на выполнение выводов моделями. Акцентируется, что это не означает доступность передовых вычислительных мощностей для всех. Цена на «базовые» ИИ-решения действительно продолжит снижаться, однако ресурсы, требуемые для сложных проектов с искусственным интеллектом, останутся ограниченными. Руководителям ИИ-проектов, которые сейчас скрывают недостатки своих архитектур за счёт удешевления токенов, в будущем предстоит столкнуться с проблемами при масштабировании вычислений для ИИ-агентов.

Согласно прогнозам Gartner, наибольший спрос получат платформы, способные управлять рабочими нагрузками, распределяемыми среди целого набора моделей. Например, рутинные операции следует делегировать компактным, узкоспециализированным ИИ-моделям, которые эффективнее и экономичнее справляются с конкретными задачами по сравнению с универсальными аналогами. Дорогостоящие же ресурсы продвинутых моделей необходимо использовать избирательно, строго ограничивая их применение и выделяя исключительно для сложных, но высокоприбыльных операций вывода.

Источник:

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории