Новости

Nebius запускает «Фабрику токенов» для запуска открытых ИИ-моделей

Компания Nebius (ранее выступавшая как головная организация «Яндекса») анонсировала платформу Nebius Token Factory для выполнения AI-выводов: она даёт возможность запускать и настраивать открытые и адаптированные модели искусственного интеллекта в промышленных масштабах, гарантируя высокую надёжность и требуемый уровень контроля.

По словам Nebius, использование проприетарных AI-моделей часто сопряжено с проблемами при расширении. В то же время открытые и настроенные модели помогают снять эти барьеры, однако их администрирование и защита по-прежнему требуют значительных технических усилий и ресурсов для многих коллективов. Nebius Token Factory разработана для устранения текущих сложностей: она объединяет адаптивность открытых решений с управляемостью, скоростью работы и рентабельностью, которые нужны компаниям для внедрения крупных AI-инициатив.

В основе Nebius Token Factory лежит многоуровневая AI-инфраструктура Nebius. Данная платформа интегрирует скоростной инференс, дообучение моделей и регулирование прав доступа. Предусмотрена работа с более чем 40 открытыми моделями, среди которых — актуальные релизы Deep Seek, Llama, OpenAI и Qwen.

 Источник изображения: Nebius

Источник изображения: Nebius

К основным достоинствам Nebius Token Factory относят соответствие стандартам корпоративной защиты (HIPAA, ISO 27001 и ISO 27799), стабильную задержку (ниже 1 секунды), автономное масштабирование пропускной способности и уровень доступности 99,9 %. Вычисления производятся в дата-центрах Европы и США без хранения информации на серверах Nebius. Используется облачная среда Nebius AI Cloud 3.0 Aether, что, по заверениям, даёт безопасность корпоративного класса, упреждающий контроль и устойчивую эффективность.

Отмечается, что Nebius Token Factory способен решать разнообразные задачи в области искусственного интеллекта: от умных чат-ботов, ассистентов по программированию и генерации с расширенным поиском (RAG) до скоростного поиска, обработки документов и автоматизированного клиентского сервиса. Встроенные средства точной настройки и сжатия моделей дают возможность предприятиям приспосабливать крупные открытые модели под свои информационные массивы. Это позволяет снизить расходы на вывод моделей до 70%. Оптимизированные версии моделей затем можно оперативно запускать без необходимости ручной конфигурации инфраструктуры.

Первоисточник:

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории