Запускайте ИИ-модели за минуты: платформа с поминутной оплатой и автоскейлингом | XSG.RU

Новости

Запускайте ИИ-модели за минуты: платформа с поминутной оплатой и автоскейлингом

22-04-2026 09:00
0

Поставщик облачных услуг «Турбо облако» (часть бизнес-направления «Ростелекома» в сфере IT) представил Inference Platform — сервис для запуска и управления моделями искусственного интеллекта, построенный на базе ускорителей NVIDIA H200 SXM с сетью InfiniBand.

Платформа работает с разными форматами ИИ-моделей, в том числе с открытыми. Клиенты имеют возможность загружать свои разработки или применять готовые контейнерные образы, запуская их в облаке без необходимости настраивать инфраструктуру. Сервис автоматически регулирует объём выделяемых мощностей (автоскейлинг) в соответствии с текущим спросом. Это помогает рациональнее использовать графические процессоры и сократить издержки при переменной нагрузке, отмечают в компании.

Сервис позволяет проводить распределённый инференс, давая возможность работать с моделями размером до 1 триллиона параметров, размещёнными на нескольких серверах. Также предусмотрена гибкая настройка GPU-ресурсов, вплоть до их разделения для менее ресурсоёмких задач. Дополнительный плюс — поминутная система расчётов, которая обеспечивает более детальный учёт затрат в сравнении с почасовой оплатой.

Источник изображения: Omar Lopez-Rincon / unsplash.com

Источник изображения: Omar Lopez-Rincon / unsplash.com

Сейчас новый сервис открыт для пилотного тестирования: организации могут опробовать его функционал на своих моделях ИИ.

Источник:

Поделиться:

Китайский гигант памяти YMTC удваивает мощности, несмотря на давление США

ПСБ признан лидером в борьбе с кибермошенничеством: победа в премии «Лучшие в антифроде»

0 Комментариев

Категории

Похожие новости

Популярные новости

product

Цифровизация промышленности: кейсы российских лидеров на CNews FORUM 2026

28/04/2026

Цифровизация промышленности: кейсы и опыт лидеров рынка на CNews FORUM 2026

02/05/2026

Топ-менеджеры российских компаний раскроют секреты цифровой трансформации на CNews FORUM Кейсы 2026

08/05/2026

Cyberbird запускает «вечный» кредит: как работает возобновляемая линия для бизнеса

14/05/2026

Ozon вступает в гонку с Китаем за дефицитные ИИ-серверы на Nvidia B300: цена достигла $1 млн

10/05/2026

Мест в «белых списках» сайтов больше нет: Минцифры признало лимит

06/05/2026

product

Цифровой паспорт здоровья: каждому россиянину создадут электронный медпрофиль к 2030 году

28/04/2026

product

CNews FORUM Кейсы 2026: Как ИТ-директора решают реальные проблемы бизнеса — встретимся лично

22/05/2026

ЕС ударил по «глазам» и «мозгам» российских дронов: под санкции попали разработчики БПЛА и ключевой поставщик электроники

06/05/2026

Telegram теряет корпоративный сектор: бизнес массово переходит на российские мессенджеры

04/05/2026

Популярные теги

Apple Google Microsoft NVIDIA OpenAI Samsung ИИ ИТ-инфраструктура Илон Маск Китай МТС МегаФон Россия США ЦОД автоматизация анонс безопасность дата выхода дата-центр дата-центры защита данных импортозамещение инвестиции информационная безопасность искусственный интеллект кибератаки кибербезопасность мобильная связь мобильный интернет модернизация сети обзор обновление полупроводники российское ПО скорость интернета телекоммуникации фишинг цена цифровая трансформация

Показать все теги