FirstVDS запустила vGPU на NVIDIA L40S: тест против физических карт — результаты удивляют

Новости

FirstVDS запустила vGPU на NVIDIA L40S: тест против физических карт — результаты удивляют

08-06-2026 12:40
0

Хостинг-провайдер FirstVDS представил новые тарифные планы с виртуальными GPU (vGPU), работающими на базе NVIDIA L40S. Теперь клиентам доступны два варианта: аренда целой физической видеокарты (эта опция появилась в ноябре 2025 года) либо получение гарантированной части ресурсов виртуального графического процессора.

Кроме того, компания провела сравнительное тестирование обеих технологий и обнародовала результаты: скорость инференса больших языковых моделей, производительность генерации видео и объем используемой видеопамяти.

В ассортименте представлены четыре тарифа vGPU — от 4 до 16 Гбайт видеопамяти. Технология vGPU разделяет физическую видеокарту на несколько профилей с фиксированным выделением ресурсов. Серверное оборудование базируется на виртуализации KVM с процессорами AMD EPYC. Цена начинается от 299 рублей в сутки.

Для сопоставления: тарифы с физическим GPU (Passthrough) стартуют от 1150 руб./сутки. В них предлагаются RTX 4090 и 5090, L4 и L40S — вся видеокарта целиком выделяется для одной виртуальной машины.

За последние полгода спрос на GPU-серверы увеличился многократно — главным образом из-за задач, связанных с LLM, созданием изображений и видео. Однако не каждому проекту требуется полная мощность физической карты. Разработчики, команды Data Science и небольшие студии часто ищут более бюджетный вход с предсказуемым распределением ресурсов. vGPU как раз удовлетворяет эту потребность.

Никита Попов, директор по продукту FirstVDS: «В ноябре мы решили задачу обеспечения сырой производительности, запустив GPU Passthrough. Но рынку нужна не только максимальная мощность, но и разумная юнит-экономика. vGPU заполняет именно эту нишу — снижает порог входа до 300 руб. в сутки. Мы провели бенчмарки. Прямое сравнение виртуальной машины с выделенной картой лишено смысла — физика дает о себе знать, чудес не бывает. Наша цель была иной: четко определить границы применимости. Продемонстрировать механику, при которой vGPU справляется с нагрузкой, и указать, где проходит черта, за которой необходимо полноценное оборудование».

Что показало тестирование

Компания проверила две конфигурации: GPU Passthrough (L40S, 48 Гбайт, 16 ядер CPU) и vGPU 16 Гбайт (8 ядер CPU). В тестах использовались инференс LLM через llama.cpp (модели Qwen 2.5 и 3.6) и генерация видео через ComfyUI с шаблоном Wan2.2 TI2V 5B Hybrid.

Результаты в целом ожидаемы: физическая карта закономерно превосходит виртуальные GPU по производительности. Однако выявились два важных момента.

Во-первых, в ходе тестирования моделей среднего размера (qwen2.5-14b в двух вариантах квантизации — q3_k_m и q4_0) на vGPU-16 и Passthrough выяснилось, что при полной загрузке модели в видеопамять скорость генерации токенов почти идентична. Различия проявляются только в смешанном режиме CPU+GPU (до 30–40 слоёв), где vGPU-16 ограничивается вдвое меньшим количеством ядер процессора.

Сравнение скорости генерации токенов (qwen2.5-14b) в зависимости от количества слоёв, загруженных в GPU. Passthrough vs vGPU 16 Гбайт

Во-вторых, более крупные модели (Qwen3.6-35B) не помещаются целиком в vGPU-16 — объёма памяти недостаточно, поэтому они функционируют исключительно в смешанном режиме CPU+GPU, что приводит к снижению скорости.

Генерация видео (ComfyUI) на vGPU-16 также возможна, но с определёнными ограничениями: пришлось отключить некоторые функции и добавить swap — в противном случае приложение аварийно завершало работу. Время генерации на vGPU-16, как и ожидалось, превышает показатели Passthrough (для 5-секундного ролика — 293 секунды против 144).

Таким образом, несмотря на общее превосходство физической карты, виртуальный GPU способен справляться с определёнными задачами — например, с инференсом средних языковых моделей при полной загрузке в видеопамять. Это делает vGPU разумным выбором, когда приоритетом является доступная цена. Для более ресурсоёмких сценариев (крупные модели, комфортная генерация видео без дополнительных настроек) производительности vGPU может оказаться недостаточно.

Подробные результаты тестирования — в отдельной статье.

О компании

FirstVDS — российский провайдер виртуальных серверов. В портфеле — готовые и гибкие конфигурации VPS/VDS: от высокопроизводительных CPU-серверов (линейка «CPU.Турбо 2.0» до 5,7 ГГц) до GPU-решений (Passthrough и vGPU). Также доступны S3-хранилище, домены, SSL и техподдержка 24/7. Дата-центры в Москве, Нидерландах и Казахстане. Более 20 лет на рынке.

Рекламный материал | АО «ИОТ» ИНН 7731399513 erid: F7NfYUJCUneVcwrqJZVL

Откуда информация: