Новости Software

Gemini от Google создает музыку по вашим словам и картинкам

Бета-тестирование модели Lyria 3, разработанной в лаборатории DeepMind компании Google, дало возможность пользователям чат-бота Gemini сочинять 30-секундные музыкальные отрывки, используя текстовые подсказки, картинки или видео, и всё это — прямо в интерфейсе самого бота.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Начиная с этой недели, данный музыкальный генератор стал доступен глобальной аудитории Google. На старте система понимает запросы и выдаёт результат на английском, немецком, испанском, французском, японском, корейском, португальском языках, а также на хинди. В описании можно указывать жанры музыки, желаемое настроение или типичные бытовые сценарии. Сервис способен создавать как инструментальные мелодии, так и песни с вокалом на предоставленный пользователем текст. Чтобы точнее передать атмосферу, к текстовому запросу можно добавлять фото- или видеоматериалы.

Google отмечает, что эта технология задумана не для производства высокого искусства, а скорее для развлечения и творческого самовыражения. Для удобного распространения созданных 30-секундных треков Google будет автоматически генерировать для них обложки с помощью Nano Banana. Эти композиции также можно будет применять в связке с инструментом Dream Track, позволяющим добавлять музыку независимых авторов к коротким видео в YouTube. Учитывая прошлый опыт с ИИ-генерацией музыки, в модель Lyria 3 были встроены защитные механизмы, предотвращающие прямое копирование чужих произведений или имитацию голосов конкретных исполнителей. Lyria существует с 2023 года, но ранее была доступна лишь в рамках облачной платформы Google Vertex. Встраивание этих функций в Google Gemini делает музыкальный генератор более массовым, однако в этой области компания пока отстаёт от многих конкурентов, таких как TikTok и Microsoft.

Поделиться:

0 Комментариев

Оставить комментарий

Обязательные поля помечены *
Ваш комментарий *
Категории