Как сообщает издание The Information, OpenAI делает серьёзную ставку на технологии искусственного интеллекта в аудиосфере. Согласно полученным данным, за последние два месяца компания реорганизовала несколько команд инженеров, разработчиков продуктов и исследователей в единое подразделение. Цель — усовершенствовать существующие аудиомодели в рамках подготовки к запуску персонального гаджета, сфокусированного на разговорном ИИ. Ожидается, что это устройство поступит в продажу примерно через год.
Источник изображения: Mariia Shalabaieva/unsplash.com
Этот шаг, как отмечает TechCrunch, соответствует общему тренду в технологической отрасли, где аудио- или разговорный ИИ выходит на передний план. Умные колонки с голосовыми помощниками уже стали привычной частью интерьера более чем в трети американских домов. Компания Meta✴ недавно анонсировала для своих умных очков Ray-Ban новую функцию, которая с помощью массива из пяти микрофонов позволяет различать речь в шумной обстановке. Со своей стороны, Google в июне начала тестировать функцию аудиообзора, превращающую результаты поиска в краткие диалоговые сводки, а Tesla внедряет ИИ-чатбота Grok от xAI в свои электромобили, что позволит разговорному голосовому ассистенту управлять множеством функций — от навигации до климатической установки — посредством естественного диалога.
Однако не все подобные проекты оказываются успешными. Инициатива Humane по созданию умной броши AI Pin завершилась полным провалом. Кулон Friend AI с поддержкой ИИ, задуманный как цифровой собеседник для борьбы с одиночеством, вызвал опасения относительно конфиденциальности данных и, судя по всему, также не найдёт своего потребителя.
Внешние формы устройств могут варьироваться, но ключевая концепция остаётся неизменной: разговорный ИИ — это интерфейс завтрашнего дня. Новая аудиомодель от OpenAI, запуск которой намечен на начало 2026 года, по данным инсайдеров, будет обладать более естественным звучанием, делать уместные паузы, подобно живому собеседнику, и даже сможет говорить одновременно с пользователем — способность, недоступная современным ИИ-моделям.
Как утверждают источники, OpenAI намерена разработать целую линейку устройств, возможно, включающую умные очки или колонки без экрана. Они будут позиционироваться скорее как ИИ-компаньоны, а не просто как инструменты.