Большая часть внимания в генеративном ИИ до сих пор была на текстовых интерфейсах, используемых для генерации текста, изображений и многого другого. Следующая волна кажется голосом, и она быстро катится. В последней разработке Google сегодня объявила, что будет добавлять CHIRP 3 — свой голосовой интерфейс HD — к своей платформе разработки AI Vertex, начиная на следующей неделе.
На прошлой неделе Google тихо объявил, что CHIRP 3 будет развернуть 8 новых голосов для 31 языка. Варианты использования для платформы включают в себя создание голосовых помощников, создание аудиокниг, разработку агентов поддержки и голосовых видео для видео. Эта новость была объявлена на мероприятии в офисах Google DeepMind в Лондоне.
Его усилия приходят одновременно, что другие также прыгают вперед со своей работой. На прошлой неделе Sesame — стартап, стоящий за вирусными, очень реалистичными звучащими приложениями «Maya» и «Miles» — Miles » — объявил о запуске своей модели для разработчиков, чтобы создать свои настраиваемые приложения и услуги поверх своей технологии.
Примечательно, что вокруг CHIRP 3 будут ограничения на использование, чтобы попытаться сохранить обработку неправильного использования. «Мы просто работаем над некоторыми из этих вещей с нашей командой по безопасности», — сказал Томас Куриан, генеральный директор Google Cloud, на новостном мероприятии.
ElevenLabs является одним из основных стартапов, которые собрали сотни миллионов финансирования, чтобы расширить свою работу в службах Voice AI.
Новости принесут ChiRP 3 в ту же конюшню, что и более новые версии его флагманского LLM, Gemini, которые протестируются, а также его модель генерации изображений Imagen и его дорогой инструмент генерации Veo 2.
Можно утверждать, будет ли то, что Google выпускает с CHIRP 3 таким же «реалистичным», как и некоторые другие усилия по искусственному искусству по созданию «человеческих» голосов (в частности, работа SESAME выделяется). Но, как подчеркнул Демис Хассабис, генеральный директор DeepMind, это остается марафоном, а не спринтом.
«В ближайшем будущем… эта идея, что [AI is] Серебряная пуля для всего в ближайшие пару лет, я пока не вижу, чтобы это происходило. Думаю, мы все еще довольно много, в нескольких годах от чего -то вроде AGI », — сказал он. «Это изменит вещи… в течение следующего десятилетия, так что средний и долгосрочный. Это один из тех интересных моментов времени ».
Google запустил Vertex AI еще в 2021 году в качестве платформы для разработчиков для создания услуг машинного обучения в облаке. Это было, конечно, задолго до взрыва интереса к ИИ и, в частности, генеративного искусственного интеллекта, который пришел с запуском услуг GPT Openai.
С тех пор компания частично опирается на AI Vertex AI, поскольку она играет в догоняюще для других компаний, таких как Microsoft и Amazon Building Generative AI Tooling для разработчиков. В дополнение к созданию генеративного ИИ в дополнение к Близнецам, разработчики могут использовать AI Vertex AI для классификации данных, моделей поезда и настройки моделей поездов для производства. Будет интересно, движется ли он, чтобы расширить свой стеновый сад на модели, помимо тех, которые созданы самим Google.
Google в течение многих лет создает голосовые услуги «ChiRP», возвращаясь к использованию названия в качестве кодового названия для своих ранних усилий по конкуренции с сервисом Amazon Alexa.