Платформа записи и редактирования подкастов Odcastle в настоящее время присоединяется к другим компаниям в гонке с AI-мощностью, текстом-речь, выпустив свою собственную модель ИИ под названием Asyncflow v1.0. API для разработчиков также будет доступен, что позволит им напрямую интегрировать модель текста в речь в своих приложениях.
Благодаря новой модели компания может предложить более 450 голосов AI, которые могут рассказать ваш текст. Стартап сказал, что он разработал технологию и модель таким образом, что его затраты на обучение и вывод низкие, что дает ей преимущество для конкурентов.
С этим шагом подкаст присоединяется к ряду стартапов, включая ElevenLabs, Speeringify и WellSaid, которые разработали технологии и модели искусственного интеллекта для преобразования любого вида текста в голосовой клип, рассказанный AI. Эта технология охватывает использование, таких как маркетинг, реклама, создание контента, образование и корпоративное обучение.
Основатель Podcastle, Arto Yeritsyan, сказал TechCrunch, что компания всегда хотела создать модель текста в речь, но стоимость обучения и требований к данным для этого была очень высокой.
«Мы хотели создать надежную модель текста в речь с момента нашего создания. Тем не менее, затраты на развитие были очень высокими. Благодаря недавним разработкам крупных языковых моделей мы смогли достичь прорыва в прошлом году, чтобы добраться до места, где мы могли бы построить высококачественную голосовую модель, не нуждаясь в тонне данных »,-сказал Ерицьян.
Компании также помогли в своих усилиях с помощью сбора средств серии А в прошлом году.
Ерицьян сказал, что, хотя подкаст взимает около 40 долларов сша за 500 минут конверсии текста в речь, ElevenLabs взимает 99 долларов за то же самое.
Функция голосового клонирования подкаста также получает обновление, чтобы создать более быстрый процесс для обучения.
Ранее в процессе обучения включалось чтение примерно 70 различных предложений. Теперь от вас нужно просто несколько секунд записи, чтобы создать клон вашего голоса. Новый процесс также использовал AI Podcastle Magic Dust Dust, который был выпущен в прошлом году, для улучшения качества записи звука.
Кредиты изображения: подкаст
В нашем тестировании голос, созданный с новым процессом, звучал немного роботизированным, хотя он имитировал наш тон. Компания сказала, что со временем это улучшит эту функцию. Кроме того, вы можете обучить разные образцы своего голоса, чтобы получить разные результаты.
Подкасл сказал, что, помимо затрат, наличие инструментов для аудио, видео, подкастов и повествования, основанных на искусственном интеллекте под одним переработанным сайтом, даст ему преимущество над конкурентами. Ерицьян сказал, что, хотя большинство пользователей используют подкаст для работы над аудиоконтентом, видео также догоняет его.