Когда дело доходит до моделей ИИ и крупных языков, многие из вариантов использования предприятия основаны на текстовом основании, будь то анализ данных или генерация текста. Но все чаще предприятия полагаются на генеративные медиа -платформы, такие как FAL.AI, для создания изображений, видео и аудио для своих маркетинговых кампаний, публикаций в социальных сетях и многого другого. Итак, для этого эпизода новых агентов стека мы с Алексом поговорили с Буркай Гур, генеральным директором и соучредителем FAL.AI и Гленна Соломона, управляющего партнера в известном Capital и ведущего инвестора в последнем раунде финансирования FAL.AI.
От инфраструктуры машинного обучения до генеративного ИИ
Сегодня FAL.AI занимает сотни моделей, включая видео -модели, такие как Wan Pro и Kling, а также модели изображений, такие как Flux и Audio Models из таких, как Minimax. Но, как выясняется, когда Гур (который ранее работал над машинным обучением в Coinbase) и его соучредители запустили FAL.AI в 2021 году, генеративные средства массовой информации даже не были сосредоточены. Вместо этого они пытались оптимизировать Python Times для ускорения моделей машинного обучения.
«Мы на самом деле думали, что многие действительно великие компании за последние пять лет, потом сосредоточились на вычислении и инфраструктуре», — сказал нам Гур. «Мы видели несколько великих людей, таких как Snowflake, DataDog. И мы подумали, что следующая большая тенденция произойдет в вычислительном обучении».
Находясь в Coinbase, GUR стало ясно, что инструменты и инфраструктура для машинного обучения в то время по сути не существуют, поэтому команда начала работать над этим. Но затем генеративный ИИ внезапно взлетел.
«Вскоре после того, как мы начали, все пространство просто изменилось, по сути, изменилось с выпуском Dall-E, Dall-E 2 и Chatgpt. И мы поняли, что этот серьезный сдвиг на рынке приведет к огромной нехватке. По сути, ключевое понимание, которое там должно было сделать с выводами, потому что в традиционном машинном обучении много моделей будет меньше, и вы все еще будут обучаться на самом деле.
Как скорость и оптимизация стали конкурентным преимуществом FAL.AI
Однако крупные новые модели нуждались в том, что мощность графического процессора была полезной, и в то же время пользовательская база для этих моделей будет намного шире, чем для более традиционных моделей машинного обучения.
Команда начала с моделей изображений и оптимизировала их как мог. «Мы очень одержимы тем, как мы оптимизируем эти модели? Как вы их запускаете более эффективно? И именно так мы вышли на этот рынок», — сказал Гур.
Сегодня инструмент, который ранее отсутствовал, значительно улучшился — часто с несколькими инструментами, конкурирующими друг с другом в одном пространстве. И команда FAL.AI быстро поняла, что простой оптимизация моделей не станет устойчивой бизнес -моделью в долгосрочной перспективе.
Как отметил Соломон, скорость важна, но это только часть общего уравнения. «Это довольно сложно, просто чтобы быть компанией по оптимизации», — сказал он. «Существует много оптимизации, которую FAL делает с моделями, которые они размещают. Но я думаю, что люди, с которыми мы разговаривали с обеих сторон, и где находится FAL — поставщики моделей, с одной стороны, и разработчиков, с другой — я думаю, что все стороны этого, действительно понимают ценность, которую FAL привносит на стол, который, как упоминал Буркей, большая часть этой скорости — это скорость. У вас есть скорость. Ваш клиент, который использует преимущества новейших и лучших моделей, и это обеспечивает отличный пользовательский опыт.
Здание для разработчиков и нетехнической аудитории
FAL.AI предлагает как веб -фронт, так и доступ к API к этим моделям, и оба имеют свое использование, отметил Буркай. «Одна из лучших вещей, которые мы сделали, и реквизиты для наших команд продуктов и инженеров,-это то, что мы создали продукт разработчика, но он также чрезвычайно легко использовать для разработчиков, когда они не развиваются, или не разработчики, когда они просто пытаются поиграть с моделью, экспериментируя с несколькими рабочими потоками, где они скрепляют несколько моделей-без ослабления разработчика и опыта технического фонда»,-сказал Бурки. «Оказывается, если вы создаете действительно, действительно хороший продукт для разработчиков, вы также создали хороший продукт для нетехнических людей-и эти определения сейчас меняются».
Что касается собственной инфраструктуры FAL.AI, то Беркай отметил, что даже сегодня, большая часть инфраструктуры, которую мы считаем само собой разумеющимся для создания веб-продуктов, еще не существует для рабочих нагрузок искусственного интеллекта. Вот почему FAL.AI создал свой собственный механизм вывода, но также и пользовательский CDN, например.
Стоимость творения против стоимости творчества
Трудно говорить о таких генеративных моделях ИИ, не становясь немного философскими, поэтому один из вопросов, которые у меня были для Буркая, было также о том, что, по его мнению, существование этих моделей означает для творчества, таких как фотографы и режиссеры. Буркай признал противоречие вокруг этого, но он также считает, что, хотя многие люди испытывали интуитивную реакцию на эти новые технологии несколько лет назад, который сейчас урегулировался.
«Я думаю, что люди как бы учатся жить с этим, и особенно художники, креативщики, на самом деле они используют эти вещи в качестве инструментов», — сказал он. «Один из действительно классных обраций, которые мой соучредитель Горкема [Yurtseven]В разговоре есть этот нюанс стоимости творчества по сравнению с стоимостью творения. И я думаю, что это ключевая вещь здесь, чтобы понять: эти модели действительно просто снижают стоимость создания с безумными суммами, как 100 000, миллион раз, вы знаете, в отличие от создания чего -либо с VFX или профессиональным видео, что угодно. Но стоимость творчества все еще высока. Вы могли бы даже утверждать, что стоимость творчества может даже увеличиться, потому что творение просто доступно и так повсеместно ».
Вы можете найти остальную часть нашего разговора, включая обсуждение общего рынка генеративных медиа, на YouTube и в нашем канале подкаста.
Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Прежде чем присоединиться к новому стеку в качестве старшего редактора для ИИ, Фредерик был редактором предприятия в TechCrunch, где он освещал все, от роста облака и самых ранних дней Kubernetes до появления квантовых вычислений …. Подробнее от Frederic Lardinois