Как Zencoder строит свои кодирующие агенты

После продажи своего стартапа управления проектами Rike частной инвестиционной компании, а затем Citrix, соучредитель и генеральный директор компании Эндрю Фалев, застрявший в течение нескольких лет, прежде чем уйти в конце 2023 года, чтобы найти новый стартап: для хорошего искусственного интеллекта. Миссия компании заключалась в том, чтобы объединить Frontier AI Research с практическими исследованиями и разработками «для создания решений, которые безопасно используют власть ИИ». Filev, однако, быстро понял, что небольшой стартап не будет конкурировать с такими, как Anpropic, Openai и Google, за фундаментальные исследования.

Первый продукт компании, платформа кодирования AI Zencoder.AI, однако, быстро нашла нишу на рынке для готовых к предприятию инструментов кодирования ИИ. Как и многие другие инструменты кодирования сегодня, Filev в конечном итоге использовал модели Claud в Antropic в основе своего продукта.

«Два десятилетия назад мой тезис в школе был вокруг автоматизированного рефакторинга, но, что более важно, как продукт в душе, я бы сказал, что только около 5% моих идей когда -либо были реализованы, даже когда я управлял компанией в качестве CEOM, поэтому я всегда хотел двигаться быстрее, и это все еще все еще дело», — сказал мне Файвв, когда я спросил его о том, как Зенкодер стал. «При управлении этой большой командой я увидел, сколько она была обычной работой. И вы не можете сказать, что это не важная работа, верно? Но это обычная работа.

Изображение предоставлено: Zencoder.

Он отметил, что в обстановке предприятия кодирование-это лишь небольшая часть работы разработчика, но многие из других повседневных процессов столь же рутинны и созрели для автоматизации. Когда он смотрел на пространство, когда думал о том, чтобы начать что -то новое, среди стартапов все еще было популярно покупать свои собственные графические процессоры и попытаться «сыграть в игру пограничной модели», как он выразился.

«Я думал, что уже есть антропные и другие игроки, поэтому я не чувствовал, что это хорошая область для меня, чтобы сосредоточиться, но с первого дня — и« агенты »были не такими популярными словами, как сегодня — было очень очевидно, что именно здесь вам нужно было взять LLM», — объяснил Файлв.

То, что необходимы эти агенты, отметил, что было доступ к правильному контексту, потому что каждый репозиторий кода отличается, и цикл обратной связи для проверки результатов. Проверка, по его словам, определяет надежность ИИ. «Если с помощью монеты я могу решить проблему для вас половину времени, это ненадежно. Но если я могу решить проблему в то же время 50% случаев, но я могу сказать вам, когда я решил, а когда нет, теперь я просто сохранил вам половину вашей работы», — объяснил он.

Традиционно модели из одной и той же семьи не очень хорошо критиковали друг друга, но Filev отметил, что с последним поколением моделей и, в частности, Claud Sonnet 4 и Opus 4, они стали намного лучше.

С этим фокусом Zencoder запустил продукт завершения кода, который использовал свои первые агентские конвейеры для проверки синтаксиса своего кода. Оттуда компания начала запускать больше агентов, которые могли бы обрабатывать все большее количество задач кодирования, таких как его агент по тестированию модуля, агент по рассмотрению кода, и, совсем недавно, пользовательские агенты, которые команды разработчиков могут изменить для решения своих конкретных проблем.

Он также отметил, что в первые дни современных LLMS многие думали, что было бы лучше научить их быть великолепными во всем.

Изображение предоставлено: Zencoder.

«Люди думали, что трансформаторы могут предложить всеобъемлющее понимание вселенной, где на самом деле вместо того, чтобы научить их быть калькулятором, вы даете им калькулятор»,-сказал он.

С запуском таких моделей, как Claude 3.5, Tool Calls, стал реальным вариантом, а затем с запуском протокола контекста модели, отрасль получила фактическую стандарт для этого. FileV утверждает, что есть еще сценарии, когда разработчики должны писать свои собственные интеграции для вызова инструментов, особенно когда речь идет о взаимодействиях с интерфейсом пользователя, но он также считает, что следующая область разработки будет во взаимодействии агента с агентом. И хотя некоторые люди могут утверждать, что вызов другому агенту не так отличается от вызова другого инструмента, FileV не покупает его, потому что в организации этих агентов есть разные проблемы.

FileV также отметил, что модельные критерии становятся все более удаленными от реальности их использования. По его словам, как только они проясняют определенный эталон, речь идет не о решении вопросов о абстрактных математических олимпиадах, а о решении реальных проблем. Модель, которая может быть хороша в кодировании и создании простой игры в Python, может быть, в конце концов, не сможет рефакторировать грязную кодовую базу Java.

Из -за этого Zencoder стремится создавать свои собственные инструменты оценки и часто сотрудничает с клиентами, чтобы сравнить, насколько хорошо работают новые модели.

Одна область, где Zencoder резко расходится с другими кодирующими агентами, заключается в том, что он является агностиком IDE, в то время как другие, такие как курсор и виндсурф, разделили IDE VS Code, чтобы построить свои агенты прямо в IDE.

«По мере того, как вы переходите от такого рода продуктов второго поколения, которые являются сегодня в моде, работая в IDE, к третьему поколению, где мы начали создавать лидерство и больше различий. Мы взяли тех агентов, которые вы используете каждый день в своей IDE, и первое, что мы сделали, это позволили вам упаковать их и поделиться ими в вашей организации, которые полезны для усыновления», — сказал Filev.

Усыновление, утверждает он, все еще в первые годы, особенно на предприятии. Хотя некоторые разработчики могут быть олл-ин и могут писать свои пользовательские инструкции для агентов, многие сотрудники едва царапают поверхность и в основном думают об ИИ как завершение кода.

Поскольку Zencoder позволяет пользователям создавать свои собственные агенты, компания также запустила каталог, где разработчики могут поделиться своими агентами.

Кредит изображения: новый стек.

Совсем недавно сам Zencoder запустил Zentester, его инструмент для тестирования всего, от пользовательского интерфейса до API службы. Опять же, компания делает ставку на модели Claude здесь. «В прошлом году антропическая модель использования компьютера, и это было захватывающе, потому что он был следующим уровнем по сравнению с предыдущими попытками с точки зрения эксплуатации графического интерфейса и веб-интерфейса»,-сказал Файлв. И хотя изначально эти модели не предназначались для того, чтобы помочь таким сервисам, как пользовательские интерфейсы Zencoder, оказывается, что они довольно хороши в этом, учитывая их внимание на навигации приложений.

«Эта способность проверить этот код чрезвычайно важна, потому что, если мы собираемся отправить в 10 раз больше кода, это означает, что мы собираемся протестировать в 10 раз больше кода — и это единственный способ к производственному коду. И чтобы сочетание кодирования и тестирования, я думаю, это удивительно: арахисовое масло и хлеб».

В течение долгого времени модели стали лучше в кодировании с каждым поколением. Алекс Альберт, глава по связям с разработчиками Антропика, сказал мне, что это было при запуске моделей Claude 3 чуть более года назад, где он видел, как Клод избил его по некоторым задачам кодирования.

«Вокруг [Claude] 3.7, мы запустили наши собственные продукты в кодировании, и мы начали видеть это тоже с нашими клиентами, так как они действительно поворачивали ручку вплоть на стороне агента, — сказал Альберт. — Я думаю, что Zencoder — отличный пример этого, в том смысле, что весь их продукт абстрагировал IDE в некотором смысле, и это просто агент по кодирую. Это очень совсем согласуется с тем, как мы видим, как кодирование движется в будущем, так как теперь вы больше координируете эти агенты по разработке программного обеспечения, работающие на вашей кодовой базе, а не вручную и вручную редактировать строки кода ».

Что касается антропного, конкурирующего с такими услугами, как сам Zencoder, Фейлв сказал, что он не беспокоится об этом, даже когда агент Claud Code Code в Antropic становится все более популярным среди разработчиков.

«Это было действительно, действительно сильное партнерство, где нам нравится, как дал нам Антропес — и, конечно, определенно сами модели. Еще одно виды связанных соображений заключается в том, что я чувствую, что нижняя часть этого рынка быстро коммодитизируется, поэтому тот факт, что Код Клода не обязательно меняет динамику рынка для нас», — сказал он.

Заглядывая в будущее, FileV считает, что по мере того, как модели становятся умнее, такие услуги, как Zencoder, смогут создавать все более сложные агентские трубопроводы, которые позволят разработчикам получить чашку кофе, в то время как агенты работают над проблемой и кодом возврата, который проверяется, проверяется и проверяется.

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Прежде чем присоединиться к новому стеку в качестве старшего редактора для ИИ, Фредерик был редактором предприятия в TechCrunch, где он освещал все, от роста облака и самых ранних дней Kubernetes до появления квантовых вычислений …. Подробнее от Frederic Lardinois

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *