LogicStar AI хочет автоматизировать отладку - It Новости. Конские Айти Вести

Ошибки в программном обеспечении — это огромные вредители, отнимающие время разработчиков и замедляющие циклы выпуска версий. Борис Паскалев, соучредитель и генеральный директор LogicStar AI, гоняется за ними уже много лет.

В 2017 году он основал DeepCode, а затем привел ее к приобретению Snyk в 2020 году, оставаясь в команде около трех лет, чтобы поддержать рост платформы. Семь лет спустя он присоединился к соучредителям Марку Никласу Мюллеру и Мартину Вечеву, чтобы сформировать компанию LogicStar, которая выглядит естественным продолжением своего предшественника. В то время как DeepCode стремился «выявлять ошибки до того, как они произойдут», LogicStar идет на шаг дальше, «не только выявляя проблемы — поскольку существует множество инструментов, которые могут это сделать», — отмечает Паскалев, — «но… автономно исследовать, воспроизводить, исправлять и проверять правильность исправлений еще до того, как в дело вмешается человек-инженер».

Закулисная отладка начинается с специфичных для приложения

LogicStar добивается высоких результатов: исправлены ошибки на девяносто процентов точности (т. е. то, чего, по словам Паскалева, люди могут достичь). Но если платформа выполнит свою работу, людям вообще не придется вмешиваться. Как он это описывает: «С точки зрения клиента ничего не происходит. Вы просто приходите, [and the] запрос на вытягивание готов».

Это потому, что LogicStar занят скрытой работой, отслеживая накопившиеся ошибки (например, системы оповещения, контроль качества, блокировки и т. д.), чтобы сопоставлять сигналы, анализировать код и предоставлять полностью проверенные исправления.

Предположим, например, что компания электронной коммерции получает жалобы на то, что налог не рассчитывается при оформлении заказа. Благодаря своему агенту по расследованию LogicStar может выявить и подтвердить проблему. Тем временем другие агенты приступают к работе над воспроизведением ошибки.

«На самом деле они пытаются создать небольшой фрагмент кода или скрипт, который говорит: «Если вы это выполните, в базе кода сработает эта конкретная ошибка», — объясняет Паскалев. Это подтверждает, что ошибка реальна и воспроизводима, а не разовая случайность. После этого LogicStar определяет лучшее исправление, запуская несколько возможных исправлений с помощью различных моделей и агентов.

Основа для этой настройки проверки личности начинается с регистрации.

«Когда мы впервые приступаем к работе над проектом, мы проводим очень глубокий статический и динамический анализ проекта», — говорит Паскалев. «Мы разбиваем это на части, чтобы у нас было внутреннее представление [of] …все важные модули приложения» (например, что делают модули, как они связаны и как они взаимодействуют друг с другом и с внешними приложениями).

Именно этот богатый контекст позволяет LogicStar с такой точностью выявлять и исправлять ошибки программного обеспечения. «Мы можем сказать магистрам права [large language models]«Проблема именно здесь. Вот последовательность событий, которая привела к этой конкретной проблеме — теперь попробуйте ее исправить», — говорит Паскалев.

Этот контекст также освобождает место для более дешевых запросов моделей.

Поскольку LogicStar может точно определить, как и где возникает ошибка, он может опрашивать меньшие, более дешевые и быстрые LLM, что не только снижает эксплуатационные расходы, но и увеличивает вероятность того, что будет найдено правильное исправление. Он даже может запускать несколько моделей одновременно для сравнения предлагаемых исправлений.

Меньше времени на исправление ошибок, больше времени на сборку — присмотр за детьми не требуется

Если LogicStar сможет эффективно взять на себя исправление ошибок, как заявляет Паскалев, разработчики могут рассчитывать на несколько последующих преимуществ.

Совершенно очевидно, что автоматическое исправление ошибок означает больше времени на выполнение таких задач, как сортировка, исследование и воспроизведение загруженных программ разработчиков. «Каждый час, потраченный на исправление ошибок… равен одному часу [of] возможность теряется при работе над новыми функциями — и обычно вы получаете 10-кратный множитель рентабельности инвестиций или ценности, созданной для создания новых функций, за которые клиенты будут платить», — добавляет Паскалев.

Он также отмечает, что LogicStar устраняет ложные срабатывания, проблему, которую, как он утверждает, на самом деле создают другие инструменты: «При наличии большого количества инструментов для поиска ошибок возникает большое количество ложных срабатываний.[s] … Вы должны определить: «Действительно ли я хочу это исправить?» Это действительно проблема? Или это просто ложное срабатывание?»

Но поскольку LogicStar воспроизводит и проверяет каждую проблему перед передачей ее инженерам, это значительно сокращает обычные рабочие процессы по поиску и исправлению ошибок, включая потерю времени на ложные срабатывания. Фактически, Паскалев говорит, что LogicStar может сократить жизненный цикл ошибок на 95%, что он объясняет полностью автономным рабочим процессом платформы.

Это заметное отличие от многих других инструментов, которые до сих пор требуют от разработчиков запачкать руки. «Что происходит в мире совместного развития… вы постоянно просите нужного человека в цикле сказать LLM: «Это правильно?» — объясняет Паскалев. «В нашем случае мы осуществляем передачу от человека».

Опять же, контекст является секретным оружием LogicStar. Благодаря анализу на этапе адаптации платформа может обеспечить рабочее понимание приложения и с высокой точностью выявлять ошибки.

Еще одна ключевая особенность, на которую указывает Паскалев, — это среда выполнения «песочница».

Еще до того, как исправление дойдет до разработчиков, LogicStar уже протестировал и утвердил несколько различных исправлений по отдельности, гарантируя, что только проверенные исправления дойдут до команды разработчиков. Платформа также может генерировать новые тесты (как для самого исправления, так и для связанных с ним частей приложения), чтобы предотвратить непреднамеренную поломку. Аналогично, он может идентифицировать и запускать соответствующие существующие тесты, чтобы выявить регрессии до того, как они произойдут.

«Большинство существующих инструментов требуют присутствия человека в цикле, а это означает, что человек должен проверить, существует ли проблема. [got] решено или нет; человек должен указать, какие тесты необходимо провести; или человек должен предоставить свою собственную среду выполнения», — говорит он.

Еще неизвестно, готовы ли разработчики передать бразды правления.

Но готовы ли разработчики работать по-настоящему без помощи рук?

Недавний поток якобы полностью автономных решений искусственного интеллекта начинает подавлять рынок — и разочаровывать пользователей, которые недовольны всеми этими чудесными продуктами, которые обещают слишком много и не выполняют поставленных задач.

«Люди настроены скептически? Да», — говорит Паскалев. «Они были сожжены [the] чрезвычайно большое количество инструментов, которые представляют собой, как мы их называем, тонкие оболочки вокруг больших языковых моделей, [where] по сути, вы устанавливаете красивый пользовательский интерфейс, публикуете модель и надеетесь, что получите что-то полезное».

Он откровенен в своем презрении к этим дешевым инструментам, которые «просто тратят время» — и он не одинок. Когда дело доходит до ИИ в программировании, энтузиазм угасает, а недоверие растёт. В опросе разработчиков Stack Overflow за 2025 год позитивные настроения в отношении инструментов искусственного интеллекта упали с 70%+ в 2023 и 2024 годах до всего лишь 60%. Отчет также показывает, что больше разработчиков активно не доверяют (46%), чем доверяют (33%) точности инструментов искусственного интеллекта.

Стрельба с точностью, готовой к производству

Несмотря на оговорки, разработчики, возможно, будут более готовы доверять ИИ, если он пообещает взять на себя поиск и исправление ошибок — то, что Паскалев называет «самой ненавистной частью, которую разработчик[s] приходится делать в своей повседневной работе».

Он утверждает, что своими глазами видел изменение настроения, когда команды отправляют свои первые запросы на включение с помощью LogicStar: «Мы определенно видим этот вау-эффект… Более чем в 95% случаев это [the bug-fix] просто полностью автоматизирован и ушел».

Судя по всему, LogicStar даже внутренне создает вау-эффект.

«Всего год назад мы думали: «Можем ли мы достичь 5% [bug coverage]?’ Тогда… мы видим 10–20%. А сейчас, за последние пару недель, мы увидели 40%», — говорит Паскалев.

Он связывает этот впечатляющий прогресс с улучшением агентов, более глубоким анализом и усовершенствованными инструментами. А поскольку LogicStar не зависит от модели, он предсказывает еще больший выигрыш по мере дальнейшего совершенствования моделей.

Улучшения, по его словам, во многом будут связаны с растущей специализацией моделей, поскольку большие, обобщенные LLM уступают место более мелким, более целенаправленным моделям, которые обучены для конкретных задач и которые заметно проще, быстрее и дешевле запускать.

В конце концов, цель состоит в том, чтобы достичь точки, когда LogicStar не просто передаст людям готовое исправление; это доходит до того, что исправления вносятся непосредственно в производство.

LogicStar намерена реализовать это желание разработчика.

ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Мередит Шубель — технический писатель, освещающий облачную инфраструктуру и корпоративное программное обеспечение. С 2022 года она сотрудничает с The New Stack, рассказывая о стартапах и изучая, как организации внедряют новые технологии. Помимо The New Stack, она пишет официальные документы, подписи руководителей и т. д. Подробнее от Мередит Шубель

Разработка сайтов в Гомеле

Добавить комментарий Отменить ответ

Похожие записи

10 серверов MCP для разработчиков фронта

Canonical расширяет поддержку дистрибуции Kubernetes на дюжину лет

MCP Security Risk Multiply с каждым новым соединением агента

Graalvm (наконец) получает Java для webassembly

Охрана искусственного интеллекта требует лучшей инфраструктуры, а не больше инструментов

Для разработчиков решение проблемы искусственного интеллекта скрывается на виду

Ваш конвейер CI/CD не готов к отправке агентов ИИ

Предупреждающая история о войнах браузеров и о том, почему бизнес -трансформации часто терпят неудачу

Postgres + ClickHouse: стек OSS для управления масштабированием агентного ИИ

Ускоренный курс этики агентного ИИ: автономия против доверия

Тестирование на песочницу: Devex-изменение игры для микросервисов

Рамалама проект объединяет контейнеры и ИИ

Вам тоже может быть интересно:

Агенты ИИ для стартапа электронной коммерции, основанные Google и DeepMind, выводят семена 10 миллионов долларов США.

Финансирование для женщин, основанных на женщинах, снизилось на 12% в 2024 году, но это было не далеко позади более широкого рынка

Законодатели США призывают британский шпионский суд провести секретное слушание Apple «Бэкдор» на публике

Openai, как сообщается, планирует взимать до 20 000 долларов в месяц для специализированных «агентов»

Xbox дебютирует с новым игровым компаньоном для мобильных устройств для мобильных пользователей

Гигант здравоохранения Великобритании HCRG подтверждает взломать после того, как банда вымогателей претендует на кражу конфиденциальных данных

Простая тяга в 15 миллионов долларов США для Agregate B2B Customers Catts в одну платформу

CHATGPT на MacOS теперь может напрямую редактировать код

X удваивает цены на премию+ планы после того, как XAI выпускает Grok 3

Империя стартапа Openai: компании, поддержанные венчурным фондом

Discord обсуждает IPO

Как удалить Facebook, Instagram и Threads