Мы достигли ключевого времени в разработке ИИ, и многие компании пытались захватить MindShare в правильном направлении для LLMS в кодировании. В прошлом году я оставался в значительной степени невнимательным в результате результата, пока не начал видеть завершение кода, завершив некоторые из моих методов, основанные исключительно на сигналах стандартной номенклатуры и прошлых моделей.
Но сегодня я вижу, что командная строка является лучшим местом для большинства взаимодействия LLM для большинства разработчиков. Я видел несколько предложений, которые доказывают смысл — из Claude Code от Antropic, Codex от AI, Google Gemini CLI и недавно Warp. Я посмотрю на немного другое направление, в виде Kiro.dev, на следующей неделе; Но на этой неделе я хочу посмотреть на то, что Зак Ллойд из Warp называет «средой агента развития».
Действительно, это, по -видимому, является агентской эрой, как свидетельствует использование кода Клода, растущее на 300%.
Производительность агента по заданию на www.tbench.AI
Как показывает диаграмма, существует множество хорошо сыгранных комбинаций моделей терминала и LLM. В то время как Claude Code с Opus 4 кажется наиболее полным пакетом, Warp слегка изменяет математику, предоставляя терминал, лучше подходящий для LLMS. С такими, как Terminal-Bench, представляющий хороший жгут оценки с набором задач, сейчас самое время экспериментировать и выяснить, что лучше всего соответствует вашим потребностям.
Задачи — инженерные
Но давайте отступим. Большинство рабочих мест для разработчиков представляют собой разнообразное сочетание инженерных задач и кодирования. Движение DevOps признало, что кодирование и поддержка инфраструктуры, вероятно, будут осуществляться одними и теми же людьми — или, если нет, людьми, работающими вместе с теми же целями производства. Но к ним подходят по -разному.
Разработчики всегда знали это, но кодирование никогда не было именно точно инженерной формой — это немного больше искусства, чем мы хотим признать. Да, может быть даже «атмосфера». Когда вы собираетесь ввести линию кода, всегда есть несколько вариантов, выражений или подходов. Вы оба следите за тем, что писали раньше, но, возможно, направляете код к немного другой будущей форме. Вы строите модель в своем уме во время печати. Вот почему многие разработчики по -прежнему ненавидят программирование пары — они любят отложить окончательность до последнего ответственного момента. Объясняя себя ранним заставляет вас открыть коробку и наблюдать за кошкой, прежде чем вы будете готовы покинуть суперпозицию.
CLI — это то, где мы выполняем определенные задачи. Есть один желательный результат, и, вероятно, один разумный способ достичь его.
И именно поэтому LLM так хороши в интерфейсе командной строки (CLI), потому что именно здесь я определенно занимаюсь инженером. CLI — это то, где мы выполняем определенные задачи. Есть один желательный результат, и, вероятно, один разумный способ достичь его. Например, если я внес изменения в код, мне нужно GIT для стадии, совершать и подтолкнуть их. Моим единственным реальным решением будет сообщение о коммите — и LLMS хорошо справляется с этим.
Внезапно возможность написать задачу на английском языке и выполнить его автоматически — или на определенных этапах с запросами на разрешение — обеспечивает измеримые сравнения с выполнением этого самостоятельно. LLM на самом деле просто отображает ваше заявление с списком существующих команд (и сценариев).
Когда LLMS преуспевает с задачами DEV?
При написании кода LLMS преуспевает в определенное время во время процесса. Это отличные шаблоны производственных машин. Даже если они просто получают правильный пример из Интернета и поместят его в правильном контексте в вашем проекте, это реальная, измеримая работа. И если это измеримо, мы можем понять, что мы получаем. Но их роль сильнее всего, прежде чем писать код, или при внесении изменений после того, как код будет в основном написан.
Когда вы используете IDE, быстрое завершение кода может быть полезным, но это также может просто мешать большую часть времени. Когда я не стесняюсь, это потому, что мой разум работает над кодом — я не жду, чтобы быть направленным. Прерывание часто может ощущаться как микроагрессия. Это, очевидно, улучшится со временем, но сейчас это не главное событие.
В работе в разработке гораздо больше, чем смотреть на код через редактора. Планирование, дизайн сети, развертывание, отладка и т. Д. Несмотря на то, что я не выступаю за разрешение LLMS писать тесты напрямую, они тоже могут это сделать. Запустить проект, попросив LLM в вашем CLI создать общую среду, и пример шаблона для вас великолепен. Попросив его внести изменения в вашей кодовой базе, как и в Google Jules, требует некоторых быстрых инженерных навыков. Но где сначала это не делает достаточно, просто попробуйте еще раз.
Большинство разработчиков будут использовать GIT для Backpedal, если он действительно делает беспорядок. И в большинстве случаев это ничем не отличается от того, чтобы позволить младшему разработчику разрабатывать кодовую базу, которая является одной из причин, по которой человеческое взаимодействие является еще одним навыком, которым разработчики должны обладать успешно выполнять свою работу.
Даже проклятое кодирование атмосфера — это стиль, который имеет свое место; Например, когда вы делаете Sprint Zero, Spitballing и хотите различить искусство возможного (возможно, с вашим менеджером). Записание того, что вы хотите видеть, при этом мало интересуется тому, как именно это достигается, имеет смысл в этих типах случаев.
Заключение
Один из моих любимых артистов — Олафур Элиассон. Его студия — это совместный центр с почти сто профессионалов, включая мастеров, техников, архитекторов и историков искусства. Однако он рассматривает искусство, он рассматривает его как коллективное усилие, когда члены команды играют свою роль в разработке и установке произведений искусства.
Установка Олафура Элиассона
Он понимает, как и мы, разработчики, должны, хотя искусство является продуктом одного человеческого разума, вокруг него много инженерии. Во что бы то ни стало, пусть IDE будет там, где вы позволяете своему коду течь, но сделайте CLI центром вашего Workbench LLM.
Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Дэвид был лондонским профессиональным разработчиком программного обеспечения в Oracle Corp. и British Telecom, а также консультантом, помогающим командам работать более гибким образом. Он написал книгу по дизайну пользовательского интерфейса и с тех пор пишет технические статьи …. Подробнее от Дэвида Истмана