Генай заменяет вашу команду QA? Отрезвляющая проверка реальности

Шумиха вокруг генеративного ИИ (геная) оглушает, особенно в жизненном цикле разработки программного обеспечения (SDLC) и обеспечении качества (QA). Продавцы являются многообещающими революционными изменениями, заявив, что агенты искусственного интеллекта заменит целые команды. Но, как разработчики и технические лидеры, мы должны подходить к этой волне со здоровой дозой прагматизма, сосредоточив внимание на укреплении доверия и поиске реальной ценности, а не в гонянии над циклами ажиотажа, которые часто оказываются в качестве дорогого шельфа.

Давайте будем честными: несмотря на удивительные демонстрации, Genai не изменил основные процессы QA, такие как генерация тестовых случаев, управление данными тестирования, сортировка ошибок или поддержание сценариев — по крайней мере, пока. Многие инструменты превосходят, борясь с неотъемлемыми проблемами LLM, такими как галлюцинации и не определенные результаты. Это не незначительные ошибки; Они демонстрируют надежные регрессионные тестирование, особенно в регулируемых средах. Любой, кто утверждает, что их инструмент может полностью заменить человеческие тестеры сегодня, откровенно говоря, продажа змеиного масла.

Последний цикл шумиха вокруг агентского искусственного интеллекта установил пузырь на новые пенистые высоты, обещая все больше функциональности, не признавая, что агенты ничего не меняют в отношении фундаментальных ограничений LLMS. Если LLM — это все равно, что разговаривать с малышом, которому принадлежит энциклопедия, агент искусственного интеллекта эффективно дает этот малыш доступ ко всему инструментам (включая бензопилу и витфорку). Модное слово гипнотическое, и возможности крутые, но протоколы настолько новы, что вокруг безопасности нет даже базовых защит.

Когда дело доходит до интеграции любых новых технологий, особенно в том, что она меняет игру, как Genai, доверие является ключевым, особенно с командами QA, которые по своей природе скептически относятся (это их работа!). Отказ от их опасений или игнорирование ограничений текущих инструментов ИИ будет иметь неприятные последствия и разрушать доверие. Вместо этого будьте искренне о рисках, преимуществах и слабостях. Признайте известные проблемы с LLMS и дайте вашим командам свободу изучения, экспериментировать и выяснить, как работать с этими мощными, но ошибочными инструментами. Дайте им агентство в определении их отношений с ИИ.

Строительство доверия: основа для интеграции искусственного интеллекта

Строительство доверия также требует строгих этических руководящих принципов. Работа номер один: не используйте данные клиента в запросах для облачных LLMS, если вы не уделяются этим работодателем. Данные клиента защищены очень конкретными условиями, а крупные поставщики ИИ считаются сторонними субпроцессорами (которые необходимо раскрыть). Риски воздействия данных и неточного, галлюцинированное понимание слишком высоки. Сгенерировать тестовые данные на заказ (возможно, с использованием LLM, управляемой схемой) или вместо этого используйте тщательно анонимные данные (в соответствии с тщательным обзором). Публикуйте четкую политику использования ИИ, поддерживайте утвержденный список инструментов и подпроцессоров и обеспечивайте регулярное обучение для укрепления ответственной практики.

Итак, где Genai может принести ценность сейчас? Забудьте заменить критическое мышление и анализ рисков в основе QA. Вместо этого сосредоточьтесь на устранении труда и увеличении возможностей для человека. Мой руководящий принцип всегда был: «Сначала автоматизировать скучные вещи». Подумайте о утомительных задачах, которые истощают фокусировку и вводят задержки с переключением контекста: создание строительных лесов проекта, написание конфигурации котельки, суммирование огромных количеств результатов теста, создание первоначальных проектов отчетов об ошибках (с экранами, видео, видео и журналами) или даже помогая расшифровать сложные сценарии легали.

Кодирование Vibe реально, но в какой -то момент каждый сеанс, который я запускал, становится больше о том, чтобы сразиться с сумасшедшими вещами, которые делает LLM, а не на создании вашего программного обеспечения. Для младших разработчиков это может быть рискованным предложением: если вы не знаете разницу между хорошим кодом и плохим, вы не сможете пересмотреть и корректировать курс ошибки, которые он совершает.

Недавно я кодировал сценарий Python, чтобы могить API GraphQL GraphQL Гитлаба-задача, которая заняла бы дни, стала управляемой в течение нескольких часов с помощью итерационного подсказки и уточнения. Это может быть фантастический партнер по мозговом штурме, который помогает преодолеть блок писателя при создании плана испытаний или заставляя более вдумчивого рассмотрения рисков. Разработчики находят успех, используя Genai для генерирования блоков, компонентов и тестов API-областей, где тесты обычно более детерминированные и автономные. Агент ИИ может теоретически создавать и выполнять эти сценарии для меня, не узнавая, как они работают. Я еще не хочу так много доверять этим инструментам.

Но этот проект был одноразовым сценарием, а не программным обеспечением, которое необходимо соблюдать с течением времени. Чтобы проекты автоматизации тестирования Vibe-Code, вам необходимо убедиться, что вы понимаете ограничения и сильные стороны LLM, которую вы используете, и что вы выполняете периодические коммиты на случай, если дела идут. Код автоматизации тестов имеет тенденцию требовать абстракции и тщательного планирования сценариев с низким обслуживанием. Кодирование атмосфера по-прежнему не соответствует задачу выполнения этого уровня работы для вас-это намного лучше для одноразовых.

Этот подход «Увеличение, а не автоматизация» меняет то, как мы включаем инструменты: вместо того, чтобы просить ИИ быть тестером, попросите его:

Проанализируйте результаты теста и точно определите, почему тест не удался (изменение пользовательского интерфейса? Ошибка API? Задержка производительности?)
Помогите оптимизировать стратегию выполнения тестов на основе риска и прошлых результатов.
Определите пробелы и перекрытия тестового покрытия.
Облегчить лучшую связь в перекрестной команде, возможно, с помощью контрактного тестирования API, чтобы досрочно перехватывать изменения, поддерживая сотрудничество, а не вину.

Истинный рентабельность инвестиций генеративного ИИ в обеспечении качества

Истинный рентабельность рентабельности Genai в QA, вероятно, не произойдет от сокращения численности персонала, несмотря на то, что могут надеяться, что некоторые менеджеры могут надеяться или поставщики. Он будет поступить из-за того, что команды будут быстрее обеспечить более качественное программное обеспечение, удаляя трубку, обеспечивая лучшую информацию и освобождая экспертов-людей, чтобы сосредоточиться на сложном решении проблем и стратегическом управлении рисками.

Ландшафт Genai незрелый, особенно в отношении его интеграции в SDLC. Многие инструменты не потерпят неудачу. Будьте готовы оценить критически и отказываться от инструментов, которые не обеспечивают устойчивую ценность за пределы первоначальной демонстрации. Помните о блокировке поставщиков и ищите инструменты, которые следуют стандартам (MCP для агентов, A2A для экосистемы). Предпочитаю открытый исходный код, если это возможно. Не позволяйте спешкам принять ИИ, заставляя вас недооценивать незаменимое ремесло QA.

Принимая ограничения Деная так же легко, как и его возможности, сосредоточенность на доверии и нацеливаясь на правильные проблемы-труд, утомительный, трудоемкий,-мы можем использовать его возможности для действительно улучшать, а не просто разрушать, как мы строим и доставляем программное обеспечение.

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом.

Разработка сайтов в Гомеле

Добавить комментарий Отменить ответ

Похожие записи

Q & A: Как Google использует свою модель Biemini на большой языке

Ода незамеченным героям Кубернета

Webassembly, «Hyper VMS» и Hypervisors: быстрые скорости, интенсивная изоляция

Edge Computing надувается с новым SOC Intel

Cloud Native и AI: почему с открытым исходным кодом нужны такие стандарты, как MCP

Создание мультиагентных систем для автоматизации рабочих процессов с помощью CrewAI

Протокол контекста модели: праймер для разработчиков

Команда Grep в Linux

6 Принципы проектирования для систем вычислений по крае

Ржавчина получает недостание: официальная спецификация наконец -то прибывает

Налог на прерывание: почему производительность разработчиков измеряется в молчании

Использовать kubernetes затраты с Opencost

Вам тоже может быть интересно:

Разработка сайтов в Гомеле