Как ИИ помогает поддерживать ядро ​​Linux

Познакомьтесь с Autosel, содействием Linux, который помогает сохранить конюшню ядра.

Autosel — это сценарий, который использует большую языковую модель (LLM) для выполнения своей задачи.

Он выполняет неблагодарную работу, которая ненавидит все активаторы ядра, работа с обратными патчами.

Пластырь Backporting — это «очень утомительный и разочаровывающий процесс», который «не масштабируется», — говорит Nvidia, отличающуюся инженера -программиста Саши Левин в разговоре на вершине с открытым исходным кодом. Презентация была сосредоточена на том, как ИИ начинает использоваться в сообществе ядра Linux, чтобы помочь не отставать от геркулесовых задач по поддержанию ядра Linux.

Возможно, это еще не пишет новые захватывающие функции для ядра операционной системы с открытым исходным кодом, но ИИ преуспел в задачах, которые являются повторяющимися мыслями, но все еще необходимыми. Другими словами, ИИ уже облегчает жизнь разработчиков ядра Linux, сказал Левин, который помогает поддерживать конюшню Linux ядра и деревья LTS.

Проверка патча

Как крупнейший в мире проект с открытым исходным кодом, ядро ​​Linux обновляется и обновляется … много.

Темпы остались постоянными: в течение 10-недельного периода приземлились до 10 000 новых пятен в основном ядре.

Стабильные и долгосрочные поддержки (LTS) Содействия ядрам обычно рассматривают около 100 пятен в день, каждый день, включая выходные и праздничные дни.

Лишь немногие, около 5-10, оказываются подходящими для возврата.

Левин Автосельнаписано в Rust, первым пропущенным при входящих коммитах, в поисках сходства между представленными коммитами и прошлыми решениями о возврате, и предлагая только те, кто представляется человеческим коммитникам, казалось, что они достойны более тщательного рассмотрения.

Автосель построена из нескольких LLM, причем каждый LLM используется для определенной силы, а также для перекрестной проверки для уменьшения ошибок и галлюцинаций.

Для каждого фиксации инструмент создает математические представления (или «встраивание») текста, который сохраняет семантическое значение для каждого коммита в истории ядра, что делает их легко сопоставимыми.

Для человеческих сопровождающих инструменты сокращают количество коммитов, которые люди должны рассмотреть. Это даже объясняет свои рассуждения в электронном письме.

Знай свои инструменты

Как и любой другой инструмент, значение LLM соответствует тому, насколько хорошо он понят пользователем.

По словам Левина, вы можете думать о крупных языковых моделях как о следующем поколении компиляторов, предоставляя разработчикам повышение производительности. Они ведут себя как «массивные государственные машины», хотя и необычно в них, так это то, что они выполняют государственные переходы в вероятностном, а не детерминированном манере.

Они хороши в сопоставлении шаблонов, учитывая огромное количество параметров и ввод, предоставляемый пользователем. Параметр «температуры» контролирует, насколько вероятностным является LLM, или насколько либерально он интерпретирует свой материал.

Другое использование

И, как и любая другая технология, LLM впервые тестируются в небольших задачах.

LLMS Excel в «Маленьких, четко определенных задачах». Левин сказал.

Одним из таких использования является генерация кода и рефакторинг. Тесно определенные исправления ошибок или преобразование кода в другие формы, такие как стандартные API, являются хорошими задачами.

Для выпуска ядра 6.15 у Левина была LLM написать патч для преобразования реализации хэш-таблицы с открытым кодированием в стандартный API.

Linux Kernel 6.16 включал GIT-Resolve. Этот инструмент решает неполные или неверные идентификаторы коммита, ноющуюся проблему для основных разработчиков, хотя и не тот, который встречается достаточно часто, чтобы тратить много времени вручную на написание инструмента, чтобы выяснить, к какому совершению неполного SHA-1 на самом деле связано.

Левину потребовалось 20 минут, чтобы работать с LLM, чтобы создать инструмент.

Для создания такого инструмента потребовалось бы инженеру около полудня, что не стоит того, чтобы не стоить усилий, учитывая относительную редкость проблемы, которую он решал. Кроме того, LLM сделал много дополнительного кредита: он создал набор самопроцессов и даже документации, которые человеческий инженер с неохотой сделал бы, если вообще.

Левин сказал, что нет никаких задач очистки, которые можно было бы выполнить с ядром. LLM может помочь не носителям английского языка написать описательные сообщения о коммите.

Классификация CVE

Другая утомительная работа — это классификация уязвимостей безопасности (CVE), задача, которую сообщество ядра Linux приняло в 2024 году.

Работа включает в себя проверку коммитов, чтобы увидеть, решат ли они проблемы безопасности.

Первоначально был написан набор «Hacky Bash Scripts».

LLMs использовались для замены сценариев на набор гораздо более изысканных инструментов, записанных в Rust, которые включали полный набор инструментов тестирования и документации.

Используя Autosel в качестве точки запуска, классификатор CVE использует LLMS для определения коммитов, которые решают проблемы безопасности, а затем следят за проверкой уязвимости, еще не рассматриваемой в предыдущем патче. Это подавляющая задача для людей, учитывая 40 миллионов строк кода, которые составляют ядро ​​Linux.

LLMS может понять семантическое значение коммитов, которое обеспечивает гораздо более полную способность соответствовать. В поисках цикла извлечения (RAG) в поисках истории развития и документации ядра (например, репозиториев GIT), чтобы минимизировать галлюцинации.

Левин отметил, что LLMS эффективно действует как агенты ИИ. Они могут запустить команды GIT, такие как Git Fanme, непосредственно против репозитория кода, чтобы учиться на истории самого развития ядра.

Таким образом, AI до сих пор помог Linux масштабировать усилия по обслуживанию, при этом повышая последовательность и снижая ручной труд для утомительных задач.

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Joab Jackson является старшим редактором нового стека, охватывающего облачные нативные вычисления и системы системы. Он сообщил об инфраструктуре и развитии IT более 25 лет, в том числе в IDG и государственных компьютерных новостях. До этого он … читал больше от Джоаба Джексона

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *