Руководство Google по веб-ИИ: асфальтированная дорога против открытого поля

На саммите Google Web AI в этом месяце основное внимание уделялось искусственному интеллекту на стороне клиента в браузере, но мы также много слышали о протоколе контекста модели (MCP) и его веб-варианте, WebMCP, агентах, а также о том, как «вычислительные абстракции», такие как WebGPU и WebNN, позволяют веб-разработчикам получать доступ к аппаратному обеспечению устройств.

После выступления руководителя Google по веб-ИИ Джейсона Мэйса мероприятие началось с основного доклада Паризы Табриз, вице-президента и генерального менеджера Chrome и веб-экосистемы Google. Тебриз назвал этот момент «возрождением Интернета», добавив, что «многие инструменты и методы разработки фундаментально меняются, называете ли вы это кодированием вибрации или помощью искусственного интеллекта».

Учитывая нынешнюю нехватку рабочих мест среди веб-разработчиков и онлайн-создателей, я не уверен, что слово «ренессанс» здесь подходящее. Но я понимаю точку зрения Тебриза, что способы создания и использования Интернета фундаментально меняются благодаря технологиям искусственного интеллекта.

Париса Тебриз, вице-президент и генеральный директор Chrome, на Web AI Summit.

Многие представители веб-индустрии подвергают сомнению приверженность Google открытому Интернету в эпоху искусственного интеллекта. Но, по словам Тебриза, Google по-прежнему намерен инвестировать в открытую сеть.

«В веб-экосистеме Chrome важно знать и усвоить, что мы очень стремимся продолжать инвестировать в открытую, совместимую сеть», — сказала она.

Google «очень стремится продолжать инвестировать в открытую, совместимую сеть».
— Париса Тебриз, вице-президент и генеральный директор Google Chrome

Она привела WebAssembly — «все дело в том, чтобы привнести в браузер мощь настольного класса» — и WebGPU в качестве примеров технологий, которые ее команда в последнее время совершенствует.

Она также упомянула встроенные API-интерфейсы искусственного интеллекта, которые были добавлены в Chrome в августе прошлого года, а также выпуск Gemini Nano — основной модели Google для устройств — в качестве встроенной функции в Chrome в июне прошлого года. Все эти функции описаны на веб-странице Google «AI with Chrome».

Демократизация разработки ИИ через браузер

Тебриз назвал движение веб-ИИ своего рода демократизацией ИИ.

«Это [Web AI] на самом деле вопрос о том, как нам демократизировать ИИ, чтобы новые возможности были более доступными и эффективными, с целью сделать ИИ доступным на любом устройстве, в любом браузере и в любом месте».

Интересно, что эти формулировки отражают сообщение в блоге генерального директора Google Сундара Пичаи в мае 2017 года под названием «Заставить ИИ работать на благо всех». Как писал тогда Пичаи, «чем больше мы сможем работать над демократизацией доступа к технологиям, [AI] — как с точки зрения инструментов, которые люди могут использовать, так и с точки зрения того, как мы их применяем — тем скорее все выиграют». Обратите внимание, что это было за месяц до публикации ныне известной научной статьи «Внимание — это все, что вам нужно», написанной несколькими сотрудниками Google, которая вдохновила OpenAI начать создание того, что стало ChatGPT.

Я хочу сказать, что хотя иногда мы можем обвинять Google в использовании технологии искусственного интеллекта (просто погуглите «Обзоры искусственного интеллекта склеивают пиццу»), вы не можете винить последовательное видение компании в отношении искусственного интеллекта — вплоть до заявления Тебриза о том, что веб-искусственный интеллект стремится сделать искусственный интеллект доступным на любом устройстве и в любом браузере.

Будущее браузера в эпоху искусственного интеллекта

Затем Тебриз немного рассказал о будущем браузера в эпоху искусственного интеллекта. Она сказала, что браузер переходит от «окна в Интернет, который отображает пиксели, к… партнерской платформе для повышения производительности». Она отметила, что «браузер стал новой конечной точкой» для корпоративных клиентов Chrome, учитывая, что очень много людей теперь работают в браузерах каждый день («по крайней мере, на рабочем столе», — уточнила она).

Браузер переходит от «окна в Интернет, который отображает пиксели, к… партнерской платформе для повышения производительности».
— Париса Тебриз, вице-президент и генеральный директор Google Chrome

Что касается разработчиков, Тебриз видит «сильный интерес» к «ИИ на устройствах и гибридным решениям».

В заключение она высказала три прогноза на будущее Интернета:

  • Больше активности: «Он не просто будет реагировать на запросы пользователей, он будет понимать намерения пользователей». Здесь, конечно же, на помощь приходят агенты ИИ.
  • Более персонализированный и динамичный опыт: В частности, Тебриз рассказал о «динамических пользовательских интерфейсах, которые будут [AI] создаются и фактически адаптируются к тому, что лучше всего подходит для конкретного пользователя», что предполагает создание веб-сайтов по требованию или, по крайней мере, слоев веб-интерфейса, настроенных для каждого пользователя.
  • Новые формы сотрудничества человека и ИИ: Здесь она сослалась на недавнюю интеграцию Gemini в Chrome «в качестве помощника по просмотру».
  • Париса Тебриз и саммит Web AI.

    Руководство разработчика по веб-ИИ

    Позже на Web AI Summit мы узнали больше о том, как разработчики могут подходить к созданию браузерных приложений AI. Кенджи Бахё, менеджер по продукту Chrome, который работает над инициативами веб-ИИ, выступил с полезной презентацией, изложив свои идеи для руководства по веб-ИИ — другими словами, руководства для разработчиков.

    Баэ рассказал о двух основных подходах к разработке веб-ИИ. Первый, «асфальтированная дорога», предполагает использование существующих фреймворков (включая, возможно, Antigravity, «платформу разработки агентов», выпущенную Google только на этой неделе) и встроенных API-интерфейсов искусственного интеллекта для Chrome. При таком подходе разработчикам не нужно беспокоиться о графических процессорах или даже о WebGPU.

    «Это явно путь простоты и скорости, и он предназначен для разработчиков, которые хотят предоставлять ценные функции ИИ, не беспокоясь об инфраструктуре ИИ или стеке», — сказал Баэ аудитории на Web AI Summit.

    Дорога, проложенная веб-ИИ. (Источник: Кенджи Баэ)

    Затем он представил другой путь, который на самом деле является полем в этой метафоре. «Открытое поле» позволяет разработчикам получить доступ к аппаратному обеспечению устройства, что означает «запачкать руки» «низкоуровневыми API» Wasm, WebGPU или WebNN.

    «Это путь максимальной гибкости и контроля, — объяснил Баэ, — и он по сути предназначен для двух ключевых групп. Он предназначен для разработчиков, которым необходимо развертывать свои собственные модели, или, может быть, для некоторых людей, которые хотят получить полный контроль над всем стеком искусственного интеллекта. И во-вторых, это также семинар для… людей, которые создают платформы». [or] инструменты, чтобы они могли расширить сферу применения дорог с твердым покрытием, предоставляя простые в использовании решения».

    Открытое поле веб-ИИ. (Источник: Кенджи Баэ)

    Позже в своем выступлении Баэ отметил, что нам также нужны новые шаблоны проектирования для веб-приложений на базе искусственного интеллекта. Он сказал, что с помощью ИИ на стороне клиента «вы можете быть более активными». Он сказал, что самая большая ошибка, которую до сих пор допустили разработчики при использовании ИИ, — это добавление на свой сайт «ловушки функций ИИ» — например, навязчивого чат-бота, который прерывает поток пользователей.

    «Я думаю, что лучший подход — быть тонким и полезным», — сказал он. «На самом деле цель состоит в том, чтобы расширить рабочие процессы, которые уже есть у ваших пользователей, чтобы у вас был ИИ, который уходит на задний план».

    Премьер-министр Google Кенджи Баэ на саммите Web AI.

    Заключение

    Веб-ИИ как особый тип разработки приложений ИИ явно играет на сильных сторонах Google — его доминировании на рынке веб-браузеров (которого OpenAI и другие компании, занимающиеся искусственным интеллектом, добиваются своими новыми браузерами), его способности адаптировать новые веб-стандарты, такие как WebGPU и Wasm, к своему видению, его возможностям веб-инжиниринга и его все более сложным моделям и инструментам ИИ (Gemini и такие инструменты, как Antigravity).

    Противоположность заключается в том, что многие разработчики по-прежнему предпочитают полагаться на облачные вычисления — серверный ИИ — для поддержки своих ИИ-приложений. Но лично я вижу большой потенциал в искусственном интеллекте на устройстве, во многом потому, что он прекрасно сочетается с сильными сторонами самой веб-платформы — возможностью развертывания, конфиденциальностью пользователей и (прежде всего) открытостью.

    ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Ричард Макманус — старший редактор The New Stack и пишет о тенденциях в разработке веб-приложений и веб-приложений. Ранее в 2003 году он основал ReadWriteWeb и превратил его в один из самых влиятельных в мире новостных сайтов о технологиях. С самого начала… Подробнее от Ричарда Макмануса

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *