Как короткая волна хочет заново изобретать электронную почту с помощью искусственного интеллекта

К лучшему или худшему, пройдет не слишком много времени, прежде чем практически каждое приложение для производительности, которое вы используете, будет включать в себя некоторую форму агентного искусственного интеллекта. В некоторой степени приложения по электронной почте являются очевидными кандидатами здесь, учитывая, насколько они центральны в повседневной работе большинства пользователей. Во втором эпизоде ​​новых агентов стека я поговорил с Эндрю Ли, соучредителем и генеральным директором Shortwave, почтового клиента, ориентированного на Gmail (с скоростью Outlook, которая скоро появилась), который первоначально использовал более традиционный подход к управлению входящими ящиками, прежде чем разворачиваться, чтобы поставить ИИ на переднем крае пользовательского опыта.

От пожарной базы до короткой волны

До того, как основал Shortwave, Ли был одним из соучредителей Firebase, платформы backend как услуга, приобретенная в 2014 году. Это было в Google, сказал мне Ли, где он понял, что хочет построить лучший Gmail.

«Мы начали в 2020 году, и первоначальный план состоял в том, чтобы просто построить лучший Gmail», — сказал он. «У нас было много довольно традиционных представлений о том, как создать лучший опыт продукта, как будто мы хотели изменить способ отображения тем, что мы хотели бы дать вам лучший поиск, мы хотели дать вам несколько крутых сотрудничества и обмена функциями».

Ли утверждал, что по структурным причинам Google было очень трудно вводить новшества по вершине Gmail, учитывая, сколько заинтересованных сторон было и насколько тяжело было бы для двух с половиной миллиарда пользователей адаптироваться к этим изменениям.

Возможно, одна из самых интересных вещей, которые Google сделал в то время, в 2014 году запустила «Входящие», чтобы преодолеть именно эту проблему. Это был новый, полностью переосмыслимый почтовый клиент, который использовал Gmail в качестве источника данных. Это позволило команде экспериментировать с новыми идеями, не касаясь традиционного опыта Gmail. Несмотря на свою большую фанатскую базу, «Входящие» стали жертвой усилий Google по сокращению затрат в 2018 году, а Shortwave, в некоторой степени, возрождает некоторые из этого оригинального духа, стоящего за почтовыми ящиками.

«В команде Firebase было несколько человек, которые были как беженцы из [Inbox] Команда до того, как они фактически закрыли его, но вроде как увидел, как написал там стену, — сказал Ли. — А потом у людей, которые остались в команде Gmail, был очень четкий сигнал, например, не пытайтесь слишком много вводить новшества, верно? Если вы слишком много инновации, ваш проект может быть убит. Итак, вы знаете, если вы посмотрите последние шесть лет с тех пор, как этот продукт был убит, Gmail мало что сделал. Они как бы толкнули там боковую панель Близнецов, но не было никаких радикальных усилий, чтобы переосмыслить продукт ».

Вставить LLMS в ваш почтовый ящик

По словам Ли, к осени 2022 года и с запуском Chatgpt, ему стало ясно, что крупные языковые модели (LLMS) будут чем -то. Но в то время они все еще были медленными и дорогими, поэтому команда добавила несколько функций с LLM, таким как суммирование, перевод и перечисление элементов действий.

«Все [these features] были похожи, вы нажимаете кнопку или выбираете опцию меню, а затем появляется модал, и вы ждете, и что -то выплющает. И, честно говоря, ни один из них не был ужасно полезным, за исключением, может быть, сводная функция. Но люди много говорили об этом, верно? Было много шумихи. Мы получили от этого кучу прессы. Мы получили кучу регистраций. Куча людей заплатила нам за это. Определенно достаточно волнения, что мы решили удвоить », — объяснил Ли.

Перенесемся на сегодня, и модели стали лучше, быстрее и дешевле, но, возможно, даже что более важно, они стали лучше в использовании инструментов для выполнения своей работы. Командная команда фактически начала внедрять форму инструментов на раннем этапе, используя свой собственный подход DIY. Затем, когда такие поставщики моделей, как Openai, начали внедрять инструменты, вызывая их сами в свои API, ранние версии были не так хороши («Мы попробовали его, и в то время мы обнаружили, что в любое время, когда у нас было инструмент, на самом деле стало тупичным в целом»).

В прошлом году это был запуск Claude Sonnet 3.5 из Antropic 3.5, который изменил игру для короткой волны.

IT seems like Anthropic has been doing some very focused reinforcement learning, specifically on agentic tool calling use cases, and last summer, at this time, the OpenAI models, they could effectively call like one tool, but you couldn’t really get them to call a bunch of tools, or a sequence of tools. And the Anthropic models, starting in December, were able to call a tool, look up information, take that information to figure out the next tool, call another tool, and do that in sort of an endless Последовательность.

По словам Ли, для вызова инструментов, Антропик по -прежнему остается намного опережающим конкуренцию, особенно сейчас с развертыванием последних моделей 4,0.

Одна вещь, которая по-прежнему нуждается в работе, он отметил, это то, что, как только вы добавите слишком много инструментов (и это в основном означает модельные серверы протокола контекста на данный момент) и интегрировать слишком много сторонних услуг (которые сами могут вызывать свои собственные инструменты), все начинает становиться проблематичными, и причина начинают разрушаться. «Я думаю, что нам действительно нужны модели, которые могут справиться с тысячей инструментов, не нарушая пота», — сказал Ли.

Глядя в будущее: динамические интерфейсы и упреждающие приложения

Заглядывая в будущее, одна из областей, над которой работает команда коротких волн, — это то, что ИИ активно предпринимает действия от имени пользователей. Это остается дорогостоящим предложением, однако, учитывая, что каждое входящее электронное письмо, вероятно, приведет к большему использованию токенов.

Еще одна область, в которой он взволнован, — это возможность генерировать правильный пользовательский интерфейс для правильной задачи на лету. Кодирующие агенты, в конце концов, могут генерировать пользовательские интерфейсы по требованию, но что, если это произойдет не только на этапе кодирования, но в прямом эфире, в приложении, так что, когда вы просматриваете кандидатов на работу, входящие ящики будут отличаться от того, когда вы работаете над обращением с поддержкой клиентов.

Trending Stories youtube.com/thenewstack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Прежде чем присоединиться к новому стеку в качестве старшего редактора для ИИ, Фредерик был редактором предприятия в TechCrunch, где он освещал все, от роста облака и самых ранних дней Kubernetes до появления квантовых вычислений …. Подробнее от Frederic Lardinois

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *