Ваш ИИ работает с половиной мозга. Вам нужна вторая половина

Мы все видели заголовки о том, что корпоративный ИИ терпит неудачу с большой скоростью. MIT сообщил, что 95% пилотных проектов GenAI терпят неудачу. Соучредитель OpenAI Андрей Карпати недавно заявил, что создание настоящего агентного ИИ может занять еще 10 лет. Проблема в том, что сегодня студенты магистратуры гораздо лучше угадывают лучший ответ, чем на самом деле выясняют правду.

Хотя некоторых это разочаровывает, в этом нет ничего удивительного. ИТ-приложения на предприятии чаще всего предъявляют высокие требования к безопасности, конфиденциальности, соответствию требованиям, охране здоровья и безопасности, а также множеству других средств контроля. Когда ИИ не сможет соответствовать соответствующим высоким стандартам точности, объяснимости, безопасности, управления и конфиденциальности, эти системы ИИ обречены на упадок.

Подобные сбои на самом деле полезны и являются признаком того, что система сдержек и противовесов работает. Существенной основной причиной сбоя является фрагментированное основание данных. Большинство систем ИИ не имеют доступа к знаниям и контексту, чтобы все делать правильно. В частности, у LLM нет самых актуальных данных, и они, как правило, не прошли обучение на основе ваших собственных знаний о предприятии. Кроме того, ни LLM, ни векторные хранилища не имеют доступа к явному контексту, способности к распознаванию (то есть способности ограничивать знания в зависимости от того, кто обращается к системе и с какой целью) или способности к объяснению. Хорошей новостью является то, что все эти проблемы можно решить с помощью все более распространенного архитектурного шаблона: уровня знаний ИИ, основанного на графе знаний.

Почему у студентов-магистров галлюцинации?

Янн ЛеКун, бывший главный научный сотрудник по искусственному интеллекту в Meta, утверждает, что студенты-магистры будут продолжать галлюцинировать до тех пор, пока не воплотят в себе четыре характеристики разумного поведения:

  • Понимание: способность понимать физический мир (к которому я бы добавил цифровой).
  • Постоянная память: способность запоминать и восстанавливать вещи.
  • Рассуждение: Способность рассуждать.
  • Планирование: Умение планировать.
  • Его утверждение состоит в том, что LLM не соответствуют этим характеристикам ни в чем, кроме как в очень примитивном смысле. Как выразился ЛеКун: «Если вы ожидаете, что система станет разумной, не имея возможности сделать это [four] дела, ты совершаешь ошибку».

    Сравните LLM с человеческим мозгом. Поведение правого полушария часто рассматривается как творческое и импульсивное — оно наполнено великими идеями, лишено самоанализа и иногда включает в себя идеи, которые здравомыслящий человек никогда бы не реализовал. Правое полушарие прекрасно выдвигает новые идеи, но ему обычно не хватает понимания, постоянной памяти, рассуждения или планирования — так же, как сегодняшним системам искусственного интеллекта.

    С другой стороны, поведение левого полушария связано с детальным пониманием, логическим рассуждением, памятью, основанной на фактах — способностями, которые сообщают вашему мозгу, когда сумасшедшая идея ближе к галлюцинации, чем к бизнес-плану. Граф знаний может служить левым полушарием в системе искусственного интеллекта. Он представляет типы связей, прошлый опыт и наиболее важные отношения, которые помогают LLM сделать лучший выбор с учетом знаний прошлого.

    Мы можем расширить эту аналогию дальше:

    • Правое полушарие — LLM (и векторы) не относятся к миру дискретных и понятных фактов, которые можно напрямую передать или объяснить людям или даже другим машинам.
      • LLM — это статистически выведенные и непрозрачные механизмы прогнозирования слов, чье поведение — каким бы удивительным оно ни казалось — полностью основано на статистике (более или менее) частоты и близости слов.
      • Как и пресловутое правое полушарие, LLM импульсивны, непостижимы, не совсем предсказуемы — и в основном правы, но иногда совершенно ошибочны.
      • Эта основная часть стека ИИ ведет себя в основном функционально, иногда дисфункционально и всегда непрозрачно.
    • Левое полушарие мозга. Графики знаний хранят точные сведения о фактах, наиболее важных для принятия любых решений.
      • Графики знаний также отражают существенные связи между этими же фактами. Как и их коллеги по нейронным сетям LLM, структуры, используемые для хранения и обработки данных, имитируют механизмы внутри мозга.
      • Данные хранятся способами, понятными людям, но также могут быть обработаны машинами.
      • Они структурируют знания таким образом, чтобы их можно было контролировать с помощью средств контроля доступа к данным, предоставляя ИИ крайне недостающую способность к распознаванию.
      • Хотя вы не можете задавать им случайные вопросы, используя произвольные языковые конструкции, как это возможно в LLM, граф знаний может предоставить LLM богатый контекст, чтобы он мог принять лучшее решение.
      • Более того, графовые базы данных могут дать точные ответы на сложные важные вопросы, дополняя творческие способности LLM возможностью получения точных, детерминированных ответов. Не будем забывать, что на некоторые вопросы все же есть точные ответы!

    Подобно тому, как два полушария мозга вместе обладают гораздо большим потенциалом при совместном использовании, явные знания и связи, доступные в графе знаний, могут помочь специалистам LLM давать лучшие ответы. Они делают это, предоставляя в качестве входных данных богатый конкретный контекст. Этот контекст может включать более конкретные сведения об объектах, отношениях и правилах, задействованных в любом заданном вопросе. Он также может включать веса, полученные в результате контекстно-ориентированных вычислений (широко известных как «графовые алгоритмы»), которые используют возникающую форму сети знаний для улучшения результатов.

    Два распространенных примера:

  • PageRank, который был разработан Google как лучший способ ранжирования релевантных результатов и часто является лучшим способом ранжирования векторных результатов.
  • Графовые нейронные сети (GNN), которые численно описывают способ формирования данных и могут использоваться для определения топологического сходства (например, похоже ли поведение этого человека на поведение ценного клиента или на мошенника).
  • Ставки на принятие решений в приложениях с искусственным интеллектом: требуется половина мозга или полный мозг?

    Теперь у нас есть новая эвристика, которая может помочь выбрать правильную архитектуру для системы ИИ. Если ставки невелики там, где вероятностный ответ достаточно хорош, а контекст, объяснимость и способность контролировать результаты на основе контроля доступа не важны, тогда подойдет более правополушарное решение, включающее LLM и базу данных векторов.

    Однако если ставки высоки, есть большая вероятность, что вам понадобится граф знаний, чтобы перенести ваше приложение через пропасть от прототипа к производству.

    Рассмотрим следующий спектр:

    На одном конце лежат чисто творческие задачи с участием человека. У вас писательский кризис, и вы не знаете, с чего начать. Вам нужен творческий партнер, который поможет вам воплотить идею в жизнь. Или у вас есть задача, специфичная для языка, например обобщение заметок о встрече. Все это лежит прямо в зоне гениальности LLM, а именно в языке и творчестве. В этом смысле галлюцинации представляют собой гораздо меньшую проблему, а в некоторых случаях, возможно, являются особенностью.

    На противоположном конце находятся агентные приложения, занимающиеся бизнес-деятельностью, где вероятность ошибок минимальна. Это приложения, агентские и другие, отвечающие за ведение бизнеса. Обычно, когда ценность хорошего решения высока, цена плохого решения еще выше. В лучшем случае неудачное решение ИИ с высокими ставками нанесет ущерб прибыли. В худшем случае это влияет на репутацию и бренд, здоровье и безопасность людей, соблюдение бизнесом правил, безопасность системы и так далее.

    Для решений на этом конце шкалы планка точности ИИ выше, а системные требования еще больше возрастают, когда вы учитываете необходимость проверяемых и доказуемых результатов для завоевания доверия заинтересованных сторон и регулирующих органов.

    В центре спектра находится второе пилотное приложение для обслуживания клиентов. Здесь ставки все еще могут быть умеренно высокими. Но участие людей в процессе применения здравого смысла и использования своих профессиональных суждений смягчает требования к точности и объяснимости ИИ. Хотя хорошие ответы по-прежнему весьма ценны, а актуальный контекст жизненно важен, существует определенная терпимость к ошибкам.

    Связывая это с аналогией с мозгом: простые творческие задачи могут быть совершенно хороши, если не лучше, если работать только с правым полушарием. С другой стороны, чем выше ставки, тем больше нужно и левое полушарие. Хотя мы иногда шутим о том, что люди занимаются безмозглой деятельностью, на самом деле мы все функционируем с двумя полушариями в нашем мозгу – и ваши системы искусственного интеллекта тоже должны это делать.

    ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Филип Ратл — технический директор Neo4j, занимающийся видением, евангелизацией и развитием отношений с руководителями в технологической экосистеме. Он был первым руководителем продукта компании за более чем десятилетие, сделав Neo4j ведущим игроком на современном рынке… Подробнее от Филипа Ратла

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *