Confluent спонсировал этот пост.
Интернет, который мы используем каждый день, — это чудо со скрытым дефектом. Он был разработан, чтобы показать нам документы, а не понять их. Его машины могут указать нам на правый проход в библиотеке, но они слепы к мудрости, написанной на страницах в книгах, которые она держит.
Вот почему бремя понимания падает на пользователей, когда мы просеиваем результаты поиска, перекрестные обзоры и сами собираем данные.
Но так не должно было быть.
Сэр Тим Бернерс-Ли, изобретатель «семантической паутины», имел видение интернета, которое выпустило бы «интеллектуальных агентов», автономных программ, которые могли бы понять наши цели, проводить исследования и действовать от нашего имени с подлинным пониманием. В течение многих лет это видение считалось прекрасным, но нецелесообразным призраком, преследующим края инноваций, в то время как «настоящая» веб -сайт шел.
Тем не менее, внезапный взрывной рост ИИ и крупных языковых моделей (LLMS) возродил концепцию интеллектуального агента из его академического сна. Эта концепция звучит очень знакомо, но технология совершенно новая.
Итак, семантическая сеть провалилась? Или его душа перевоплощена в форме современного ИИ?
Я утверждаю, что это реинкарнация. Сегодняшние агенты ИИ достигают духа первоначального видения через органическую, восходящую революцию. Истинное будущее заключается в сочетаниях изученной интуиции ИИ с элегантной логикой семантической сети, союзом, который, наконец, может осуществить мечту о сети, которая действительно понимает.
Два конкурирующих подхода к интеллекту
В течение последнего четверти века два грандиозных квеста для более разумного интернета развернулись параллельно, часто в мире. Один стремился построить интеллект сверху вниз, с логикой и порядком. Другой стремился вырастить его снизу вверх, посредством обучения и опыта.
Подход сверху вниз: создание логической сети
В конце 1990 -х годов, когда хаотическое разрастание в Интернете стало неоспоримым, группа цифровых архитекторов предложила амбициозное решение. Их целью было создать мир нетронутой логики, сеть, которую машины могли читать с той же ясностью, что и математическое доказательство. Их философия была простой и мощной: «Если вы построите структуру, придут агенты».
Слои для инструментов и операций, необходимых для включения семантической паутины.
Чтобы создать эту логическую сеть, был разработан набор точных инструментов. Структура описания ресурса (RDF) действовала в качестве универсальной грамматики для заявления фактов в простом формате объекта-объекта-объекта (например, «this_article»-‘hasauthor’-‘sean’). Язык веб -онтологии (OWL) послужил главным планом, определяя концепции и их отношения, такие как объявление «автора» как тип «человека».
Наконец, язык запросов Sparql был создан как язык Oracle, что позволило пользователям задавать сложные вопросы об этих структурированных данных и получать логически совершенные ответы.
Несмотря на интеллектуально элегантный, этот нисходящий подход требовал, чтобы люди вручную структурировали и аннотировали веб-страницы, задача, которая оказалась непрактичной для масштабирования. Великое видение исчезло в академическом призраке, красивой, но непрактичной карте для территории, которая отказалась быть прирученной.
Пример запроса sparql
Тем не менее, мечта не умерла полностью.
Хотя полная семантическая сеть никогда не осуществлялась, многие из ее идей нашли новую жизнь в современных системах. Графические базы данных, такие как NEO4J, графики знаний, используемые Google Search и Amazon Alexa, и онтологии, питающие биомедицинские исследования, заимствуют у RDF и OWL.
Подход снизу вверх: обучение на цифровом хаосе
В то время как архитекторы составили свои чертежи, в академических заводах компьютерных наук разворачивалась другая история. Это было машинное обучение, поле с собственной историей грандиозных амбиций и разочаровывающих киосков.
Это также началось с любви к нетронутой логике, пытаясь кодировать правила реальности вручную. И это также было смиренно грязной, непредсказуемой природой реального мира, что привело к длинным «зимним винам искусственного искусства», где прогресс, казалось, замерзал.
Затем, в 2010 -х годах, лед сломался. Революция в глубоком обучении вызвала радикальный новый подход, чтобы перестать пытаться дать машине карту и вместо этого научить ее исследовать.
Вместо того, чтобы запрограммировать с явными правилами, новые системы теперь могут изучать шаблоны и выводить смысл непосредственно из необработанного, неструктурированного хаоса существующего Интернета. Этот новый ИИ процветал в самом беспорядке, который стремился к ликвидации семантической паутины.
С такими важными достижениями, как алгоритм Skip-Gram, ИИ выучил язык из миллиардов постов в блоге, статей и разговоров, и какие изображения были на них, а не прочитав определение.
Архитектура энкодера-декодера модели трансформатора
Это путешествие завершилось ростом модели трансформатора и, в конечном итоге, агентом, способствующим LLM. Эти большие языковые модели являются механизмом рассуждений, компас и мозг для нового типа цифрового урожая.
Эти исследователи выросли в дикой природе и не нуждались в идеально структурированном языке или аккуратных ярлыках, чтобы добиться успеха. Они могут проверить веб -сайт, документ или приложение и точно определить, что он и как его использовать. Они наконец вернули мечту интеллигентных агентов обратно к жизни.
Два мира сталкиваются
В течение десятилетий эти две философии интеллекта развивались в их отдельных реалиях. Но сегодня, когда они, наконец, стоят лицом к лицу, мы обнаруживаем глубокую иронию: архитекторы и исследователи искали одно и то же сокровище, только с совершенно разными картами.
Общее место назначения
Конечной целью семантической сети никогда не было просто организовать данные ради себя. Мечта заключалась в том, чтобы дать возможность интеллектуальным агентам автоматизировать сложные задачи.
Они представляли цифрового помощника, который мог бы понять подобную просьбу: «Найди мне полет в Сан-Франциско на следующую пятницу, забронируют отель возле конференц-центра, который разрешает домашних животных, и найти три высоко оцененные варианты ужина», а затем выполнить его, запрашивая потоки полевых данных в реальном времени и доступность отеля для принятия решений на основе самой современной информации.
Это потребовало выхода далеко за пределы простого поиска ключевых слов в сферу подлинного интерпретации и действия.
Эта же самая мечта — Северная Звезда для сегодняшних агентов ИИ. Концептуальная цель такая же; Амбиции идентичны. Обе парадигмы были рождены от желания освободить нас от ручной работы по навигации по Интернету, которая не мог понять нас.
Будущее гибридное
Будущее интеллекта в Интернете не принадлежит ни к жесткому плану архитектора, ни к не только интуиции исследователя. Это принадлежит их синтезу, новой гибридной реальности, где мечты прошлого исполняются и трансформируются технологиями настоящего.
Формирование общего языка
Первые признаки этого слияния возникают из самих агентов.
Разработчики создают простые, прагматические протоколы, чтобы дать моделям искусственного интеллекта общий язык для взаимодействия с миром. Такие усилия, как протокол контекста модели (MCP) или даже простые стандарты, такие как llms.txt, не являются жесткими, нисходящими мандатами; Это практические «правила дороги», которые позволяют агенту просить контекста и использовать цифровые инструменты предсказуемым образом.
Исследователь, намечая дикую природу, теперь строит свои собственные простые указатели, тихое признание того, что небольшая структура имеет большое значение.
Призрак в машине
Несмотря на всю свою силу, современный агент ИИ обладает ахиллесовой пятой: его знание — это призрак, воспоминания о мире, о котором он только читал. Его вероятностная природа делает его склонным к «галлюцинациям», уверенно заявляя о лжи со всем красноречием истины.
И именно поэтому ему нужна семантическая паутина. Наиболее практичным и устойчивым наследием этой архитектурной мечты является график знаний, обширная структурированная база данных о проверенных фактах и их отношениях. Эти графики являются твердым коллегой реальности, которая может закрепить блуждающую интуицию агента.
Я более подробно изучил эту идею в «ИИ, не спасет вас от ваших проблем с моделированием данных», где я утверждаю, что эффективным агентам ИИ требуются хорошо структурированные модели данных в реальном времени для принятия надежных решений.
Уменный и логичный ум
Когда интуитивно понятный исследователь привязан к логическому архитектору, рождается новый и гораздо более мощный интеллект. Эта конвергенция раскрывает потенциал обоих миров:
- Заземляя интуицию в реальности: Подключив LLM к графику знаний, мы можем «обосновать» его творческие, лингвистические способности в источнике проверенной истины. Перед тем, как агент отвечает на критический вопрос, он может проконсультироваться с известными фактами, чтобы гарантировать не галлюцинацию. Это слияние дает агенту как голос, так и совесть, ум, который не только беглый, но и фактический.
- Нагнетает новый вид рассуждений: Столкнувшись со сложной многоэтажной задачей, гибридный агент может смешать свои навыки. Он может использовать свое интуитивное понимание снизу вверх, чтобы понять нашу цель, а затем обратиться к холодной, жесткой логике графика знаний, чтобы получить надежные данные, необходимые для каждого шага. Это идеальный брак правого творчества и анализа левого мозга.
- Создание универсального переводчика: Возможно, самое красивое, агент ИИ решает самую старую проблему семантической паутины: его непроницаемый язык. Мощный язык запросов Sparql был слишком сложным для обычных людей, чтобы использовать. Но LLM — идеальный переводчик. Это может занять простой, естественный вопрос, например, «Кто все президенты сша, родившиеся в Вирджинии, которые также служили государственным секретарем?» и перевести его в безупречный, формальный запрос, который требуется график знаний.
Оригинальная мечта осуществляется не путем заставляя людей думать как машины, а создавая машину, которая может наконец понять нас. Результатом является веб -сайт, который является как изученным, так и логичным, интуитивно понятным и доказуемым, сеть, которая, наконец, действительно становится умной.
Последние мысли
Первоначальное видение семантической паутины не было неправильным, но его нисходящий подход вручную структурирование всех данных оказалось нецелесообразным для реализации в масштабе. Цель, сеть, которую машины могли понять и действовать, осталась недоступной.
Сегодня агенты искусственного интеллекта предоставляют недостающую часть.
Используя подход снизу вверх, они могут учиться на обширных, неструктурированных данных в Интернете. Однако наиболее эффективный путь-это гибридный, который объединяет три ключевых элемента: гибкая интуиция ИИ, проверенная структура графиков знаний и осознание в реальном времени, предоставленное потоком данных, чтобы заземлить интеллект агента в проверенных фактахПолем
Соединяя эти миры логики, обучения и живых данных, давняя мечта о поистине отзывчивом и интеллектуальном агенте, наконец, становится практической реальностью.
Confluent, основанная оригинальными создателями Apache Kafka, впервые провели полную платформу потоковой передачи данных, которая транслирует, соединяет, обрабатывает и управляет данными, когда она течет по всему бизнесу. С Confluent любая организация может модернизировать свой бизнес и управлять им в режиме реального времени. Узнайте больше последних из Comfluent Trending Stories YouTube.com/ThenewStack Tech движется быстро, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Шон Фальконер — предприниматель ИИ в резиденции в Confluent, где он работает над стратегией ИИ и лидерства. Шон был академиком, основателем стартапа и гуглером. Он опубликовал работы, охватывающие широкий спектр тем, от ИИ до … Подробнее от Шона Фальконера