Vespa.AI спонсировал этот пост.
Я вырос в панк-группе 1970-х (да, The Neurons. Возможно, вы слышали о нас). Тогда нам казалось, что мы выходим за рамки культурной приемлемости. Но, оглядываясь назад, эти границы были сравнительно мягкими. Во многих частях мира художники не просто рискуют подвергнуться критике; им грозит исчезновение, тюремное заключение, изгнание или что-то еще хуже.
Цензура художественного выражения – это не просто запрет песни или удаление картины. Это влияет на то, как общества помнят себя. Когда голоса артистов замолкают, истории, которые определяют идентичность и бросают вызов властным структурам, могут быть стерты.
Поэтому для исследователей, журналистов и правозащитных групп документирование цензуры — это не просто занятие по ведению документации; это борьба за сохранение истины.
Истории существуют, но доказательства не связаны друг с другом
Сообщения о цензуре многочисленны: они появляются в газетах, социальных сетях, в личных показаниях и в архивах неправительственных организаций. Но они разбросаны по странам, языкам и форматам. В большинстве случаев эти мнения не совпадают таким образом, чтобы можно было сравнивать или понимать более крупные закономерности. Без возможности проверить и связать их отдельные истории остаются изолированными, а общая картина остается размытой.
Эта фрагментация мешает журналистам, исследователям и правозащитникам отслеживать тенденции или реагировать на эскалацию репрессий. Прогресс замедляется не отсутствием информации; вместо этого это неспособность организовать эту информацию во что-то заслуживающее доверия и общедоступное.
Другой способ использования ИИ
Мы часто слышим о том, что ИИ посягает на интеллектуальную собственность художников, но вот случай, когда ИИ действительно помогает защитить художественное самовыражение. Civsy — это новая платформа, разработанная Mimeta, норвежской организацией, занимающейся культурными правами. Он предназначен для сбора, проверки и анализа цензуры художественного выражения в разных регионах, языках, дисциплинах и политических контекстах.
Но собирать истории — это только первый шаг. Настоящая задача состоит в том, чтобы сделать их доступными для поиска и сравнения таким образом, чтобы выявить закономерности, а не просто отдельные инциденты. Вот тут-то и приходит на помощь поиск на основе искусственного интеллекта. Если все сделано правильно, он может соединять точки, которые в противном случае остались бы разрозненными, помогая исследователям видеть не только то, что происходит, но и где и как развиваются эти закономерности.
Как Civsy использует поиск с помощью искусственного интеллекта
Civsy объединяет структурированные данные (даты, места, виды искусства, виды репрессий) с неструктурированными данными (интервью, репортажи, новостные статьи, описания случаев). Под капотом система использует гибридный подход поиска, сочетающий в себе:
- Поиск по ключевым словам для получения точных деталей (например, «запрет на поездки», «закрытие кинофестиваля»).
- Векторный/семантический поиск для понимания значения разных языков, фраз и контекста.
- Осведомленность об объектах для отслеживания людей, учреждений, мест или событий, даже если они написаны с ошибками или используются вне контекста.
Civsy не просто сопоставляет текст; это моделирование отношений. Например, случай цензуры может быть описан на английском языке как «театральная постановка остановлена по политическим причинам», тогда как источник на французском языке формулирует его как «спектакль, отмененный из-за давления со стороны правительства».
Традиционный поиск по ключевым словам рассматривает их как несвязанные. Семантический слой Civsy распознает их как концептуально связанные, даже если словарный запас различается.
Особенно полезными являются межъязыковые и межконтекстные поиски. Civsy хранит векторные изображения документов, поэтому случаи из арабских, французских или других источников могут быть доступны исследователю, выполняющему поиск на английском языке.
Исследователям, исследующим «подавление уличного искусства», не нужно знать точную юридическую или бюрократическую терминологию, используемую в местных отчетах, поскольку именно этим переводом значения занимается система.
Civsy поддерживает рабочий процесс с расширенным поиском (RAG), поскольку многим пользователям нужна информация, а не только документы. Когда пользователь запускает запрос, Civsy:
- Извлекает наиболее релевантные записи, используя уровень гибридного поиска.
- Передаёт только обоснованные записи в интегрированную языковую модель.
- Создает краткое, прозрачное резюме со встроенными ссылками на источники.
В результате ИИ не изобретает утверждения; это ИИ, действующий как уровень проверки проверенных данных. Каждое предложение прослеживается, галлюцинации не допускаются.
Модель взаимодействия также предназначена для расследовательских исследований, а не для разовых вопросов и ответов. Используя платформу Vespa AI Search, Civsy поддерживает контекст сеанса, включая предыдущие фильтры, области интереса, формы выражения и периоды времени. Это позволяет пользователям продолжать уточнять, не повторяя все заново. Исследователь может начать с широкого подхода, медленно продвигаться к конкретному набору случаев, а затем перейти к аналогичным закономерностям в другом регионе, не теряя при этом цепочки исследований.
Человеческая сеть в основе
Civsy также поддерживает пользователей, которым необходимо быстро объяснить происходящее аудитории, способной действовать. Когда кто-то выполняет поиск по теме, платформа извлекает соответствующие записи и может создать краткое резюме, основанное на фактических данных. Важно отметить, что каждое заявление связано с его источником, что обеспечивает прозрачность и позволяет избежать вымышленных утверждений. ИИ помогает в синтезе, а не в интерпретации.
Ничто из этого не работает без людей, которые собирают и проверяют отчеты. Civsy опирается на сеть местных исследователей и культурных наблюдателей, которые понимают контекст и риски на местах. Их вклад придает платформе авторитет. ИИ помогает объединять, организовывать и анализировать, но истина исходит от людей.
Заключительные мысли
Для Civsy все еще рано, но направление ясно. Команда разрабатывает способы поиска документов и изображений с использованием оптического распознавания символов, отслеживания взаимосвязей между действующими лицами и событиями и помощи организациям в совместной работе над отчетами в режиме реального времени. Долгосрочная цель заключается не только в том, чтобы заархивировать репрессии, но и в том, чтобы выявить закономерности на достаточно раннем этапе, чтобы отреагировать.
Это пример того, как ИИ помогает защитить свободу творчества, а не подрывает ее. Civsy показывает, как поиск ИИ при осторожном, прозрачном использовании и с учетом человеческого суждения может улучшить информацию о том, что происходит в мире, а не исказить ее.
Ценность здесь заключается не только в скорости или масштабе. Это возможность сделать так, чтобы истории художников не исчезли.
Vespa.AI — это платформа для создания приложений на базе искусственного интеллекта для поиска, рекомендаций, персонализации и RAG. Он обрабатывает большие объемы данных и высокую частоту запросов, предлагая эффективное управление данными, выводами и логикой. Доступен как управляемый сервис, так и с открытым исходным кодом. Узнайте больше Последние новости с Vespa.AI ТЕНДЕНЦИОННЫЕ ИСТОРИИ YOUTUBE.COM/THENEWSTACK Технологии развиваются быстро, не пропустите ни одной серии. Подпишитесь на наш канал YouTube, чтобы смотреть все наши подкасты, интервью, демонстрации и многое другое. ПОДПИСАТЬСЯ Группа, созданная в Sketch. Тим Янг возглавляет отдел маркетинга в Vespa.AI, используя свой технический опыт для реализации стратегий, основанных на данных. Он начал свою карьеру в области крупномасштабного управления данными для таких предприятий, как British Telecom, T-Mobile, Shell, British Airways и Ford. Тим занимал ключевые должности в сфере маркетинга… Подробнее от Тима Янга