Как тензоры меняют поиск в науках о жизни

Vespa.AI спонсировал этот пост.

В мои годы, работая во всех науках о жизни, один вопрос снова и снова возникает: что дальше для ИИ в нашей области? Правда в том, что индустрия наук о жизни сталкивается с проблемами, отличных от любого другого.

Если банк или розничный продавец могут развернуть чат -ботов ИИ для улучшения обслуживания клиентов, наш мир определяется огромными, грязными наборами данных, включая клинические испытания, результаты лаборатории, публикации и записи пациентов. Это должно быть интерпретировано с осторожностью. Ставки — это не только эффективность или удобство; Это прорывы в области лечения, безопасности и результатов пациента.

Вот почему я считаю, что реальная возможность для генеративного ИИ (Геная) в науках о жизни не в чат -ботах, а в обеспечении глубокого и точного поиска. Успех здесь означает подключение к нескольким источникам, примирение гетерогенных данных и вскрытия, которые человеческий исследователь будет изо всех сил пытаться собрать вместе.

Представьте себе, что вы спрашиваете: «Найди меня испытаниями колоректального рака, используя Zaltrap [a drug] с самыми последними вспомогательными публикациями ». Genai, при эффективном применении, может справиться с этой сложностью, и именно здесь начинается следующая граница.

От традиционного поиска до ИИ, управляемого открытием

В течение десятилетий поиск в науках о жизни в основном означал поиск ключевых слов или поиск на основе правил. Исследователи, клиницисты и фармацевтические команды полагались на эти инструменты для просмотра научной литературы, данных клинических испытаний, патентов и нормативных документов. Они работали достаточно хорошо для простых, четко определенных вопросов. Но как только вам нужно было учесть, специфичный для домена язык, синонимы или сложные отношения между заболеваниями, молекулами и путями, традиционный поиск достигает его ограничений.

Результат? Бесконечные ручные усовершенствования, сшивая идею вместе из разных источников и много времени, потраченного на поиск правильной информации. Реакция

Вы можете задавать сложные, естественные вопросы и получить результаты, которые связывают точки по всей литературе, испытаниям и патентам-даже если они используют разные терминологии.

Теперь, с моделями Genai и большими языками (LLMS), это меняется. Поиск с мощностью LLM понимает смысл, а не только точные слова. Вы можете задавать сложные, естественные вопросы и получить результаты, которые связывают точки по всей литературе, испытаниям и патентам-даже если они используют разные терминологии. Это открывает совершенно новые способы работы: выявление возможностей перепрофилирования наркотиков, скрытых в исследованиях разъединений, ускорение обнаружения биомаркеров или обнаружение ранее невидимых связей между биологическими сущностями. Это быстрее, более полное и гораздо менее ручное.

Почему тензоры имеют значение в этом смене

Данные о науках о жизни поставляются во всех формах и размерах — данных OMIC, 3D -белковых структур, медицинских изображений, регуляторных документов, отчетов о клинических испытаниях и многого другого. Большая часть этого неструктурирован или полуструктурирован, что затрудняет быстрое поиск и собирать соответствующую информацию. Учитывая природу наук о жизни, точность имеет решающее значение. «Достаточно хорошо» редко существует.

Здесь входят тензоры.

Итак, что такое тензор? Думайте об этом как о многомерном контейнере для данных. Вектор-это одномерный список чисел. Матрица двумерная. Тензор выходит за рамки этого, захватывая несколько измерений одновременно. Это позволяет моделям ИИ представлять сложные отношения — например, пространственные конфигурации белков или контекстуальные отношения между словами в научной статье — даже если эти части информации находятся далеко друг от друга.

Другими словами, тензоры позволяют AI «видеть» и изучать шаблоны, которые глубоко встроены в разные измерения данных.

Тенсоры в действии: белковые структуры

Возьмите структурную биологию в качестве примера. Такие модели, как Alphafold, используют 3D -тензоры для представления пространственных отношений между аминокислотами. Эти тензоры позволяют модели узнать, как белки складываются, складываются и взаимодействуют — важные знания для понимания механизмов заболевания и проектирования новых методов лечения.

Когда вы внедряете белок как тензор, вы сохраняете:

  • Последовательные данные (порядок аминокислот)
  • Пространственные отношения (как части белка сгиба и соединение)
  • Биохимические свойства (например, заряд или гидрофобность)

Это богатое представление позволяет моделям машинного обучения (ML) предсказывать складывание белка, идентифицировать сайты связывания, взаимодействие белка MAP и даже обнаруживать новые лекарственные мишени.

Та же идея применима за пределами белков.

Медицинская визуализация, например, может использовать тензоры для кодирования не только пикселей, но и их контекстуальной значимости, помогая ИИ обнаружить тонкие маркеры рака даже при шумных сканировании. В клинических условиях тензоры помогают ИИ анализировать потоки данных из носимых устройств или устройств Интернета вещей (IoT) в режиме реального времени, что обеспечивает более быстрые вмешательства.

За пределами поиска: агенты ИИ в науках о жизни

Агенты ИИ являются еще одним новым применением. Думайте о них как интеллектуальных помощниках, которые постоянно собирают, анализируют и синтезируют информацию по фрагментированным источникам данных. Агент ИИ может контролировать новую литературу, клинические испытания и нормативные обновления в режиме реального времени, суммировать результаты и даже предложить следующие исследования.

Хорошие агенты не просто получают информацию — они соединяют ее, создают контекст и разум с помощью проблем шаг за шагом.

Ключ здесь — многоэтапные рассуждения. Хорошие агенты не просто получают информацию — они соединяют ее, создают контекст и разум с помощью проблем шаг за шагом.

Это означает более быстрые рассуждения, лучшую точность и более значимое понимание. Это позволяет вам объединить мультимодальные данные и задавать вопросы по методам и времени. Например, как показано в приведенном ниже примере, теперь вы можете найти пациентов для рекрутирования испытаний для подтипа заболевания, основанного на определенных изображениях прогрессирования (или регрессии) с течением времени. Вы можете сделать это, объединив в тензор медицинскую карту пациента, анализы биомаркеров, слайды гистопатологии и любые другие заметки о результатах прогноза.

Почему это важно

Жизненные науки переходят в эпоху, когда данные являются слишком сложными и слишком обширными для традиционных инструментов. Тенсоры обеспечивают основу для моделей искусственного интеллекта для справки этой сложностью, что позволяет всем, от лучшего поиска до расширенных рассуждений. Будь то прогнозирование белковых структур, извлечение понимания из клинических данных или питания агентов ИИ, которые помогают исследователям сосредоточиться на обнаружении, а не на сбои данных, тензоры тихо становятся основой следующей волны ИИ в науках о жизни.

Vespa.AI-это платформа для создания приложений, управляемых искусственным интеллектом для поиска, рекомендаций, персонализации и тряпки. Он обрабатывает большие объемы данных и высокие показатели запросов, предлагая эффективные данные, вывод и управление логикой. Доступно как управляемый сервис, так и с открытым исходным кодом. Узнайте больше последних из Vespa.AI Trending Stories YouTube.com/thenewstack Tech, быстро движется, не пропустите эпизод. Подпишитесь на наш канал YouTube, чтобы транслировать все наши подкасты, интервью, демонстрации и многое другое. Группа подпишитесь с эскизом. Харини Гопалакришнан возглавляет практику наук о жизни в Vespa.AI. Она является технологическим стратегом с обширным опытом в области искусственного интеллекта, платформ данных и цифровых преобразований в фармацевтическом и биотехнологическом секторе. Ранее она была глобальным техническим директором для наук о жизни в Снежинках … Подробнее от Харини Гопалакришнана

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *