Почему Openai еще не дает глубоких исследований в свой API.

Openai говорит, что он не принесет модели ИИ, обеспечивающего глубокие исследования, его углубленный исследовательский инструмент, к своему разработчику API, в то время как он выясняет, как лучше оценить риски, убедившись ИИ действовать или изменить свои убеждения.

В белом документе Openai, опубликованном в среду, компания писала, что она находится в процессе пересмотра своих методов исследования моделей для «реальных рисков убеждения», таких как распределение вводной информации в масштабе.

Openai отметил, что не верит, что модель глубоких исследований хорошо подходит для кампаний по массовой дезинформации или дезинформации из -за его высоких вычислительных затрат и относительно медленной скорости. Тем не менее, компания заявила, что намеревается изучить такие факторы, как ИИ может персонализировать потенциально вредный убедительный контент, прежде чем донести глубокую модель исследования в свой API.

«Хотя мы работаем, чтобы пересмотреть наш подход к убеждению, мы развертываем эту модель только в Chatgpt, а не API», — написал Openai.

Существует настоящий страх, что ИИ вносит свой вклад в распространение ложной или вводящей в заблуждение информации, предназначенной для того, чтобы повлиять на сердца и умы к злонамеренным целям. Например, в прошлом году политические глубокие темы распространялись как лесной пожар по всему миру. В День выборов в Тайване китайская группа, связанная с коммунистической партией, опубликовала, вводящую в заблуждение АИ, вводящее в заблуждение звук политика, бросающего свою поддержку кандидату на Кита.

ИИ также все чаще используется для проведения атак социальной инженерии. Потребители обманывают знаменитостями DeepFakes, предлагающие мошеннические инвестиционные возможности, в то время как корпорации вынуждены из миллионов имитаторов Deepfake.

В своем документе Openai опубликовал результаты нескольких тестов убедительности глубоких исследований. Модель представляет собой специальную версию недавно анонсированной O3 модели O3 «рассуждения», оптимизированной для просмотра веб -страниц и анализа данных.

В одном тесте, который позаботился о модели глубоких исследований с письменными убедительными аргументами, модель выполнила наилучшие из моделей Openai, выпущенных до сих пор, но не лучше базовой линии человека. В другом тесте, в котором была предпринята глубокая исследовательская попытка убедить другую модель (GPT-4O OpenAI) сделать платеж, модель снова превзошла другие доступные модели OpenAI.

Оценка модели глубоких исследований по Makemepay, эталону, который проверяет способность модели убедить другую модель наличных денег.Кредиты изображения:Openai

Однако глубокая исследовательская модель не проходила каждый тест на убедительность с летающими цветами. Согласно WhilePaper, модель была хуже в том, чтобы убедить GPT-4O рассказать ему кодовое правило, чем сам GPT-4O.

Openai отметил, что результаты теста, вероятно, представляют «нижние границы» возможностей глубоких исследований. «[A]DDITIONAL SICFAFFOLD или улучшение выявления возможностей могут существенно повысить производительность », — написала компания.

Мы обратились к OpenAI для получения дополнительной информации и сообщим об этом сообщении, если вернем.

Разработка сайтов в Гомеле

Похожие записи

Nintendo использовал свое новое приложение, чтобы объявить дату выхода фильма «Легенда о Zelda».

SF Mayor Lurie для технических руководителей: «Как мы можем вернуть вас?»

Нью -Йоркский, наконец, принял современность

Выпуск Nintendo Switch 2 5 июня и стоит 450 долларов

Менее недели, чтобы сэкономить 300 долларов+ на TechCrunch All Stage Passes

Pruna AI Open Source

Как предложение Musk’s $ 97,4 млрд может привести к размаскиванию для коммерческого конвертации Openai

Модель O3 Openai может быть дорогой для запуска, чем первоначально оцениваемая

Waymo был защелкнут почти 600 парковочных билетов в прошлом году только в SF

Временные приземления 146 миллионов долларов при фиксированной оценке, Agent Agentic Ai расширение

Стартапы еженедельно: смешанные сообщения от венчурного капитала

Рисунок начнет «альфа -тестирование» своего гуманоидного робота в доме в 2025 году

Вам тоже может быть интересно:

Этим летом не позволяйте обезвоживанию разрушить вашу тренировку

Студенты узнают о технологии спектра от отраслевых экспертов

Переосмыслить библиотеки нашего университета

Новый учебный год приветствует новый факультет

Использование OMM для борьбы с травмами головы MMA

Познакомьтесь с классом 2025 года.

Студент -медик признан за сердечно -сосудистые исследования

Стремительные DOS получают белые пальто

Медицина, основанная на сострадании

Мой кооперативный концерт: Чендлер Наута

Студенты предлагают решения для поездок на работу.

Предприниматель, казначей и дизайнер робототехники