Расхождение между результатами первой и третьей стороны для модели O3 AI от Operai- это поднимает вопросы о прозрачности и методах тестирования моделей. Когда Openai обнародовал O3 в декабре, компания утверждала, что модель может ответить чуть более четверти вопросов на FrontierMath, сложном наборе математических проблем. Этот счет взорвал […]
