OpenAI допустила ошибки на презентации GPT-5: Альтман признал промах
Во время презентации новой модели искусственного интеллекта GPT-5 компания OpenAI оказалась в центре внимания из-за серьёзных ошибок в демонстрационных диаграммах. Графики, которые должны были подчеркнуть превосходство GPT-5, содержали неточности, вызвавшие вопросы у аудитории. В этой статье мы разберём, что именно пошло не так, как компания отреагировала на критику и что это значит для будущего GPT-5. Читатель узнает о ключевых моментах инцидента и его последствиях для репутации OpenAI.
Ошибки в диаграммах: что пошло не так?
Неправильная шкала значений
- Диаграмма, иллюстрирующая «оценку склонности к обману», содержала ошибки в шкале. Например, для GPT-5 было указано значение 50,0 %, а для модели o3 — 47,4 %, но столбец o3 оказался выше.
- Корпоративный блог OpenAI позже указал, что правильное значение для GPT-5 составляет 16,5 %, что значительно отличается от первоначальных данных.
Некорректное отображение результатов
- В тесте SWE-bench Verified результаты GPT-5 и o3 были перепутаны: более низкий показатель GPT-5 отображался как более высокий столбец.
- Результаты o3 и GPT-4o, хотя и различались, были представлены столбцами одинакового размера, что вводило зрителей в заблуждение.
Реакция OpenAI и Сэма Альтмана
Компания восприняла ошибку всерьёз. Генеральный директор OpenAI Сэм Альтман публично признал промах и заверил, что корректные версии диаграмм уже опубликованы в корпоративном блоге. «Мы стремимся к прозрачности и точности, и такие ошибки неприемлемы», — заявил Альтман.
Последствия для репутации GPT-5
Вопросы к доверию
- Инцидент вызвал сомнения в точности данных, представленных на презентации, особенно с учётом заявлений о снижении уровня галлюцинаций у GPT-5.
Неясность в использовании GPT-5
- OpenAI не уточнила, использовалась ли сама GPT-5 для создания диаграмм. Если это так, ошибки могут подорвать доверие к её способностям.
Этот случай стал напоминанием о том, что даже самые передовые технологии могут допускать ошибки, а прозрачность и ответственность остаются ключевыми для поддержания доверия аудитории.