OpenAI допустила ошибки на презентации GPT-5: Альтман признал промах

Во время презентации новой модели искусственного интеллекта GPT-5 компания OpenAI оказалась в центре внимания из-за серьёзных ошибок в демонстрационных диаграммах. Графики, которые должны были подчеркнуть превосходство GPT-5, содержали неточности, вызвавшие вопросы у аудитории. В этой статье мы разберём, что именно пошло не так, как компания отреагировала на критику и что это значит для будущего GPT-5. Читатель узнает о ключевых моментах инцидента и его последствиях для репутации OpenAI.

Ошибки в диаграммах: что пошло не так?

Неправильная шкала значений

  • Диаграмма, иллюстрирующая «оценку склонности к обману», содержала ошибки в шкале. Например, для GPT-5 было указано значение 50,0 %, а для модели o3 — 47,4 %, но столбец o3 оказался выше.
  • Корпоративный блог OpenAI позже указал, что правильное значение для GPT-5 составляет 16,5 %, что значительно отличается от первоначальных данных.

Некорректное отображение результатов

  • В тесте SWE-bench Verified результаты GPT-5 и o3 были перепутаны: более низкий показатель GPT-5 отображался как более высокий столбец.
  • Результаты o3 и GPT-4o, хотя и различались, были представлены столбцами одинакового размера, что вводило зрителей в заблуждение.

Реакция OpenAI и Сэма Альтмана

Компания восприняла ошибку всерьёз. Генеральный директор OpenAI Сэм Альтман публично признал промах и заверил, что корректные версии диаграмм уже опубликованы в корпоративном блоге. «Мы стремимся к прозрачности и точности, и такие ошибки неприемлемы», — заявил Альтман.

Последствия для репутации GPT-5

Вопросы к доверию

  • Инцидент вызвал сомнения в точности данных, представленных на презентации, особенно с учётом заявлений о снижении уровня галлюцинаций у GPT-5.

Неясность в использовании GPT-5

  • OpenAI не уточнила, использовалась ли сама GPT-5 для создания диаграмм. Если это так, ошибки могут подорвать доверие к её способностям.

Этот случай стал напоминанием о том, что даже самые передовые технологии могут допускать ошибки, а прозрачность и ответственность остаются ключевыми для поддержания доверия аудитории.

Вам может быть интересно:

comment Нет комментариев

Вы можете первым оставить комментарий!

mode_editКомментарий:

1
menu
menu