Вы можете отправить нам 1,5% своих польских налогов
Беларусы на войне
  1. Бывшая политзаключенная Наталья Левая, которую освободили из колонии на последних месяцах беременности, родила ребенка
  2. «Как бы они на меня сегодня ни обиделись». Лукашенко потребовал ужесточать подготовку водителей
  3. Девочке с СМА, которой собрали 1,8 млн долларов на самый дорогой в мире укол, врачи сказали: «Не показано». Как так?
  4. В районе минского мотовелозавода снесут «малоценную застройку», жильцы уже отселены. Что там построят
  5. Назван самый привлекательный город для туризма в Беларуси — и это не областной центр или Минск
  6. Евросоюз принял 20-й пакет санкций против России — туда попали и две беларусские компании
  7. После жалоб преподавателя руководство БГУИР опубликовало данные по зарплате в учебном заведении
  8. В Беларуси выросли ставки утилизационного сбора
  9. Этого классика беларусской литературы расстреляли в 45 лет, но он успел сделать столько, сколько удалось немногим. Вот о ком речь
  10. Ввели валютное ограничение для населения
  11. Трех беларусов будут судить за измену государству


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.