Поддержать команду Зеркала
Беларусы на войне
  1. Трамп заявил, что Зеленский может «завершить войну практически немедленно», и предложил для этого отказаться от двух вещей
  2. Несколько пенсионных изменений появится в скором времени — рассказываем
  3. «Почему-то развернули семью из четырех человек». Что пишут в чатах беларусы, которые почти сутки ждут выезда в Польшу
  4. Трамп выразил надежду на скорое освобождение «1300» человек в Беларуси
  5. «Больше похоже на капитуляцию». Главные выводы мировых СМИ о встрече Трампа и Путина
  6. Путин показал, что не заинтересован в серьезных мирных переговорах с Украиной — ISW
  7. «Почтальонша закричала, что шифровки больше доставлять не будет». Эти минчане в 80-х устраивали очень креативные акции — рассказываем
  8. Доллар больше не будет таким дешевым: новые причины для роста выше трех рублей. Прогноз по валютам
  9. «Я приехал и уехал, а вам жить вместе». Макс Корж прокомментировал скандал, связанный с его концертом в Варшаве
  10. Лукашенко провел телефонный разговор с Путиным
  11. Стало известно, какие требования выдвинул Путин на Аляске для завершения войны в Украине
  12. Производителя мороженого признали банкротом — подробности
  13. «Газ идет отовсюду, я чувствую, что умираю». Среди сотен жертв этой жуткой катастрофы, изменившей Европу, был и беларус — рассказываем
  14. Беларуска удалила в Telegram переписку «для всех», но через неделю она «всплыла» у ее собеседника. Спросили у экспертов, как такое могло произойти


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.