Поддержать команду Зеркала
Беларусы на войне
  1. В Погранкомитете сделали заявление для водителей, которые собираются выезжать в Польшу
  2. В Нацбанке — нехватка работников. Какие зарплаты предлагают
  3. Эксперты рассказали, как плохая погода помогает российским войскам использовать ключевую уязвимость украинской обороны
  4. «Я отвечу: нет». Экс-командир полка Калиновского покинул пост и заявил, что подразделение уже не является полком по численности
  5. «Настроение поменялось». Если Польша откроет два пункта пропуска, как на это отреагирует официальный Минск — спросили у аналитика
  6. Автобусы в Польшу через «Берестовицу» запускает крупный перевозчик
  7. В МВД назвали шесть фраз, после которых беларусам следует завершить телефонный разговор
  8. К администрации Трампа и Госдепартаменту обратились из-за Лукашенко и Тихановской. Вот к чему их призывают
  9. Синоптики объявили на воскресенье желтый уровень опасности. Возможно, вы не ожидали такую погоду в ноябре
  10. Появились слухи, что после открытия «Кузницы» и «Бобровников» беларусы закроют на ремонт «Брест». Спросили у ГПК, так ли это
  11. Этот человек, похоже, не написал ни одного произведения, а его считают одним из важнейших поэтов Беларуси. Вот как так получилось
  12. Автор «лучшего сериала в истории» наконец-то выпустил новый — и, по словам критиков, опять создал шедевр. Рассказываем о нем
  13. Транспортники отреагировали на критику Лукашенко из-за очередей на маршрутки в часы пик
  14. По налогу на недвижимость хотят ввести новшество


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.