Представлено свежее обновление для ChatGPT под маркировкой GPT-4 04-09, и новая версия уже продемонстрировала свою значительную эффективность в области решения сложных математических задач на уровне олимпиад. Её успехи поражают, превзойдя предыдущую версию модели в этой сфере.
Для оценки её способностей, GPT-4 04-09 принял участие в AI Mathematical Olympiad Prize на платформе Kaggle. Перед обновлением GPT-4 решал только одну задачу, и то с длинным промтом, содержащим подсказки к решению. Новая же версия успешно справилась уже с 5 из 10 предложенных задач. В сравнении с конкурентом, моделью Claude 3 Opus, которая решила лишь одну задачу без подсказок, достижения GPT-4 04-09 выглядят более впечатляюще.
Сотрудники OpenAI в Twitter заметили значительный прогресс, особенно в области математики, отметив, что это "big improvement". Планируется интеграция обновленной модели в ChatGPT веб-версии с подпиской. Также ожидается, что скоро на платформе LMSYS Arena будут доступны данные, подтверждающие впечатляющий прогресс модели.
Выход новой версии GPT-4 совпал с обновлением рейтинга, где модель CMD-R+ от Cohere на 100B+ параметров обогнала предыдущие версии GPT-4 весной 2023 года. Однако Claude 3 Opus по-прежнему уверенно занимает первое место. Ожидается публикация метрик, подтверждающих рост качества рассуждений и способностей GPT-4 в математике.
Это свидетельствует о новом этапе развития моделей, стимулируемом быстрорастущей конкуренцией. Свежая модель GPT-4 устанавливает новые стандарты на данном этапе развития.