IT-новости

OpenAI представила GPT-4.5 какие задачи решает новая модель

OpenAI анонсировала запуск новой языковой модели GPT-4.5, представив ее в формате «исследовательского предварительного просмотра». Компания заявляет, что это ее самая мощная модель для общения, однако она значительно дороже предыдущих версий.

Кто может протестировать GPT-4.5?

На первом этапе доступ к модели получили подписчики ChatGPT Pro, а пользователи тарифов Plus и Team смогут опробовать новинку уже на следующей неделе.

GPT-4.5 использует традиционное масштабирование перед обучением и не включает механизмы рассуждений, как, например, модели o1 и o3-mini, которые анализируют вопрос перед тем, как дать ответ. Вместо этого GPT-4.5 действует как классическая языковая модель, напрямую генерируя текст, но на более высоком уровне.

Проверить работу модели можно на платформе BotHub, воспользовавшись реферальной ссылкой.

Чем примечательна новая модель?

В OpenAI отмечают, что GPT-4.5 (внутреннее кодовое имя – Orion) – самая крупная модель компании на данный момент. По словам исследователя Рафы Гонтихо Лопеса, она, вероятно, является крупнейшей в мире среди аналогов. Однако разработчики подчеркивают, что GPT-4.5 не относится к категории «пограничных моделей» – возможно, из-за существования более продвинутой версии o3.

Одним из главных недостатков модели является ее стоимость. GPT-4.5 стоит $75 за миллион входных токенов и $150 за миллион выходных, что делает ее значительно дороже, чем GPT-4o ($2.50/$10) и o1 ($15/$60). Это ставит под вопрос ее дальнейшее использование через API. При этом модель поддерживает контекст длиной 128 000 токенов, как и ее предшественник.

Как GPT-4.5 справляется с задачами?

OpenAI считает, что будущее ИИ за комбинированным подходом, совмещающим предварительное обучение и рассуждения. Хотя GPT-4.5 пока не обладает продвинутыми навыками анализа, она закладывает основу для будущих интеллектуальных агентов. По словам Сэма Альтмана, следующая версия — GPT-5 — объединит обе технологии.

В тестах производительности GPT-4.5 продемонстрировала заметное улучшение. В задании SimpleQA точность модели составила 62,5% против 38,2% у GPT-4o и 43,6% у Grok 3. Уровень галлюцинаций снизился с 61,8% до 37,1%. В тестах MMMLU и MMMU модель превзошла своих предшественников, достигнув 85,1% и 74,4% соответственно.

Однако в научных дисциплинах и математике GPT-4.5 уступает специализированным моделям рассуждений. Например, в тесте AIME'24 (математика) она набрала 36,7% против 9,3% у GPT-4o, но значительно отстала от o3-mini (87,3%). В кодировании GPT-4.5 показывает лучшие результаты в SWE-Lancer Diamond Test (32,6% против 23,3% у GPT-4o и 10,8% у o3-mini), однако при более высокой цене.

Что говорят эксперты?

Несмотря на улучшенные характеристики, эксперты не видят в GPT-4.5 радикального скачка вперед. Бывший сотрудник OpenAI Андрей Карпати отметил, что прогресс ощущается, но его трудно измерить. Он сравнил развитие моделей GPT с постепенным эволюционным ростом: от «несвязного» GPT-1 до GPT-3, который впервые показал коммерческую применимость.

GPT-4.5 — очередной шаг в этом процессе. «Все стало немного лучше, но без явных прорывов», — говорит Карпати.

Генеральный директор OpenAI Сэм Альтман добавил, что GPT-4.5 создает впечатление диалога с разумным собеседником: «Это первый ИИ, который дал мне совет, заставивший задуматься».

Итог

GPT-4.5 – это не революция, а постепенная доработка существующих технологий. Улучшение качества ответов, снижение числа ошибок и более точные предсказания делают модель ценным инструментом, но высокая стоимость ограничивает ее применение. Вопрос, станет ли GPT-4.5 основой для будущих версий OpenAI, остается открытым.

RU/KZ