OpenAI представила GPT-5.2
12.12.2025
42
Команда SpellBook рада сообщить о важном событии в мире искусственного интеллекта: OpenAI официально анонсировала выход GPT-5.2 — новейшей и самой мощной модели в линейке GPT.
По данным OpenAI, пользователи ChatGPT Enterprise уже экономят от 40 до 60 минут рабочего времени ежедневно, а наиболее активные пользователи сообщают об экономии более 10 часов в неделю. GPT-5.2 создана, чтобы вывести эту эффективность на принципиально новый уровень.
Что нового в GPT-5.2? Модель демонстрирует значительные улучшения в ключевых областях:
- Создание таблиц и презентаций — более структурированные и профессиональные результаты
- Написание и анализ кода — новый стандарт качества в программировании
- Анализ изображений — существенно улучшенное понимание визуальной информации
- Работа с длинными контекстами — точность сохраняется при обработке сотен тысяч токенов
- Использование инструментов — надёжное выполнение сложных многоэтапных задач
Что нового в GPT-5.2? Модель демонстрирует значительные улучшения в ключевых областях:
- Создание таблиц и презентаций — более структурированные и профессиональные результаты
- Написание и анализ кода — новый стандарт качества в программировании
- Анализ изображений — существенно улучшенное понимание визуальной информации
- Работа с длинными контекстами — точность сохраняется при обработке сотен тысяч токенов
- Использование инструментов — надёжное выполнение сложных многоэтапных задач
Ключевые показатели производительности
GPT-5.2 устанавливает новые рекорды практически по всем ключевым бенчмаркам:
GPT-5.2 устанавливает новые рекорды практически по всем ключевым бенчмаркам:
| Бенчмарк | Область применения | GPT-5.2 Thinking | GPT-5.1 Thinking |
|---|---|---|---|
| GDPval | Профессиональные задачи | 70,9% | 38,8% |
| SWE-Bench Pro | Программирование | 55,6% | 50,8% |
| SWE-bench Verified | Программирование | 80,0% | 76,3% |
| GPQA Diamond | Научные вопросы | 92,4% | 88,1% |
| AIME 2025 | Математические олимпиады | 100,0% | 94,0% |
| FrontierMath (Tier 1–3) | Высшая математика | 40,3% | 31,0% |
| ARC-AGI-2 (Verified) | Абстрактное мышление | 52,9% | 17,6% |
Профессиональная эффективность на уровне экспертов
GPT-5.2 Thinking — первая модель, которая выполняет профессиональные задачи на уровне или выше уровня человека-эксперта. По результатам независимой оценки на бенчмарке GDPval (охватывающем 44 профессии из 9 ведущих отраслей экономики США), модель превосходит или показывает результаты на уровне профессионалов в 70,9% случаев.
При этом GPT-5.2 выполняет задачи более чем в 11 раз быстрее и стоит менее 1% от стоимости работы эксперта.
Один из экспертов-оценщиков отметил: «Это заметный скачок в качестве. Результат выглядит так, будто его подготовила профессиональная команда с продуманным дизайном и структурой».
При этом GPT-5.2 выполняет задачи более чем в 11 раз быстрее и стоит менее 1% от стоимости работы эксперта.
Один из экспертов-оценщиков отметил: «Это заметный скачок в качестве. Результат выглядит так, будто его подготовила профессиональная команда с продуманным дизайном и структурой».
Меньше ошибок — больше доверия
GPT-5.2 значительно снизила количество галлюцинаций по сравнению с предыдущей версией. На реальных запросах пользователей ChatGPT количество ответов с ошибками сократилось на 30%.
Это делает модель более надёжной для исследований, аналитики, написания текстов и поддержки принятия решений.
GPT-5.2 значительно снизила количество галлюцинаций по сравнению с предыдущей версией. На реальных запросах пользователей ChatGPT количество ответов с ошибками сократилось на 30%.
| Показатель | GPT-5.2 Thinking | GPT-5.1 Thinking |
|---|---|---|
| Ответы без ошибок (с поиском) | 93,9% | 91,2% |
| Ответы без ошибок (без поиска) | 88,0% | 87,3% |
Это делает модель более надёжной для исследований, аналитики, написания текстов и поддержки принятия решений.
Работа с длинными документами
GPT-5.2 устанавливает новый стандарт в понимании длинных контекстов. Модель способна интегрировать информацию, распределённую по документам объёмом в сотни тысяч токенов, сохраняя при этом высокую точность.
Это открывает возможности для работы с объёмными отчётами, контрактами, научными статьями, транскриптами и многофайловыми проектами — модель сохраняет связность и точность на протяжении всего документа.
Улучшенное компьютерное зрение
GPT-5.2 — самая сильная модель OpenAI в области анализа изображений. Количество ошибок при интерпретации графиков и пользовательских интерфейсов сократилось примерно вдвое.
Модель теперь точнее интерпретирует дашборды, скриншоты продуктов, технические диаграммы и визуальные отчёты.
Надёжное использование инструментов
GPT-5.2 достигает 98,7% точности на бенчмарке Tau2-bench Telecom, демонстрируя способность надёжно использовать инструменты в рамках длительных многоходовых задач.
Наука и математика
OpenAI позиционирует GPT-5.2 как лучшую модель в мире для помощи учёным и исследователям.
GPT-5.2 Pro стала первой моделью, преодолевшей порог в 90% на бенчмарке ARC-AGI-1, при этом снизив стоимость достижения такого результата примерно в 390 раз.
GPT-5.2 устанавливает новый стандарт в понимании длинных контекстов. Модель способна интегрировать информацию, распределённую по документам объёмом в сотни тысяч токенов, сохраняя при этом высокую точность.
Это открывает возможности для работы с объёмными отчётами, контрактами, научными статьями, транскриптами и многофайловыми проектами — модель сохраняет связность и точность на протяжении всего документа.
| Тест OpenAI MRCRv2 (8 needles) | GPT-5.2 Thinking | GPT-5.1 Thinking |
|---|---|---|
| 4k–8k токенов | 98,2% | 65,3% |
| 32k–64k токенов | 92,0% | 37,8% |
| 128k–256k токенов | 77,0% | 29,6% |
Улучшенное компьютерное зрение
GPT-5.2 — самая сильная модель OpenAI в области анализа изображений. Количество ошибок при интерпретации графиков и пользовательских интерфейсов сократилось примерно вдвое.
| Бенчмарк | GPT-5.2 Thinking | GPT-5.1 Thinking |
|---|---|---|
| CharXiv Reasoning (анализ научных графиков) | 88,7% | 80,3% |
| ScreenSpot-Pro (понимание интерфейсов) | 86,3% | 64,2% |
Модель теперь точнее интерпретирует дашборды, скриншоты продуктов, технические диаграммы и визуальные отчёты.
Надёжное использование инструментов
GPT-5.2 достигает 98,7% точности на бенчмарке Tau2-bench Telecom, демонстрируя способность надёжно использовать инструменты в рамках длительных многоходовых задач.
| Бенчмарк | GPT-5.2 Thinking | GPT-5.1 Thinking |
|---|---|---|
| Tau2-bench Telecom | 98,7% | 95,6% |
| Tau2-bench Retail | 82,0% | 77,9% |
| BrowseComp | 65,8% | 50,8% |
Наука и математика
OpenAI позиционирует GPT-5.2 как лучшую модель в мире для помощи учёным и исследователям.
| Бенчмарк | GPT-5.2 Thinking | GPT-5.2 Pro | GPT-5.1 Thinking |
|---|---|---|---|
| GPQA Diamond (наука) | 92,4% | 93,2% | 88,1% |
| AIME 2025 (математика) | 100,0% | 100,0% | 94,0% |
| FrontierMath Tier 1–3 | 40,3% | — | 31,0% |
| ARC-AGI-1 (Verified) | 86,2% | 90,5% | 72,8% |
GPT-5.2 Pro стала первой моделью, преодолевшей порог в 90% на бенчмарке ARC-AGI-1, при этом снизив стоимость достижения такого результата примерно в 390 раз.
Три версии модели
OpenAI выпускает GPT-5.2 в трёх вариантах:
- GPT-5.2 Instant — быстрая модель для повседневных задач: поиск информации, инструкции, технические тексты, переводы
- GPT-5.2 Thinking — для углублённой работы: программирование, анализ документов, математические задачи, планирование
- GPT-5.2 Pro — для самых сложных вопросов, где важнее качество, а не скорость
OpenAI выпускает GPT-5.2 в трёх вариантах:
- GPT-5.2 Instant — быстрая модель для повседневных задач: поиск информации, инструкции, технические тексты, переводы
- GPT-5.2 Thinking — для углублённой работы: программирование, анализ документов, математические задачи, планирование
- GPT-5.2 Pro — для самых сложных вопросов, где важнее качество, а не скорость
Безопасность
GPT-5.2 продолжает развитие подхода safe completion, внедрённого в GPT-5. Модель демонстрирует улучшенные показатели в чувствительных областях: реагирование на признаки суицидальных мыслей, поддержка при психологическом стрессе, предотвращение эмоциональной зависимости от модели.
Стоимость API
Несмотря на более высокую стоимость за токен, GPT-5.2 зачастую оказывается экономичнее благодаря большей эффективности: модель решает задачи за меньшее количество токенов.
GPT-5.2 продолжает развитие подхода safe completion, внедрённого в GPT-5. Модель демонстрирует улучшенные показатели в чувствительных областях: реагирование на признаки суицидальных мыслей, поддержка при психологическом стрессе, предотвращение эмоциональной зависимости от модели.
| Показатель | GPT-5.2 Instant | GPT-5.1 Instant | GPT-5.2 Thinking | GPT-5.1 Thinking |
|---|---|---|---|---|
| Психическое здоровье | 0,995 | 0,883 | 0,915 | 0,684 |
| Эмоциональная зависимость | 0,938 | 0,945 | 0,955 | 0,785 |
| Самоповреждение | 0,938 | 0,925 | 0,963 | 0,937 |
Стоимость API
| Модель | Входные токены (за 1M) | Кэшированные (за 1M) | Выходные токены (за 1M) |
|---|---|---|---|
| gpt-5.2 / gpt-5.2-chat-latest | $1,75 | $0,175 | $14 |
| gpt-5.2-pro | $21 | — | $168 |
| gpt-5.1 / gpt-5.1-chat-latest | $1,25 | $0,125 | $10 |
Несмотря на более высокую стоимость за токен, GPT-5.2 зачастую оказывается экономичнее благодаря большей эффективности: модель решает задачи за меньшее количество токенов.
GPT-5.2 уже на SpellBook
Мы рады сообщить, что GPT-5.2 уже доступна на платформе SpellBook. Пользователи нашей платформы получают доступ к самой передовой модели OpenAI — с улучшенным пониманием контекста, повышенной точностью, продвинутой работой с документами и изображениями, а также надёжным выполнением сложных многоэтапных задач.
Начните использовать GPT-5.2 на SpellBook уже сегодня и оцените новый уровень возможностей искусственного интеллекта в вашей работе.
Мы рады сообщить, что GPT-5.2 уже доступна на платформе SpellBook. Пользователи нашей платформы получают доступ к самой передовой модели OpenAI — с улучшенным пониманием контекста, повышенной точностью, продвинутой работой с документами и изображениями, а также надёжным выполнением сложных многоэтапных задач.
Начните использовать GPT-5.2 на SpellBook уже сегодня и оцените новый уровень возможностей искусственного интеллекта в вашей работе.