OpenAI o3-mini – модели для STEM, кода и математики

OpenAI продолжает совершенствовать искусственный интеллект, представляя новую модель o3-mini – наиболее экономичную и быструю в семействе рассуждающих моделей. Выпущенная для использования в ChatGPT и через API, o3-mini уже доступна для разработчиков и пользователей платных подписок, а бесплатные пользователи могут испытать её через специальную кнопку «Reason».

Расширенные возможности и гибкость

Одним из ключевых новшеств является поддержка трёх режимов рассуждения: low, medium и high.

Low обеспечивает базовую работу с минимальными затратами времени.
Medium представляет баланс между скоростью и точностью, что подходит для большинства повседневных задач.
High нацелен на выполнение сложных задач, требующих максимальной точности и глубины рассуждений, хотя за это приходится платить чуть большей задержкой в ответе.

Эта гибкость позволяет разработчикам выбирать оптимальный режим для конкретных кейсов: будь то задачи по программированию, математике или научные вопросы. Помимо этого, модель поддерживает такие функции, как вызов функций, структурированные выводы и сообщения для разработчиков, что делает её «production-ready» с первого дня использования.

Оптимизация для STEM-задач

Одним из приоритетов при разработке o3-mini стала высокая эффективность в STEM-дисциплинах. Тестовые оценки показывают, что модель демонстрирует значительный прогресс в решении математических задач, научных вопросов уровня PhD и задач по конкурентному программированию.

Математика: при использовании режима high точность достигает 83,6% на конкурсных задачах, например, AIME 2024.
Наука: оценки по сложным вопросам из области биологии, химии и физики достигают 77% точности.
Программирование: в соревнованиях по кодингу, таких как Codeforces, модель показывает существенный прирост в Elo-рейтинге, достигая 2073 баллов.

o3-mini high нейросеть

Кроме того, o3-mini демонстрирует улучшенную скорость: ответы генерируются в среднем на 24% быстрее, а время до первого токена сократилось примерно на 2500 мс по сравнению с предшественником o1-mini.

Надёжность и безопасность

Особое внимание уделено безопасности. Применение техники deliberative alignment позволяет модели сначала оценить соответствие человеческим требованиям безопасности, прежде чем отвечать на запросы пользователя. Благодаря этому, o3-mini успешно справляется с задачами безопасности и противодействует попыткам обхода ограничений (jailbreak), что подтверждено сравнительными тестами с другими моделями, включая GPT-4o.

Экономичность и масштабируемость

Экономичный подход к разработке не только снижает затраты на вычислительные ресурсы, но и уменьшает стоимость обработки каждого токена. OpenAI удалось сократить расходы на интеллект на 95% с момента запуска GPT-4, что позволяет сделать высококачественный искусственный интеллект более доступным. Пользователи платных подписок получают расширенные возможности, включая увеличение лимита сообщений – от 50 до 150 сообщений в день для ChatGPT Plus и Team, а Pro-пользователи получают неограниченный доступ.

Итоги и перспективы

Выпуск OpenAI o3-mini и её варианта o3-mini-high демонстрирует, что даже компактные модели могут конкурировать с более крупными аналогами по точности, скорости и функциональности. Оптимизированные для STEM-задач, эти модели становятся незаменимыми инструментами для решения сложных логических, математических и программных задач, оставаясь при этом экономичными и быстрыми.

Новые модели подтверждают стремление OpenAI расширять границы возможностей искусственного интеллекта, делая его доступным для самых разных сфер применения. Разработчики и пользователи уже сегодня могут воспользоваться преимуществами o3-mini, а в будущем нас ждут ещё более амбициозные проекты, сочетающие высокую производительность, безопасность и эффективность.

OpenAI o3-mini и o3-mini-high

Расширенные возможности и гибкость

Оптимизация для STEM-задач

Надёжность и безопасность

Экономичность и масштабируемость

Итоги и перспективы

Сводка

Категории

Оглавление

Больше статей

Чем отличаются нейросети от искусственного интеллекта

Как меня видит нейросеть

Как оплачивать подписки на нейросети

OpenAI o3-mini и o3-mini-high

Расширенные возможности и гибкость

Оптимизация для STEM-задач

Надёжность и безопасность

Экономичность и масштабируемость

Итоги и перспективы

Сводка

Категории

Оглавление

Больше статей

Чем отличаются нейросети от искусственного интеллекта

Как меня видит нейросеть

Как оплачивать подписки на нейросети

Рассылка

Расскажем о выходе новых нейросетей