OpenAI o3-mini и o3-mini-high

Узнайте о новой модели OpenAI o3-mini и её варианте o3-mini-high – оптимизированных для STEM задач, быстрых, безопасных и экономичных решениях для программирования, науки и математики.

OpenAI o3-mini и o3-mini-high

OpenAI продолжает совершенствовать искусственный интеллект, представляя новую модель o3-mini – наиболее экономичную и быструю в семействе рассуждающих моделей. Выпущенная для использования в ChatGPT и через API, o3-mini уже доступна для разработчиков и пользователей платных подписок, а бесплатные пользователи могут испытать её через специальную кнопку «Reason».

Расширенные возможности и гибкость

Одним из ключевых новшеств является поддержка трёх режимов рассуждения: low, medium и high.

  • Low обеспечивает базовую работу с минимальными затратами времени.
  • Medium представляет баланс между скоростью и точностью, что подходит для большинства повседневных задач.
  • High нацелен на выполнение сложных задач, требующих максимальной точности и глубины рассуждений, хотя за это приходится платить чуть большей задержкой в ответе.

Эта гибкость позволяет разработчикам выбирать оптимальный режим для конкретных кейсов: будь то задачи по программированию, математике или научные вопросы. Помимо этого, модель поддерживает такие функции, как вызов функций, структурированные выводы и сообщения для разработчиков, что делает её «production-ready» с первого дня использования.

Оптимизация для STEM-задач

Одним из приоритетов при разработке o3-mini стала высокая эффективность в STEM-дисциплинах. Тестовые оценки показывают, что модель демонстрирует значительный прогресс в решении математических задач, научных вопросов уровня PhD и задач по конкурентному программированию.

  • Математика: при использовании режима high точность достигает 83,6% на конкурсных задачах, например, AIME 2024.
  • Наука: оценки по сложным вопросам из области биологии, химии и физики достигают 77% точности.
  • Программирование: в соревнованиях по кодингу, таких как Codeforces, модель показывает существенный прирост в Elo-рейтинге, достигая 2073 баллов.

Кроме того, o3-mini демонстрирует улучшенную скорость: ответы генерируются в среднем на 24% быстрее, а время до первого токена сократилось примерно на 2500 мс по сравнению с предшественником o1-mini.

Надёжность и безопасность

Особое внимание уделено безопасности. Применение техники deliberative alignment позволяет модели сначала оценить соответствие человеческим требованиям безопасности, прежде чем отвечать на запросы пользователя. Благодаря этому, o3-mini успешно справляется с задачами безопасности и противодействует попыткам обхода ограничений (jailbreak), что подтверждено сравнительными тестами с другими моделями, включая GPT-4o.

Экономичность и масштабируемость

Экономичный подход к разработке не только снижает затраты на вычислительные ресурсы, но и уменьшает стоимость обработки каждого токена. OpenAI удалось сократить расходы на интеллект на 95% с момента запуска GPT-4, что позволяет сделать высококачественный искусственный интеллект более доступным. Пользователи платных подписок получают расширенные возможности, включая увеличение лимита сообщений – от 50 до 150 сообщений в день для ChatGPT Plus и Team, а Pro-пользователи получают неограниченный доступ.

Итоги и перспективы

Выпуск OpenAI o3-mini и её варианта o3-mini-high демонстрирует, что даже компактные модели могут конкурировать с более крупными аналогами по точности, скорости и функциональности. Оптимизированные для STEM-задач, эти модели становятся незаменимыми инструментами для решения сложных логических, математических и программных задач, оставаясь при этом экономичными и быстрыми.

Новые модели подтверждают стремление OpenAI расширять границы возможностей искусственного интеллекта, делая его доступным для самых разных сфер применения. Разработчики и пользователи уже сегодня могут воспользоваться преимуществами o3-mini, а в будущем нас ждут ещё более амбициозные проекты, сочетающие высокую производительность, безопасность и эффективность.

Мини-приложения в Telegram