Qwen 2.5: нейросеть от Alibaba

Qwen 2.5 — это новая версия крупной языковой модели LLM от китайской технологической корпорации Alibaba. Разработка ведётся облачным подразделением компании Alibaba Cloud, специализирующимся на сервисах искусственного интеллекта и облачных вычислениях.

Релиз Qwen 2.5-Max был анонсирован в не совсем типичное для деловых объявлений время: в первый день празднования Китайского Нового года. Этот шаг эксперты связывают с усиливающейся конкурентной гонкой в Китае и мире — на фоне шумихи, вызванной стремительным развитием стартапа DeepSeek и выпуском им модели DeepSeek-V3.

Причины ажиотажа и «гонка вооружений» с DeepSeek

Низкие затраты DeepSeek

Стартап утверждает, что построил свою модель DeepSeek-V3 за сумму около 5,6 млн долларов, используя менее мощные чипы Nvidia H800, специально разрешённые к продаже в КНР. Это ставит под сомнение огромные бюджеты, которые крупные игроки, включая Alibaba, Baidu, Tencent и западные компании, тратят на развитие нейросетей.

Открытость и ценовая конкуренция

Предыдущая модель DeepSeek-V2 была открытой и предлагала крайне низкую стоимость использования — всего 1 юань ($0,14) за 1 млн токенов. Это вынудило Alibaba, Baidu и других китайских лидеров существенно снизить расценки на собственные AI-платформы.

Глобальный эффект

После релизов DeepSeek рынки США и Европы отреагировали резким падением акций технологического сектора. Особенно заметно это затронуло крупные AI-ориентированные корпорации, например Nvidia.

Ответ Alibaba

Обновлённая версия Qwen 2.5-Max — прямой ответ на стремительный рост DeepSeek, демонстрирующий готовность Alibaba продолжать конкурировать как на внутреннем, так и на внешнем рынке.

Что умеет чат-бот Qwen

Генерирует видео и создаёт изображения на основе заданных сценариев.
Анализирует информацию, включая большие объёмы текстовых данных.
Пишет тексты для разных сфер и пишет код на нескольких языках программирования.
Уже сейчас работает в офлайн-режиме, а в скором времени будет доступен веб-поиск для актуальных данных.

Ключевые особенности и возможности

По данным Alibaba Cloud, Qwen 2.5-Max показывает результаты, сопоставимые или даже превосходящие показатели таких популярных решений, как:

GPT-4 от OpenAI;
DeepSeek-V3 и более новая R1 для задач рассуждения;
Llama-3.1-405B от Meta.

На MMLU (Massive Multitask Language Understanding) — одном из ключевых наборов для проверки знаний и понимания широкого круга дисциплин — Qwen 2.5-Max продемонстрировала «лидирующую в мире» производительность. На LiveCodeBench — тесте, оценивающем качество и корректность генерации кода, модель также показывает результаты на уровне лучших открытых и закрытых решений.

По заявлениям разработчиков, новый релиз улучшил навыки в:

Генерации и отладки кода на разных языках программирования,
Решении сложных логических и математических задач,
Подробном «пошаговом» chain-of-thought рассуждении.

Хотя основной упор в релизе Qwen 2.5-Max делается именно на языковые задачи, внутри Alibaba Cloud и сообщества ведётся работа над версиями с поддержкой анализа изображений и комплексного мультизадачного взаимодействия. Например, экспериментальный прототип QVQ (Qwen Vision+Query) ориентирован на совмещение визуального анализа и линейного рассуждения, что делает модель ближе к универсальному ассистенту.

Планы Alibaba по развитию Qwen Chat

Qwen Chat позиционируется как универсальный инструмент для клиентов и партнёров Alibaba Cloud: от автоматизации общения в e-commerce до внутренних корпоративных сервисов.

Текущие достижения в моделях типа QVQ Qwen2-VL позволяют предположить, что в будущем Qwen Chat сможет эффективно работать с текстом, изображениями и, возможно, другими типами данных - аудио, видео.

Alibaba стремится предложить «альтернативу» американским лидерам OpenAI, Anthropic, Microsoft, одновременно соревнуясь с Meta Llama и молодыми китайскими игроками DeepSeek, ByteDance, Baidu. Компания подчёркивает важность открытых весов и сотрудничества с сообществом разработчиков. Будут продолжены эксперименты с удешевлением обучения и ускорением вывода inference.

В долгосрочной перспективе Alibaba поддерживает исследования в области «искусственного общего интеллекта» AGI. Несмотря на более корпоративную структуру, руководители компании заявляют о стремлении соперничать с амбициозным подходом DeepSeek, для которых главным приоритетом является наука и «достижение AGI любой ценой».

Интересные факты

Запуски DeepSeek-V3 и Qwen 2.5-Max сопровождались ощутимыми колебаниями на фондовых рынках США, Азии и Европы.
Президент Дональд Трамп, комментируя рыночные потрясения, назвал развитие китайского AI «пробуждающим сигналом» и призвал американские компании «не упускать лидерство».
Повторная эскалация «торговой войны» между США и КНР не исключена. Новый виток напряжённости связан с поставками высокопроизводительных GPU и лицензированием использования облачных дата-центров для обучения больших моделей.

Qwen 2.5

Описание

Причины ажиотажа и «гонка вооружений» с DeepSeek

Низкие затраты DeepSeek

Открытость и ценовая конкуренция

Глобальный эффект

Ответ Alibaba

Что умеет чат-бот Qwen

Ключевые особенности и возможности

Планы Alibaba по развитию Qwen Chat

Интересные факты

Сводка

Категории

Теги

Mini Telegram

Может быть интересно

RapidCanvas

RelicX

Retool

Qwen 2.5

Описание

Причины ажиотажа и «гонка вооружений» с DeepSeek

Низкие затраты DeepSeek

Открытость и ценовая конкуренция

Глобальный эффект

Ответ Alibaba

Что умеет чат-бот Qwen

Ключевые особенности и возможности

Планы Alibaba по развитию Qwen Chat

Интересные факты

Сводка

Категории

Теги

Mini Telegram

Может быть интересно

RapidCanvas

RelicX

Retool

Рассылка

Расскажем о выходе новых нейросетей