Категории
© AIDive | 2025 | Все права защищены.
Нейросеть от Алибаба для конкуренции с ChatGPT и DeepSeek. Может генерировать текст, изображение и видео.
Qwen Chat — это новая версия крупной языковой модели LLM от китайской технологической корпорации Alibaba. Разработка ведётся облачным подразделением компании Alibaba Cloud, специализирующимся на сервисах искусственного интеллекта и облачных вычислениях.
Релиз Qwen 2.5-Max был анонсирован в не совсем типичное для деловых объявлений время: в первый день празднования Китайского Нового года. Этот шаг эксперты связывают с усиливающейся конкурентной гонкой в Китае и мире — на фоне шумихи, вызванной стремительным развитием стартапа DeepSeek и выпуском им модели DeepSeek-V3.
Стартап утверждает, что построил свою модель DeepSeek-V3 за сумму около 5,6 млн долларов, используя менее мощные чипы Nvidia H800, специально разрешённые к продаже в КНР. Это ставит под сомнение огромные бюджеты, которые крупные игроки, включая Alibaba, Baidu, Tencent и западные компании, тратят на развитие нейросетей.
Предыдущая модель DeepSeek-V2 была открытой и предлагала крайне низкую стоимость использования — всего 1 юань ($0,14) за 1 млн токенов. Это вынудило Alibaba, Baidu и других китайских лидеров существенно снизить расценки на собственные AI-платформы.
После релизов DeepSeek рынки США и Европы отреагировали резким падением акций технологического сектора. Особенно заметно это затронуло крупные AI-ориентированные корпорации, например Nvidia.
Обновлённая версия Qwen 2.5-Max — прямой ответ на стремительный рост DeepSeek, демонстрирующий готовность Alibaba продолжать конкурировать как на внутреннем, так и на внешнем рынке.
По данным Alibaba Cloud, Qwen 2.5-Max показывает результаты, сопоставимые или даже превосходящие показатели таких популярных решений, как:
На MMLU (Massive Multitask Language Understanding) — одном из ключевых наборов для проверки знаний и понимания широкого круга дисциплин — Qwen 2.5-Max продемонстрировала «лидирующую в мире» производительность. На LiveCodeBench — тесте, оценивающем качество и корректность генерации кода, модель также показывает результаты на уровне лучших открытых и закрытых решений.
По заявлениям разработчиков, новый релиз улучшил навыки в:
Хотя основной упор в релизе Qwen 2.5-Max делается именно на языковые задачи, внутри Alibaba Cloud и сообщества ведётся работа над версиями с поддержкой анализа изображений и комплексного мультизадачного взаимодействия. Например, экспериментальный прототип QVQ (Qwen Vision+Query) ориентирован на совмещение визуального анализа и линейного рассуждения, что делает модель ближе к универсальному ассистенту.
Qwen Chat позиционируется как универсальный инструмент для клиентов и партнёров Alibaba Cloud: от автоматизации общения в e-commerce до внутренних корпоративных сервисов.
Текущие достижения в моделях типа QVQ Qwen2-VL позволяют предположить, что в будущем Qwen Chat сможет эффективно работать с текстом, изображениями и, возможно, другими типами данных - аудио, видео.
Alibaba стремится предложить «альтернативу» американским лидерам OpenAI, Anthropic, Microsoft, одновременно соревнуясь с Meta Llama и молодыми китайскими игроками DeepSeek, ByteDance, Baidu. Компания подчёркивает важность открытых весов и сотрудничества с сообществом разработчиков. Будут продолжены эксперименты с удешевлением обучения и ускорением вывода inference.
В долгосрочной перспективе Alibaba поддерживает исследования в области «искусственного общего интеллекта» AGI. Несмотря на более корпоративную структуру, руководители компании заявляют о стремлении соперничать с амбициозным подходом DeepSeek, для которых главным приоритетом является наука и «достижение AGI любой ценой».