阿里巴巴发布 Qwen 3：混合推理 AI 模型家族，挑战全球顶尖大模型

25-04-29

免费

快讯

阿里巴巴正式发布其最新一代人工智能模型家族 Qwen 3，涵盖从6亿到2350亿参数的八个模型版本，部分采用混合专家（MoE）架构，支持119种语言。Qwen 3 的核心亮点在于其“混合推理”能力，能够根据任务复杂度在快速响应与深度思考之间灵活切换，允许用户配置“思考预算”，在效率与准确性之间取得平衡。

其中，旗舰模型 Qwen-3-235B-A22B 在编程竞赛平台 Codeforces 上的表现超过了 OpenAI 的 o3-mini 和 Google 的 Gemini 2.5 Pro，并在数学推理基准测试 AIME 和 BFCL 上取得领先。尽管该模型尚未公开发布，但其他 Qwen 3 模型已在 Hugging Face 和 GitHub 上开放下载，延续了阿里巴巴在开源社区的积极布局。

Qwen 3 的发布正值中国 AI 竞争加剧之际。此前，初创公司 DeepSeek 推出的高性能、低成本 AI 模型引发市场震动，促使百度等巨头加快推出如 Ernie 4.5 Turbo 等先进模型。阿里巴巴则在 Qwen 2.5-Max 成功后，宣布未来三年将在 AI 和云计算领域投资超过 520 亿美元，创下公司历史新高。

截至2024年，Qwen 系列模型已吸引超过9万家企业客户，包括小米和完美世界游戏等，广泛应用于智能助手、游戏音频和动画生成等场景。此外，Qwen 模型在 Hugging Face 和 ModelScope 等开源平台的下载量已超过4000万次，显示出其在开发者社区的广泛影响力。

Qwen 3 的推出不仅展示了阿里巴巴在 AI 技术上的持续创新，也标志着中国科技企业在全球 AI 竞赛中的崛起。随着混合推理架构的引入和开源策略的推进，Qwen 3 有望在全球大模型领域占据一席之地。

Memo Team

Signal, not noise!

阿里巴巴发布 Qwen 3：混合推理 AI 模型家族，挑战全球顶尖大模型

Memo Newsletter