阿里巴巴发布 Qwen 3:混合推理 AI 模型家族,挑战全球顶尖大模型
阿里巴巴正式发布其最新一代人工智能模型家族 Qwen 3,涵盖从6亿到2350亿参数的八个模型版本,部分采用混合专家(MoE)架构,支持119种语言。Qwen 3 的核心亮点在于其“混合推理”能力,能够根据任务复杂度在快速响应与深度思考之间灵活切换,允许用户配置“思考预算”,在效率与准确性之间取得平衡 。
其中,旗舰模型 Qwen-3-235B-A22B 在编程竞赛平台 Codeforces 上的表现超过了 OpenAI 的 o3-mini 和 Google 的 Gemini 2.5 Pro,并在数学推理基准测试 AIME 和 BFCL 上取得领先。尽管该模型尚未公开发布,但其他 Qwen 3 模型已在 Hugging Face 和 GitHub 上开放下载,延续了阿里巴巴在开源社区的积极布局 。
Qwen 3 的发布正值中国 AI 竞争加剧之际。此前,初创公司 DeepSeek 推出的高性能、低成本 AI 模型引发市场震动,促使百度等巨头加快推出如 Ernie 4.5 Turbo 等先进模型。阿里巴巴则在 Qwen 2.5-Max 成功后,宣布未来三年将在 AI 和云计算领域投资超过 520 亿美元,创下公司历史新高 。
截至2024年,Qwen 系列模型已吸引超过9万家企业客户,包括小米和完美世界游戏等,广泛应用于智能助手、游戏音频和动画生成等场景 。此外,Qwen 模型在 Hugging Face 和 ModelScope 等开源平台的下载量已超过4000万次,显示出其在开发者社区的广泛影响力 。
Qwen 3 的推出不仅展示了阿里巴巴在 AI 技术上的持续创新,也标志着中国科技企业在全球 AI 竞赛中的崛起。随着混合推理架构的引入和开源策略的推进,Qwen 3 有望在全球大模型领域占据一席之地。