Mistral 发布首款开源音频 AI 模型 Voxtral,瞄准语音智能新赛道
25-07-16
法国 AI 创企 Mistral AI 于 2025 年 7 月 15 日推出其首款开源语音 AI 模型系列 Voxtral,这是公司首次在音频方向发力。该模型采用 Apache 2.0 许可证发布,定位为高性能、低成本的语音解决方案,意在替代 OpenAI 的 Whisper 和 Google Gemini 等闭源高价 API。
Voxtral 支持多语言语音识别与生成,具备高级语义理解,可部署于生产环境。Mistral 称其可提供“状态级的语音理解”,而成本不到竞争对手的一半,并强调通过开放授权将语音智能民主化,打破闭源模型的门槛。
Voxtral 填补了市场上“便宜但误差高”的开源语音系统与“昂贵但封闭”的商业 API 之间的空白。它主打生产级准确率、语义理解能力和部署自由,使开发者无需在成本与性能之间妥协。