Mistral 发布首款开源音频 AI 模型 Voxtral，瞄准语音智能新赛道

25-07-16

免费

快讯

法国 AI 创企 Mistral AI 于 2025 年 7 月 15 日推出其首款开源语音 AI 模型系列 Voxtral，这是公司首次在音频方向发力。该模型采用 Apache 2.0 许可证发布，定位为高性能、低成本的语音解决方案，意在替代 OpenAI 的 Whisper 和 Google Gemini 等闭源高价 API。

Voxtral 支持多语言语音识别与生成，具备高级语义理解，可部署于生产环境。Mistral 称其可提供“状态级的语音理解”，而成本不到竞争对手的一半，并强调通过开放授权将语音智能民主化，打破闭源模型的门槛。

Voxtral 填补了市场上“便宜但误差高”的开源语音系统与“昂贵但封闭”的商业 API 之间的空白。它主打生产级准确率、语义理解能力和部署自由，使开发者无需在成本与性能之间妥协。

Memo Team

Signal, not noise!

Mistral 发布首款开源音频 AI 模型 Voxtral，瞄准语音智能新赛道

Memo Newsletter