登录
首页
快讯
邮件订阅
会员专属
Memo AI
联系我们

ElevenLabs 发布自家语音转文本模型

25-02-27
免费
快讯

ElevenLabs 推出首个独立语音转文字模型 Scribe,与 OpenAI Whisper 等竞争。这家估值 33 亿美元的公司此前专注文本转语音技术,如今进军语音检测领域。

Scribe 支持 99 种语言,其中 25 种语言的词错误率低于 5%,包括英语(97% 准确率)、法语、德语、日语等。基准测试显示,该模型在多种语言上的表现优于谷歌 Gemini 2.0 Flash 和 Whisper Large V3。

Scribe 具备智能说话人分割、单词级时间戳和自动标记声音事件等功能,可用于字幕生成。目前仅支持预录音频,低延迟实时版即将推出。定价为每小时 0.40 美元,但部分竞争对手提供更低价格。

Memo Newsletter

订阅 Memo 邮件列表,过滤噪音,捕捉最具价值的创投行业信号

最顶尖的 AI 行业创业者和投资人都在看

Subscribe
头像
Memo Team
Signal, not noise!
最新快讯