DeepL 发布 DeepL Voice,提供基于语音和视频的实时文本翻译
德国人工智能翻译服务公司 DeepL 最近推出了一项名为 DeepL Voice 的新功能,该功能能够实现从语音和视频中进行实时的文本翻译。DeepL 以其在线文本翻译服务而闻名,该公司声称其翻译比谷歌等公司的服务更为细腻和精确,这一优势使得 DeepL 的估值达到了 20 亿美元,拥有超过 10 万付费客户。
DeepL Voice 目前支持英语、德语、日语、韩语、瑞典语、荷兰语、法语、土耳其语、波兰语、葡萄牙语、俄语、西班牙语和意大利语等语言的“听力”功能,并且可以为 DeepL 翻译器支持的所有 33 种语言提供翻译字幕。这项服务主要针对实时对话和视频会议,以文本而非音频的形式呈现翻译结果。
DeepL Voice 的一个独特卖点是其能够实时工作,市场上许多所谓的“AI 翻译”服务实际上存在延迟,这使得它们难以或无法在实时情境中使用,而 DeepL 正是针对这一用例提供解决方案。DeepL 的创始人兼首席执行官 Jarek Kutylowski 暗示,虽然 DeepL Voice 是公司的第一个语音产品,但不太可能是最后一个。他表示,“语音是未来一年翻译服务发展的关键领域。”
目前,DeepL Voice 并不提供音频输出功能,也没有为语音产品提供 API。DeepL 的主要业务集中在 B2B 领域,Kutylowski 表示公司正在直接与合作伙伴和客户合作。目前,唯一支持 DeepL 字幕的视频通话服务是 Teams,Kutylowski 表示这“覆盖了我们的大多数客户”,尚未有关于 Zoom 或 Google Meet 是否会在未来集成 DeepL Voice 的消息。
Kutylowski 还提到,DeepL Voice 的另一个主要用例是在服务行业,例如餐厅的前线工作人员可以使用这项服务更轻松地与客户沟通。尽管这项服务可能很有用,但在一个对数据保护意识突然增强,对新服务和平台如何使用私有或专有信息越来越关注的世界里,人们对于以这种方式使用自己的声音的接受程度还有待观察。
Kutylowski 坚称,尽管声音会传输到服务器进行翻译(处理不在设备上进行),但 DeepL 的系统不会保留任何内容,也不会用于训练其大型语言模型。最终,DeepL 将与客户合作,确保他们不违反 GDPR 或其他数据保护法规。