Krisp 利用 AI 技术帮助印度人在通话中听起来像美国人
25-03-27
音频技术初创公司 Krisp 发布了一项新功能,该功能利用人工智能(AI)在通话中改变用户的口音。公司最初推出的是将印度英语口音转换为美国英语口音的功能。
Krisp 表示,这种口音转换过程保留了说话者的声音,仅切换音素以匹配美国口音。该功能已在企业环境中进行了测试,现在将作为 Krisp 桌面应用的测试版提供。用户可以在通话期间或通话前随时启用此功能。
Krisp 的联合创始人 Arto Minasyan 表示,这个功能的灵感来自于他在对话中遇到的问题。他说:“尽管我说英语说得很好,但很多人还是听不懂我的口音。我们认为改变口音可能有助于人们更好地理解彼此。我们两年前开始研究这个问题,现在我们正在测试版中发布它。”
Krisp 声称,在与企业测试该功能时,销售转化率提高了 26.1%,每本书的收入增加了 14.8%。公司表示,它决定首先处理印度口音,因为来自该国的人占全球 STEM 领域劳动力的很大一部分。公司还计划增加对更多口音的支持,包括菲律宾口音。
其他初创公司,如 GV 支持的 Sanas,已经在呼叫中心大规模部署了类似的技术。Krisp 表示,它在数千个涵盖不同口音和方言的语音样本上训练了模型,并在获得用户同意后使用了其会议助手的数据。
Minasyan 表示,该功能的另一个优点是它不需要对用户的声音进行任何预训练,因为它会实时为说话者创建个人资料。Krisp 计划在今年发布 iOS 和 Android 应用以支持面对面会议,并正在开发一个新的 Chrome 扩展,以更好地集成 Google Meet。