ElevenLabs 新功能挑战 NotebookLM,打造 GenAI 播客
语音 AI 初创公司 ElevenLabs 最近推出了一项新功能,名为 GenFM,它能够让用户上传不同类型的内容以创建一个多说话者播客,与谷歌的 NotebookLM 功能相似。这项功能目前可以在 ElevenLabs Reader iOS 应用中找到,支持包括英语、印地语、葡萄牙语、中文、西班牙语、法语、德语、日语在内的 32 种语言。
使用 GenFM 时,用户首先上传 YouTube 视频、文本或文档,然后应用会自动选择两种声音来创建播客。ElevenLabs 表示,有超过一打的声音可供选择。在应用准备 AI 生成的播客时,用户可能会看到一些有趣的屏幕提示,如“加入一些‘嗯’”和“添加一些深思熟虑的停顿”。在许多工具帮助人类去除“嗯”和“啊”的时候,ElevenLabs 却在其 AI 生成的播客中加入人类元素。
ElevenLabs 负责移动增长的 Jack McDermott 在接受 TechCrunch 采访时表示,他们讨论了应该引入多少“嗯”、“啊”、“嗯哼”/ 笑声 / 呼吸等类似的人类对话填充词或覆盖物,他们的目标是找到自然人类对话和提供内容实用性之间的正确平衡。他们的目标是提供更自然、有洞察力的对话流程,同时使音频叙事在声音和语言上更易于获取。
未来,ElevenLabs 计划支持更多自定义功能,并能够添加多个来源以创建生成性 AI 播客。此前,谷歌在 9 月份推出了 NotebookLM,允许用户从提供的来源创建 AI 生成的对话。一个月后,谷歌又增加了让用户自定义这些 AI 生成播客输出的能力。
ElevenLabs 最近还宣布将投资 1100 万美元进入波兰初创企业生态系统,并在华沙开设一个办事处,这将是公司的 R&D 中心,以吸引当地的 AI 人才。该公司还表示,它正在扩展到印度市场,已经雇佣了业务负责人,并正在建立团队。此外,ElevenLabs 还为客户提供了会话 AI 代理的功能。