ElevenLabs 进军对话式 AI

24-11-19

免费

快讯

ElevenLabs，一家提供 AI 语音克隆和文本转语音 API 的初创公司，于本周一推出了构建对话式 AI 机器人的能力。该公司宣布，用户现在可以在 ElevenLabs 的开发者平台上构建完整的对话代理，并自定义诸如语调、回应长度等变量。

ElevenLabs 此前主要提供不同的声音和文本转语音服务的 AI 工具。公司增长负责人 Sam Sklar 说，许多客户已经在利用这一能力创建对话式 AI 代理。然而，整合知识库和处理客户打断是最具挑战性的部分，这也是公司决定构建完整对话机器人流程的原因。

用户可以登录他们的 ElevenLabs 账户，通过选择模板或创建新项目来开始构建对话代理。他们可以选择代理的主要语言、第一条消息和系统提示来确定代理的个性。开发者还需要选择一个大型语言模型（Gemini、GPT 或 Claude）、回应的温度（以确定回应的创造性）和令牌使用限制。

用户还可以调整其他方面，如声音、延迟、稳定性、认证标准和与 AI 代理对话的最大长度。用户可以添加自己的知识库，如文件、URL 或文本块，来支持对话机器人。此外，他们还可以将自定义的大型语言模型（LLM）与机器人集成。ElevenLabs 的 SDK 兼容 Python、JavaScript、React 和 Swift，公司还提供 WebSocket API 以实现更多自定义。

公司还可以定义标准来收集特定数据项——例如，与代理交谈的客户的名字和电子邮件——以及用自然语言定义呼叫成功或失败的评估标准。

目前，公司不提供其语音转文本 API 作为独立产品，但未来可能会这样做，使其成为 Google、Microsoft 和 Amazon 的语音转文本 API 以及专业 API 如 OpenAI 的 Whisper、AssemblyAI、Deepgram、Speechmatics 和 Gladia 的竞争对手。

这个领域创业公司还有类似 Vapi 和 Retell 等，而 ElevenLabs 还将与 OpenAI 的实时对话 API 竞争，ElevenLabs 相信其自定义能力和切换模型的能力将使其比 OpenAI 更有优势。

Memo Team

Signal, not noise!

ElevenLabs 进军对话式 AI

Memo Newsletter