对话精准学联创张宁:阿里刚投 2 亿,用 AI 模拟真实老师 1 对 1 教学体验
AI 与教育的结合,正在改变传统的教育方式,我之前介绍过多个针对海外市场的 AI 教育类产品,比方说针对小孩的 Heeyo,针对外语学习的 Speak,以及针对学科学习的 AI Tutor 类产品,其中霸榜的几个产品基本上都来自华人或者国内团队。
而面向国内市场的教育 AI 产品,其整个逻辑和面向海外的产品有很大不同,刚从阿里拿了 2 亿融资的精准学就走了一条不一样的路径。
精准学想做的事情比较有意思,它想去模拟线下 1 对 1 场景下真实课程中老师的角色,做超拟人 1 对 1 的 AI 老师。
其理念是,学习产品的核心是“老师”,但与传统老师不同,它是虚拟的。这个虚拟老师不仅仅是为学生提供简单的解题或知识传授,它能够通过 AI 技术进行引导,模仿现实中的老师行为,帮助学生深入理解知识点。这种模式与过往的学习工具相比,最大的不同在于它不仅仅是辅助学生自学,而是通过互动和引导,建立起一个更为接近线下课堂的学习体验。
因此它不只是有一个形式上的 AI Tutor,而是真正将老师在整个 45 分钟课堂里的所有过程都模拟出来。这包括了上课开始后的开场白、复述作业成绩、讲解知识点等环节,以及什么时候用什么样的声音语气等表达,并将所有这些串联起来,就像是你线下场景里的真实老师一样。
这个过程中对于语音的要求非常高,为此他们单独做了中国首个端到端语音 AI 模型“心流知镜-s”,希望让 AI 老师达到真人老师级别的自然对话交流体验。
由于整个产品切入的是辅助学习场景,因此他们还推出了类似平板的 AI 辅学机,让小孩可以更加沉浸于学习场景。最近我与精准学的联合创始人张宁做了一次对话交流,聊了一下他们对于教育 AI 市场的理解和他们做这个事情的一些逻辑。
1. 切入场景:线下 1 对 1 辅助学习
从需求角度来看,目前市场上的学习机产品,每年的出货量能达到 5-600 万台,张宁认为这个需求还是很明显的。学习机在形式上是硬件,本质上却是在做软件产品,但国内市场将软件放在硬件里是更符合市场需求的一种做法。
现在市场上的 AI 产品基本上偏重于自学型工具,这对于国内大部分中小学生来说,其实要求是比较高的。在我们目前的教育体系下,所谓的教学中,教仍然是知识传授最多也是效果最好的一种方式,因此他们就想从线下 1 对 1 场景的老师入手,尝试去模拟这种场景,希望能做一个有益的补充。
而要实现模拟 1 对 1 的老师,核心就是要把老师上课的那 45 分钟全部模拟出来,从开场白打招呼开始,到知识点的讲解或者过程中开的某个笑话,再到课程的结束。
通过分解,他们发现整个过程中最小的颗粒度本质上是一个一个的对话单元,你只需要在这个单元的基础上将它串联起来即可。下面视频他们最近发布的一个 Demo:
学而思首席教研官李睿在离职后成为精准学的顾问,他从多年的经验总结认为,当达到一定水平后,线下老师的教学水平对学生提分的边际效应是很低的,而教学方法才是关键,特别是节奏的掌控、学生注意力的集中以及针对学生对话等能力。
大部分学生都不可能在 45 分钟内保持精力全部集中,如何调动学生的注意力,并在这个时机点将最重要的知识点进行讲解,可能事半功倍。
因此课堂的节奏掌控是非常重要的一部分,就像我们知道新东方的很多老师特别会调节课堂氛围而受学生欢迎那样,或者大部分老师在正式上课前都会有一些动作将大家的注意力进行集中。
对整个过程进行分析后他们认为,最重要的不是用 AI 不断去提升解题能力,而是应该利用 AI 去主动调动这个氛围节奏,当学生精力不集中跑题时还能将他拉回来,然后能针对性的与学生对话,能猜到他的问题在哪,并针对性的问、针对性的回答和他聊下去,或者让学生可以跟着自己的节奏走。
张宁认为,教育产品不可能也不应该追求万能,而是根据学习场景的需求提供不同的工具,AI 能成为教育产品的有益补充,但解题能力和课堂调度交互是两个不同的方向,在保证解题能力的基础上,提供更好的课堂调度交互,是精准学目前在核心关注的事情,而线下的 1 对 1 这个场景本质上就是一种交互。
2. 产品:AI 老师不是答疑,更多是引导学习
在产品形态上,精准学的产品是一个定制的平板学习机,定位是一个辅学机。其核心功能是虚拟老师的引导与学生的互动,而不是像传统学习产品那样通过简单的答题和反馈来帮助学生学习。希望通过虚拟教师与学生的深度互动,提升学生的学习效率和兴趣。
学生打开设备后,整个后面的过程就是学生跟着老师走的一个学习过程,可以像真实课堂一样进行互动。比方说,虚拟老师会在课程中引导学生复述问题、互动答疑,甚至根据学生的情绪与状态调整教学节奏。
它对摄像头和语音方面做了大量优化,可以与学生实现真正的互动,它能够检测学生的注意力状态,进而判断学习的专注程度。
其设计理念是让学生在老师的引导下进行学习,而不是单纯的看视频,这些功能的结合,使得学习过程更有针对性和个性化。
因此,它想解决的其实有两个问题,一个是解决了学生自学的低效率问题。很多学习工具仅仅提供知识点的讲解或解题方法,但缺乏教师的互动与引导,使得学生容易丧失学习兴趣。虚拟教师能够在学习过程中主动引导,增加学生的参与感与互动性。
其次,产品在设计中考虑到了学生的情绪变化,通过 AI 检测学生的注意力状态,确保学生在整个学习过程中的高效参与,这在很大程度上模拟了线下教师对学生状态的实时观察与反馈。
目前其课程一开始主要针对数学学科,覆盖了 3000 多个学习单元,包括小学和初中九年的大部分需要掌握的知识点。在课程内容设定上,该产品采用了随机题库,题库容量约为 20 到 30 万。
张宁说,在开发的过程中,最大的难点在于如何让 AI 老师与学生进行有效的互动,既要保证教育目的,又要避免完全自由的对话进而变成一个陪伴式语音 AI 产品,一旦遇到学生的互动脱离设定的学习环节,它会想方设法把你拉回来,严重的情况下它可以主动给家长打微信语音电话。
这与游戏行业面临的问题相似,需要在特定场景下进行约束,以保证教育的效果。他们将产品设计为与学生互动时尽量保持平等的风格,避免过于压制或服务者的角色,这个也是在做了大量测试了后得出的结果,学生更喜欢这种比较平等的关系。同时它具有知识追溯能力,可以在后台追踪学生的知识点和解题能力,实现查缺补漏。
学习机作为家长买单学生使用的一个产品,如何让家长满意也是非常关键的一环,这块精准学做了两点,一个是知识点的掌握报告,比方说经过学习一段时间后掌握了多少的知识点;第二个则是他们现在在设计的:专注力报告。也就是一个 45 分钟的课堂里,小孩有多少时间是专注在学习这个事情上,他们通过脸部 48 种表情和语音的情绪检测来评估专注力。
而家长在整个过程中,扮演的角色和传统学校或者线下培训班上课时一样,学习过程不参与,只有课后定期的类似家长会或者老师给家长做的一些关于学生的反馈,所以整个过程还是在模拟真实的教学场景。
张宁说精准学的核心主体仍然是模拟,模拟真实的教学场景,要实现的目标只有一个,以前需要人非常仔细的分析来做的事情,现在尽量让 AI 来做,而之前那些已经通过其它软件工具实现了的事情,则没必要一定 AI 来做。简单来说,就是替代掉以前无法被替代掉的环节,这里的核心其实是真人老师干的活。
3. 主动型学习与被动型教学
目前市场上的教育类 AI 产品,大部分属于主动型学习工具,比方说那些针对答疑答题的 AI Tutor 产品,张宁认为这种产品不太需要太多所谓 AI Tutor 的引导和互动,因为主动学习场景核心目标非常明确,需要的就是答案,他可能已经理解了背后的逻辑与原理,只是遇到某道题目可能不会,因此你直接给出答案即可,过程越详细越好,他自己有能力去自学。
这和编程 AI 的逻辑很类似,对于那些资深编程人员来说,他们使用 AI 编程工具是为了让自己节省时间或者解决某个具体的问题,直接给出答案即可,因为其背后的逻辑他已经理解,因此不需要去学习背后的所谓知识点。但对于初学者来说,你可能就需要通过引导的方式掌握一个一个知识点和理论才行。
我理解主动型场景核心在学,而被动型场景的核心在教。现在很多教育类产与 AI 的结合主要针对主动学习型,比方说在其已有的产品里添加一个 AI 功能,让学生可以继续追问各种其他相关问题等。
被动式的教学过程往往针对的是对这块知识都不掌握的学生,甚至他有啥问题都不是那么的明确,因此需要老师通过引导学生从基础的东西开始学习,或者老师通过与学生的互动来发现其问题。
此时引导和互动就非常关键了,而 AI 老师在吸引学生注意力时使用的措辞、语气、魅力以及表达的传达,就非常重要,毕竟他是一个假人。
从过程来看,针对被动式教学场景比主动式场景要更难,因为前者目标明确,因此解决方案也明确,而后者需要通过引导去了解学生的问题,再基于问题来有针对性的开展教学。
张宁的这个观点我非常认同,教育产品不可能也不应该追求万能,而是根据学习场景的需求提供不同的工具,他们做的就是针对被动型场景。
4. 挑战与壁垒:语音 AI 与特定行业数据
为了实现更好的语音互动,比方说角色扮演、情绪表达、音量调节等,它需要根据用户的情绪和语气进行调整,张宁说他们不得不自己来开发,因为目前并没有特别好的中文语音 AI 模型,或者其他公司有但不开放给第三方使用。
目前语音 AI 在延迟这块已经不是特别大的问题,因为低于一秒之后人的神经反应其实是感知不到太大差异的。现在的问题是对声音的强化学习,也就是做偏好。比方说对于某个问题的回答,我们可能会有多种不同的语音和语气的回答,而不同的语气和语音回答的结果可能有非常大的区别,此时你应该基于实际场景来选择某个偏好,这就需要做训练。
这种训练的挑战就需要靠塑造具体的场景数据来解决,特别是特定场景去做偏好优化的数据,这自然也就是涉及到壁垒了。张宁认为,AI 这个东西要想做的有较强壁垒,核心可能就得看特定场景的数据壁垒。
而在教育这个场景,其数据壁垒是很高的,虽然题库的数据容易一些,但是涉及到上课过程的数据积累(课程视频)就比较高了,因此我们能看到目前这块的主要玩家基本上还是之前就做教育的公司。
张宁说,我们去塑造一个虚拟老师的角色,本质上在于学生的学习能力在客观上是不一样的,如果从长期来看,他认为我们需要的其实是一种能力加持,这在 AI 时代将有巨大机会,并且是可能实现的。
5. AI 未来畅想:能力加持
在对话的过程中,沿着教育还提到了我之前介绍过的一些产品,比方说实时面试场景的 Final Round AI 以及类似相亲谈恋爱这种场景的产品,张宁提到了一个概念叫做能力加持,而这种实时场景是这种能力应用的一种极端化。
所谓的能力加持,简单理解就是