AI+教育过去10年及未来展望。

标准化的“AI+教育”产品未来能否实现“任天堂”式的创新?

2020-08-15 13:31:52发布     来源:多知网    作者:Bryce  

  编者按:近两年,AI技术在教育层面的应用越来越广泛,但普遍来看,其起到的功能是相对初级的,适用范围还相对局限。

  从最初的测评、拍照、作业到自适应学习、AI教学,再到AI伪直播及强交互视频教学。随着市场产品的迭代,机构也在寻求知识内容和教学交互层面突破的可能性。

  来源|多知网

  文|Bryce

  图片来源| Unsplash

  01

  AI教育适合标准化教学,适用范围还相对局限

  今天聊聊AI与教育的结合。这类大话题可以轻松堆出一篇券商研报的篇幅,当然如果真写了那么长,大家肯定都不爱看,所以我们先以回顾加评论的方式去聊聊已经出现并相对成熟的产品,下半场再去畅想未来一段时间内的技术产品发展。

  AI与教育的结合属于教育科技(Edtech/Learning tech)的子集,简单来说,是将AI技术结合特定场景需求,对当前的教育产品或服务进行重构或优化。常用的技术包括语音识别、语义理解、计算机视觉、知识图谱等。

  就目前而言,AI技术在教育领域内的应用是相当初级的,涉足的公司也是以大量的人工努力,才做出一个个具备一定智能水平,能在封闭的细分场景内,实现简单功能应用的产品。

  总体来讲,在AI作用于教育,目前适用的范围还相对局限:AI教育适合以轻量级的教学内容,根据符合认知规律的节奏,进行标准化传授。与普通课堂相比,其优势在于教学表达方式的丰富化,能以丰富的音视频素材进行有趣的呈现;系统天然擅长教学过程中的数据采集、统计与分析,从而在此基础上推进个性化适配基础上的交互和练习;

  但是在春风化雨言传身教、启发性思考等偏向于师者育人的领域,AI基本还无从下手。

  在教育AI的领域,国内公司的技术能力上或弱于国际公司,但因为中国K12市场的巨大需求,国内相关产品商业化的表现是可圈可点的。近十年间,我们见证了这些产品的渐次出现,比如口语评测、拍照搜题等。

  现阶段,技术驱动的权重仍大于需求驱动。先行者们先找到类似语音语义、图像识别等相对成熟的技术,结合教育领域发掘出可供落地的点,先开发出可用产品推向市场,同时再思考迢递的远方。

  横向比较泛领域AI技术的成熟度,能很容易看出其中规律,好比厨师就着手里的炊具和原料先端上两盘可供食客下箸的菜肴,做着生意再进行改良和完善。

  如果要回顾过去十年间,AI教育产品的发展,以K12的教育产品最为具有代表性。当技术走近教育,按照比较通用的方法,从周边的教学服务、到教与学的核心将场景分为几层,同时搭配产品面世的时间,可作出下图:

  

8.15 1.png

  K12 AI教育产品分布示意

  02

  工具类产品受限技术瓶颈,客户对服务属性的重视超过技术要求

  我们先来看左侧偏工具导向的产品,主要包括测评、拍照、作业三类。

  起步最早的测评类产品,主要是英语学科的口语测评和考试阅卷测评两类。口语测评公司于2011、2012年左右,阅卷测评&学情分析公司于2013、2014年左右逐渐开展业务,满足K12公立校的需求,以传统信息化产品渠道进校,其中阅卷类产品因为更贴合考试需求,使用频次高,所以对应头部公司的业务体量上明显大于语音类的对标者(大概有5倍左右的体量差)。

  虽然该类产品的核心差异在于技术能力,但在实际使用场景中,客户对于工具和服务属性的感知和重视胜过了对技术的要求。因此,底层核心技术商虽然有技术壁垒,但是到了进校环节,产品大多需要通过本地化渠道商/服务商/大集成商去触达客户,话语权向渠道或有渠道能力的公司转移,最后导致市场蛋糕分散,未来能看到的整合机会也更可能落在互联网巨头的手中。

  此外,以2B的直接业务赚现金流养公司、同时以直接或者间接的方式做2C业务,则是,现阶段的产品在数据采集+原始技术功能的基础上,推出了一些个性化的初级AI产品:口语训练、练习本等,对应业务板块的营收,还停留在千万级别。

  相较于2B产品,直接2C的拍照搜题和作业类产品更广为人知。其中,拍照搜题自13年起2C爆发,延续移动互联浪潮尾声的获客流打法,在这波红利中,成功大规模获取了用户,做到数百万乃至千万日活。

  该类产品底层的主流技术是图片识别--题库匹配,系统根据题目的图像特征在预制题库中找到对应的题目,并不理解题目的内容。虽然有个直接问题是题海无涯,公司需不断地大规模收集、更新新题,但瑕不掩瑜,是当前用户端体验最友好的方案。

  此外,同样是拍题,产品端看起来类似,但底层技术差异明显的是文字识别计算产品。系统识别用户拍照的文字符号,并提炼其中的计算逻辑,独立解答并输出答案/讲解,机器做到了理解题目内容。在此基础上,就可以实现覆盖范围内任意数字题目的计算、答案输出和自动讲解。

  表现在产品上,在相对容易(数理逻辑简单,更多是看手写识别)的小学数学上做出了一个细分刚需,即各类口算批改产品,能够批改口算题目,把老师和家长从这个量大且枯燥的任务中解放出来。

  但是,技术上的不足,特别是文字理解能力的不足,将可产品化的应用限制在以部分代数知识点为主的有限领域。国外的多款产品(比如photomath和Microsoft Math)在适用范围上领先,但也至多进行到如方程组、微积分等,要突破几何题、应用题,逐渐逼近题库匹配类产品的适用范围,还有很长的路要走。

  所以,此类产品会在技术瓶颈处滞留很长时间。从此例中不难看出,技术难度高不等于用户体验好,是目前看待AI+教育时,需要始终注意的重要认知。

  

8.15 2.png

  Photomath可覆盖的部分题型

  作业类应用通过进校2B2C,以知识点标签化的题库为核心,方便教师调用内容布置作业,从而构建师生间的作业交互平台,AI成分有限,就不多提了。

  不可否认的,拍照搜题+作业类产品在是目前可见的泛AI产品在用户层面的成功典范,共约出现了近十家头部企业,各家在用户量及活跃度上都相当可观。而由于典型用户的固有属性问题,这些公司实现成规模的营收,却是多年之后的事了。

  如果做个矩阵去标注这些公司的业务发展,能明显看出各家都在各个领域做了对盈利模式的长期探索,最后大力拓展到了课程业务线,包括在1对1辅导、网校、轻课/交互视频等。

  在网校模式得到市场的认可后,也后验地看到了在大用户基础上发力课程交付的巨大潜力,目前规模前五的头部网校中,猿辅导、作业帮均属于此类。

  03

  自适应产品比拼的核心是题目的标注处理质量

  接下来,我们来看,近年出现、和教学核心结合最紧密的自适应学习和AI教学。

  自适应学习产品,最典型的形态是利用动态调整的题目进行测评和训练,同步依靠知识点视频和内容进行教学,过程中有教师不同程度的参与,常见于数学和英语学科。

  最初,有产品依靠既有规则和决策树逻辑来进行教学,由工作人员在后台预先设计好单次学习中,学生需要接受和训练的内容(课程、题目等),并在实际学习过程中手动调整任务量和任务的难度等级。此水平相当于有个辅导老师盯着学生做一套套的电子教辅。缺点明显,每个任务的模块大,无法实现微调,可采集的信息粒度粗,对教师管控的依赖高。

  很快的,新的一套逻辑出现——依附在知识图谱上的标签化精品题库,逐渐取代了前一方案。这套产品先构建一定学科范围内的知识大纲,以树状/网状的形态联系知识点,再处理大量的题目,以打标签的形式去连接知识点,把AI与人交互的粒度切到了单题目级别。学生通过答题,系统判定掌握了当前知识点(做对同类题目数次,或相对分数达到预设值等),即可推送后续知识点,达到在预设路径上的渐进学习。

  当前,我们在市面上看到的产品大多都属此类。因为以课程大纲为骨架去构建知识体系相对简单,所以其比拼的核心技术是题库的标注处理质量——各题目的知识点、类别、难度、区分度等,以及对学生个体模型的判断和建立。最佳的情况,是保持学生遇到的题目,始终需要努努力、但是能解出来的难度范围内,激发学习动力并保证学习效率,稳步前进。

  在此基础上,还可以用产品设计上的方法,去优化用户端的体验。比如,利用知识点的关联性来推断学生对知识点的掌握程度,并不是一点一题一练,而是实现更小题目训练量上的多知识点判断。学生的感受是AI老师推题更灵活、更准了。又如,利用学习科学的逻辑,去建立更多的流程化处理方式:根据记忆-遗忘曲线的复习回顾、对核心知识点和边缘知识点的权重调整、根据学生能力和目标分数调整知识点范围等(超纲和放弃部分知识点等),都能使交互的过程更友好。

  这里讲细可以有很多,我们还是回到主线,此类产品的理想形态是完成整个教学过程,但实际过程中因为客户心理、产品成熟度的因素,完全取代教师的方案无法达到既定效果。当前已商业化的各类产品大多都曾经历过这样的方案降级,从替代教学变成了辅助授课,或是赋能培训机构,去服务学习中的某些环节,或者承担教师的部分职能。

  在业务形态上,以加盟、赋能两类模式为主。直接做加盟的方式营收增长最快,主要的客户为小白创业者,拿着一套方案,加点人工就能上马。而赋能则针对既有教培机构去做能力升级,却与其现有教学方式、流程上常有冲突,故而是从有能力的中大型机构开始应用。两条路线都有跑出营收上亿的玩家,但行业归属尚未落定。

  就笔者目前观点,加盟方案或许应该走低线、农村路线(以一个70-80分的方案,取代那些地方培训不规范、不稳定、能在40-90分波动的业务,并吸收更多原本不怎么参培的孩子进入体系)。要足够接地气,整体价格便宜,门头、设备等都没什么要求,宣传上突出某一个两个细分需求(英语背诵、数学刷题等)。不要怕low,扶持大量的低成本运营的小店,让他们在低成本下达到一个较好的盈利状况。

  而赋能形态,得是产品界面、技术底层都上佳的标准化方案,要让地方头部大校的校长和当地中上收入水平的家长都觉得好,从大校磕起,同时尽可能控制定制化比例,把通用合作模式成型,逐渐铺出去。

  04

  AI伪直播+强交互视频产品重点在内容质量

  然后,说到了AI伪直播和强交互视频教学这样的AI教学产品。

  这块儿和互联网教学载体和表现形式的演进有关。最初的线上教育,多为动辄一个小时的大段视频课录播,比如MOOC,然后在2010年后的线上直播大批量出现,再到前几年,视频录播+直播答疑+微信服务的模式在K12和职教得到广泛应用。

  AI伪直播和强交互视频教学和录播+服务模式是非常类似的,从模型上都是内容上的单次大投入+持续低成本服务,只是在录播的部分进行了变动:前一个以录播拼接来以假乱真,强调顶尖的老师、外教教学,给学生模拟1对1,小班直播的感受;后一个告诉用户是录播,但因为课件、交互、游戏、同学陪伴等环节做得很出彩,不比直播的体验差。

  这个大类别都是强内容+弱AI的结合。AI相关的技术都不难,起到的是与学生交互,并即时反馈学习效果的作用,主要通过语音识别、测评等形式进行,技术难度可控。而各家比拼的重点是在内容质量上,比如视频内容的制作精良度,趣味性,交互环节的设计等,至多在伪直播中加入一条:视频切片精细度和拼接流畅度。

  预期后续这样的产品将大量出现,因为一次录制后边际成本低,还能再依托系统提升助教服务效率,盈利模型是成立的。此外,内容制作成本摊薄后,商业运营上的能力(获客转化等)占UE模型的比例高,变成了第二竞争点。

  此类产品在用户端的收费会持续保持中低价位,大概是在数百元到两千元/年,以网销体系去触达用户,尤其适合于低幼年龄(小学及以前)教育,成长出一个细分市场,与目前电销+网销驱动的K12大班直播课形成明显的对比(事实上,从这些思考出现,到近两天把它写出来,大概过了小半年时间,就已经在这段时间中,各个教育巨头已经大量推出了各类AI课\轻课产品)。

  由于这类产品是在后台以高效率生产,可以快速迭代试错,让市场选出受欢迎的爆款,进行不断的优胜劣汰。加之获客环节的成本被快速推高,整个品类的竞争水平会快速抬升,留给新创业公司的窗口也会随之逐渐关闭。

  在这几个大领域外,还有一些细分的功能和产品,可以再单独分析。但如果要看影响力,以当前几大块做个概括也比较有代表意义了:

  • AI教育中,如果论单功能,目前切入练习环节的自适应学习最体现AI的意义。

  • AI教学产品最能满足客户的基础要求,但AI的价值并不占主导,内容和运营占据了上风。

  • 测评、搜题这些工具向的产品最容易实现,最容易聚拢用户,却需要其他业务来承接和转化。

  至此,相对成熟、常见的产品就告一段落了。后续我们来畅想未来,也看一些新的类别。

  

  05

  未来可能出现超级AI教师,目前商业化公司可尝试小而美的突破

  接着,以终为始,我们做个想象,如果教育科技极度发达,那么教育交付的场景会是?那时候的一个兼具通用性和个性化教学能力的教育AI是什么样?

  可能会有个“超级AI教师”,它理解人类认知范围内几乎所有的知识,能够全天候陪伴,根据所服务个体的行为发现教学任务并主动响应,比学生更懂自己的状态和目标,从而以恰当的方式去讲解、启发、设计任务,达到高效率的知识传授。(说不定AI形象可以金毛飘飘,No one knows xx better than me...)

  为了达到这个效果,相应产品所需要具备的知识内容、教学交互两个大方向的智能:

  知识内容:系统要做到全能全知,那么会存在一个覆盖人类既有知识体系的超级数据库,里面的单点知识还需要横跨各学科领域,根据它们的关联,连接成一个无比复杂的知识图谱。对于单个知识,系统需要知晓其本体的全维度状态,以及在特定多个维度下的具体表征形态,以及对该形态的属性有一套完整的分析、评价指标(比如难度),才能看作是系统本身理解了知识。

  在此之后,需要在各个知识节点上进行海量的、以音视频等各形态展现的素材储备。此外,因为底层对知识的理解是以机器形式进行的,要跨越机器语言,以人的思维逻辑和语言形式去持续整理、重构、优化,以最终适宜于对教学对象的传达。

  教学交互:以主动和被动的监测、交互,了解学生状况(能力、知识水平,学习需求),就其个体情况及学习需求,匹配制定学习计划,并规划学习路径,组织材料,实现输出教学、练习,并不断循环优化直至任务最终完成。

  回到当前,限于技术水平,目前商业化的公司,需要在上述两个大方向下的各个小领域,进行相对封闭场景的技术研发和应用,努力做到小而美的单点突破,是面临技术挑战和变现压力下的实际方案,包括:

  一、内容的生产:

  

  1.数据库&知识图谱:

  数据库不用多说,属于标准化基建。典型例子是各大公司积累的K12精品题库,机器知道题目所对应的知识点标签,其题干和答案内容,却没有理解知识本身。当这些各知识点的简单关联被建立,包括学习路径的先后等关系得到梳理,初级的知识图谱就开始建立。

  所以,知识图谱大概率会在K12教育领域最早成熟,因为其处理对象为教学大纲组织下的有限知识点和应用方法,相对容易实现。

  相较而言,知识图谱如果进入开放类学科\跨学科领域知识,则立即变化为一类难度以指数形式上升的挑战,构建图谱需花费大量人力物力,却无法在短期带来足够的营收。因此,知识图谱作为一种分析工具,应在能够直接创造价值的领域(比如在金融领域内,反欺诈、辅助投资决策等)率先成熟,尔后才能期待迁移到教育领域。

  此外,笔者也关注到一些公司的尝试性/非盈利类产品,比如全历史,搜罗泛历史领域的国家、事件、人物、古籍画作等,并构建这些事物相互之间的关系,虽然产品还很初级,但应有助于我们去理解这样的图谱雏形。

  2.素材的生产和重构:

  如果说知识图谱是架设知识网络,勾稽关系,那么这些网络节点上的知识,都需要通过丰富的内容来展现。当前在各领域的教育线上化过程中,还是以PGC的方式录制线上课程,或者通过动画等形式制作课程为主。如果要实现内容制作效率的大幅提高,有难度逐渐提升的三类手段:

  i.类似于好莱坞做特效的逻辑,通过成熟的素材包和工具库实现效率提升。教育科技公司可以预制动画、模型等素材,并辅以TTS等技术,实现快速的课程内容生成,目前的轻课和AI课程逐渐进入了这一阶段;

  ii.分析既有的文本、视频、音频等学习内容,以关键词识别等方式推测其概念,并切割、组织生成碎片化的学习材料。在国外的职业教育中得到应用,诸如Volley等公司就采用了此类技术;

  iii.对于教育课程的自动生成。和第二种方法类似,素材还是既有的教育视频等素材,但技术就不仅仅是自然语言识别等相对成熟的技术了,需要进入认知科学的范畴,在大量视频的学习基础上(视频分析、行为推理等),建立认知架构,并自动将课程内容分解、梳理为可理解的素材。以期生成按时间序列进行教学的脚本,再调整脚本生成可互动的课程,目前DMAI等公司有在研的产品雏形。

  二、教学交互:

  教学交互需要以某些形式唤起AI系统,然后识别问题并导向教学行为。当前的技术产品,是从”有没有问题发生“和”遇到了什么知识点“这两个逻辑为起源,设计解决方案:

  当从问题发生侧出发时,系统需要自行(依靠情绪、表情的识别,学习行为的变化等)判断并确定特定时点上学生遇到了困难。之后,再结合当前场景的教学内容做时间线比对,分析疑问对应的知识是什么,以此结合,进行教学调整和补充。面部识别技术公司在教育领域的应用多属于这一条线,好未来等领域巨头也在研发类似产品。如果后续再进一步,随着脑机技术等能直接与人脑思维活动相关的技术发展,则监测问题的难度将大幅降低。

  当从知识点侧出发时,则重点在于让系统识别到使用者当前遇到什么样的知识,并即时提供大量的可学习内容。至于个人是没有需求则可,由个人主动自助点选的方式来进入教学。典型案例的是在企业培训领域近几年比较热的概念——learning in workflow,即在工作流中学习,通过将学习系统与企业的原本的办公系统(OA等)集成,根据员工的工作任务和聊天中出现的关键字等因素,即时推送碎片化的知识、内容。国外涉及企业学习的在线/技术类公司,诸如Degreed、Edcast都在优化此类方案。

  更多的方案居于两者之间,同时判断疑问的有无、确认问题对应的知识。以现在的技术,则是要求个人与机器多次交互,和AI自适应学习的方案很类似,可能的发展点在于:

  1. 教学能力的提升:

  教学能力如要提升,需要AI老师讲得好,讲得准。这除了和前面提到的素材生产重构有关,也需要进一步加强AI教师授课效果,体现在针对性、引导启发的能力等方面。

  我们以K12自适应学习为例,AI交互的基础单元是知识点,以及知识点所匹配是单个题目的整体,因为机器无法做到对知识点的真正理解,所以题目内部是完全的黑匣。机器针对学生出错的题目,只能按照完整的解答和知识点来讲解。但是,从学习法来看,题目不是独立的,往往是多个知识点、方法的分步组合。

  解答整个题目就如同攀岩,需要经历一条完整的路线,中间一步的动作不会,都会让学生无法顺利到达终点,而学生需要的也是找出并教会他那不会的一步或几步,而不是笼统的都教一遍。所以,更好的方案要把将机器对题目的分析,切割到各步骤层面,判断学生是具体哪个步骤没有掌握,按需讲解。

  要实现此方案很难,前些年类似于高考机器人的技术,培养机器自主解题的能力。理论上机器先会做,再会讲,会逐渐达到我们期待的效果,但当前做题的技术都进展缓慢,按这条技术路线直接到讲题更是遥遥无期。那么,现阶段只能以降低难度的方案,曲线救国,让机器做到在一定程度上的“理解”,从而实现对题目的分步讲解,国内的悉之教育就在此方向进行尝试。

  此外,在拍照搜题方案中,目前也只能实现对题库内题目输出文本答案,但诸如火光摇曳等公司,通过预设动画和模板的方式,能做到对任意数值题目的自动视频讲解等,也符合这样的逻辑。

  2 领域的拓展:

  脱离相对成熟和封闭的K12知识体系,在职教等领域应用,重构一套交互的知识库和交互题库,形成细致的技能测评系统,再与员工成长路径及学习知识联系,会是很好的一套方案。

  类似IBM的Watson Talent Framework,就集成了3000多个职位简介和2000多种技能,职教老牌企业Pluralsight也有成熟的技能测试服务。

  

8.15 3.png

  Pluralsight的测试分析

  这套技术能够让企业员工的学习有明确路径和计划,学习的个性化水平和效率都得到提高。对于企业而言,则是能更清晰地监测员工的学习效果,看到技能提升的状态,从而更突出培训的结果导向。直接能体现的好处比如缩短新员工上岗时间、提高员工专业技能水平等,都是能体现出投入产出比的。

  自2019年至今,美国Edtech公司最大规模的投资中,企业培训及在线职业学习公司的融资保持了相当比重,更体现出此市场的潜力。

  

8.15 4.png

  美国2019年规模靠前的教育科技公司融资(Source:Edsurge)

  

8.15 5.png

  美国2020年上半年规模靠前的教育科技公司融资(Source:Edsurge)

  此领域在国内获得的关注远低于K12领域,也是K12领域竞争红海之后,在线教育有望爆发的领域,在后续的文章中可进一步探讨。

  以上主要是针对于学习者/学生的产品,另外也可以兼顾教师端,开发对应的辅助产品,在教授、督学过程中进行效率提高和劳动解放。例如,将一些公认为在学习中行之有效的方式和任务,听写、默写、背诵等,下放给AI来解决,过程中还可以通过结合硬件的方式,使得使用场景和使用方法更贴近传统的学习场景,比如通过智能笔等硬件,在日常书写中进行笔迹采集和智能交互。

  在列举一些例子之后,我们应该理性来看待Edtech,教育不是前沿技术最先应用的场景,据现在的经验,在尖端技术的领域,常见的技术公司会切入教育,但大多将教育作为了一个优先级不靠前的应用场景。

  如何能够在当前时点做好AI教育,关键在有限技术水平条件下,通过在产品逻辑下功夫(比如用一些后端看起来很笨,但用户端感受很好的方法),先做出高体验产品,实现应用和商业化,这样的产品不仅可以在自封闭的产品和体系中实现数据的积累,也可能通过开放服务的类安卓模式去做2B合作。在数据的训练下,迭代优化模型,去进阶更深层次、适用范围更广的AI。

  最后,举个产品设计上可参照的正面例子,权当彩蛋吧。如果各位小时候玩任天堂游戏机,可能会对一款系统自带的打鸭子游戏有印象。不需要手柄,仅端着塑料枪,对准屏幕上的鸭子射击,就能看到鸭子飞走或者被击落。

  在那个时代,这无疑是了不起的体验突破。我和我的小伙伴们还一度以为枪能发射激光瞄准。实际上,硬件上并不先进,只是枪口上装了个接收装置——一个简易的感光器件,可以感应光线强度的变化。

  关键在于游戏的设计,玩家扣发扳机、屏幕一闪的那几帧的时间内,鸭子被白色方块取代,屏幕其他位置为纯黑,根据感光器件监测到的光强,系统实现了射击判定。

  在教育领域,我们也期待更多这样的光枪类独创产品的出现。

  

8.15 6.png

  任天堂的光枪打鸭子游戏

  

  (本文为投稿,不代表多知网观点。作者Bryce为教育行业投资人,如有问题请联系z_yuhao@yeah.net)