标准化的“AI+教育”产品未来能否实现“任天堂”式的创新？

2020-08-15 13:31:52发布来源：多知网作者：Bryce

　　编者按：近两年，AI技术在教育层面的应用越来越广泛，但普遍来看，其起到的功能是相对初级的，适用范围还相对局限。

　　从最初的测评、拍照、作业到自适应学习、AI教学，再到AI伪直播及强交互视频教学。随着市场产品的迭代，机构也在寻求知识内容和教学交互层面突破的可能性。

　　来源|多知网

　　文|Bryce

　　图片来源| Unsplash

　　AI教育适合标准化教学，适用范围还相对局限

　　今天聊聊AI与教育的结合。这类大话题可以轻松堆出一篇券商研报的篇幅，当然如果真写了那么长，大家肯定都不爱看，所以我们先以回顾加评论的方式去聊聊已经出现并相对成熟的产品，下半场再去畅想未来一段时间内的技术产品发展。

　　AI与教育的结合属于教育科技(Edtech/Learning tech)的子集，简单来说，是将AI技术结合特定场景需求，对当前的教育产品或服务进行重构或优化。常用的技术包括语音识别、语义理解、计算机视觉、知识图谱等。

　　就目前而言，AI技术在教育领域内的应用是相当初级的，涉足的公司也是以大量的人工努力，才做出一个个具备一定智能水平，能在封闭的细分场景内，实现简单功能应用的产品。

　　总体来讲，在AI作用于教育，目前适用的范围还相对局限：AI教育适合以轻量级的教学内容，根据符合认知规律的节奏，进行标准化传授。与普通课堂相比，其优势在于教学表达方式的丰富化，能以丰富的音视频素材进行有趣的呈现;系统天然擅长教学过程中的数据采集、统计与分析，从而在此基础上推进个性化适配基础上的交互和练习;

　　但是在春风化雨言传身教、启发性思考等偏向于师者育人的领域，AI基本还无从下手。

　　在教育AI的领域，国内公司的技术能力上或弱于国际公司，但因为中国K12市场的巨大需求，国内相关产品商业化的表现是可圈可点的。近十年间，我们见证了这些产品的渐次出现，比如口语评测、拍照搜题等。

　　现阶段，技术驱动的权重仍大于需求驱动。先行者们先找到类似语音语义、图像识别等相对成熟的技术，结合教育领域发掘出可供落地的点，先开发出可用产品推向市场，同时再思考迢递的远方。

　　横向比较泛领域AI技术的成熟度，能很容易看出其中规律，好比厨师就着手里的炊具和原料先端上两盘可供食客下箸的菜肴，做着生意再进行改良和完善。

　　如果要回顾过去十年间，AI教育产品的发展，以K12的教育产品最为具有代表性。当技术走近教育，按照比较通用的方法，从周边的教学服务、到教与学的核心将场景分为几层，同时搭配产品面世的时间，可作出下图：

8.15 1.png

　　K12 AI教育产品分布示意

　　工具类产品受限技术瓶颈，客户对服务属性的重视超过技术要求

　　我们先来看左侧偏工具导向的产品，主要包括测评、拍照、作业三类。

　　起步最早的测评类产品，主要是英语学科的口语测评和考试阅卷测评两类。口语测评公司于2011、2012年左右，阅卷测评&学情分析公司于2013、2014年左右逐渐开展业务，满足K12公立校的需求，以传统信息化产品渠道进校，其中阅卷类产品因为更贴合考试需求，使用频次高，所以对应头部公司的业务体量上明显大于语音类的对标者(大概有5倍左右的体量差)。

　　虽然该类产品的核心差异在于技术能力，但在实际使用场景中，客户对于工具和服务属性的感知和重视胜过了对技术的要求。因此，底层核心技术商虽然有技术壁垒，但是到了进校环节，产品大多需要通过本地化渠道商/服务商/大集成商去触达客户，话语权向渠道或有渠道能力的公司转移，最后导致市场蛋糕分散，未来能看到的整合机会也更可能落在互联网巨头的手中。

　　此外，以2B的直接业务赚现金流养公司、同时以直接或者间接的方式做2C业务，则是，现阶段的产品在数据采集+原始技术功能的基础上，推出了一些个性化的初级AI产品：口语训练、练习本等，对应业务板块的营收，还停留在千万级别。

　　相较于2B产品，直接2C的拍照搜题和作业类产品更广为人知。其中，拍照搜题自13年起2C爆发，延续移动互联浪潮尾声的获客流打法，在这波红利中，成功大规模获取了用户，做到数百万乃至千万日活。

　　该类产品底层的主流技术是图片识别--题库匹配，系统根据题目的图像特征在预制题库中找到对应的题目，并不理解题目的内容。虽然有个直接问题是题海无涯，公司需不断地大规模收集、更新新题，但瑕不掩瑜，是当前用户端体验最友好的方案。

　　此外，同样是拍题，产品端看起来类似，但底层技术差异明显的是文字识别计算产品。系统识别用户拍照的文字符号，并提炼其中的计算逻辑，独立解答并输出答案/讲解，机器做到了理解题目内容。在此基础上，就可以实现覆盖范围内任意数字题目的计算、答案输出和自动讲解。

　　表现在产品上，在相对容易(数理逻辑简单，更多是看手写识别)的小学数学上做出了一个细分刚需，即各类口算批改产品，能够批改口算题目，把老师和家长从这个量大且枯燥的任务中解放出来。

　　但是，技术上的不足，特别是文字理解能力的不足，将可产品化的应用限制在以部分代数知识点为主的有限领域。国外的多款产品(比如photomath和Microsoft Math)在适用范围上领先，但也至多进行到如方程组、微积分等，要突破几何题、应用题，逐渐逼近题库匹配类产品的适用范围，还有很长的路要走。

　　所以，此类产品会在技术瓶颈处滞留很长时间。从此例中不难看出，技术难度高不等于用户体验好，是目前看待AI+教育时，需要始终注意的重要认知。

8.15 2.png

　　Photomath可覆盖的部分题型

　　作业类应用通过进校2B2C，以知识点标签化的题库为核心，方便教师调用内容布置作业，从而构建师生间的作业交互平台，AI成分有限，就不多提了。

　　不可否认的，拍照搜题+作业类产品在是目前可见的泛AI产品在用户层面的成功典范，共约出现了近十家头部企业，各家在用户量及活跃度上都相当可观。而由于典型用户的固有属性问题，这些公司实现成规模的营收，却是多年之后的事了。

　　如果做个矩阵去标注这些公司的业务发展，能明显看出各家都在各个领域做了对盈利模式的长期探索，最后大力拓展到了课程业务线，包括在1对1辅导、网校、轻课/交互视频等。

　　在网校模式得到市场的认可后，也后验地看到了在大用户基础上发力课程交付的巨大潜力，目前规模前五的头部网校中，猿辅导、作业帮均属于此类。

　　自适应产品比拼的核心是题目的标注处理质量

　　接下来，我们来看，近年出现、和教学核心结合最紧密的自适应学习和AI教学。

　　自适应学习产品，最典型的形态是利用动态调整的题目进行测评和训练，同步依靠知识点视频和内容进行教学，过程中有教师不同程度的参与，常见于数学和英语学科。

　　最初，有产品依靠既有规则和决策树逻辑来进行教学，由工作人员在后台预先设计好单次学习中，学生需要接受和训练的内容(课程、题目等)，并在实际学习过程中手动调整任务量和任务的难度等级。此水平相当于有个辅导老师盯着学生做一套套的电子教辅。缺点明显，每个任务的模块大，无法实现微调，可采集的信息粒度粗，对教师管控的依赖高。

　　很快的，新的一套逻辑出现——依附在知识图谱上的标签化精品题库，逐渐取代了前一方案。这套产品先构建一定学科范围内的知识大纲，以树状/网状的形态联系知识点，再处理大量的题目，以打标签的形式去连接知识点，把AI与人交互的粒度切到了单题目级别。学生通过答题，系统判定掌握了当前知识点(做对同类题目数次，或相对分数达到预设值等)，即可推送后续知识点，达到在预设路径上的渐进学习。

　　当前，我们在市面上看到的产品大多都属此类。因为以课程大纲为骨架去构建知识体系相对简单，所以其比拼的核心技术是题库的标注处理质量——各题目的知识点、类别、难度、区分度等，以及对学生个体模型的判断和建立。最佳的情况，是保持学生遇到的题目，始终需要努努力、但是能解出来的难度范围内，激发学习动力并保证学习效率，稳步前进。

　　在此基础上，还可以用产品设计上的方法，去优化用户端的体验。比如，利用知识点的关联性来推断学生对知识点的掌握程度，并不是一点一题一练，而是实现更小题目训练量上的多知识点判断。学生的感受是AI老师推题更灵活、更准了。又如，利用学习科学的逻辑，去建立更多的流程化处理方式：根据记忆-遗忘曲线的复习回顾、对核心知识点和边缘知识点的权重调整、根据学生能力和目标分数调整知识点范围等(超纲和放弃部分知识点等)，都能使交互的过程更友好。

　　这里讲细可以有很多，我们还是回到主线，此类产品的理想形态是完成整个教学过程，但实际过程中因为客户心理、产品成熟度的因素，完全取代教师的方案无法达到既定效果。当前已商业化的各类产品大多都曾经历过这样的方案降级，从替代教学变成了辅助授课，或是赋能培训机构，去服务学习中的某些环节，或者承担教师的部分职能。

　　在业务形态上，以加盟、赋能两类模式为主。直接做加盟的方式营收增长最快，主要的客户为小白创业者，拿着一套方案，加点人工就能上马。而赋能则针对既有教培机构去做能力升级，却与其现有教学方式、流程上常有冲突，故而是从有能力的中大型机构开始应用。两条路线都有跑出营收上亿的玩家，但行业归属尚未落定。

　　就笔者目前观点，加盟方案或许应该走低线、农村路线(以一个70-80分的方案，取代那些地方培训不规范、不稳定、能在40-90分波动的业务，并吸收更多原本不怎么参培的孩子进入体系)。要足够接地气，整体价格便宜，门头、设备等都没什么要求，宣传上突出某一个两个细分需求(英语背诵、数学刷题等)。不要怕low，扶持大量的低成本运营的小店，让他们在低成本下达到一个较好的盈利状况。

　　而赋能形态，得是产品界面、技术底层都上佳的标准化方案，要让地方头部大校的校长和当地中上收入水平的家长都觉得好，从大校磕起，同时尽可能控制定制化比例，把通用合作模式成型，逐渐铺出去。

　　AI伪直播+强交互视频产品重点在内容质量

　　然后，说到了AI伪直播和强交互视频教学这样的AI教学产品。

　　这块儿和互联网教学载体和表现形式的演进有关。最初的线上教育，多为动辄一个小时的大段视频课录播，比如MOOC，然后在2010年后的线上直播大批量出现，再到前几年，视频录播+直播答疑+微信服务的模式在K12和职教得到广泛应用。

　　AI伪直播和强交互视频教学和录播+服务模式是非常类似的，从模型上都是内容上的单次大投入+持续低成本服务，只是在录播的部分进行了变动：前一个以录播拼接来以假乱真，强调顶尖的老师、外教教学，给学生模拟1对1，小班直播的感受;后一个告诉用户是录播，但因为课件、交互、游戏、同学陪伴等环节做得很出彩，不比直播的体验差。

　　这个大类别都是强内容+弱AI的结合。AI相关的技术都不难，起到的是与学生交互，并即时反馈学习效果的作用，主要通过语音识别、测评等形式进行，技术难度可控。而各家比拼的重点是在内容质量上，比如视频内容的制作精良度，趣味性，交互环节的设计等，至多在伪直播中加入一条：视频切片精细度和拼接流畅度。

　　预期后续这样的产品将大量出现，因为一次录制后边际成本低，还能再依托系统提升助教服务效率，盈利模型是成立的。此外，内容制作成本摊薄后，商业运营上的能力(获客转化等)占UE模型的比例高，变成了第二竞争点。

　　此类产品在用户端的收费会持续保持中低价位，大概是在数百元到两千元/年，以网销体系去触达用户，尤其适合于低幼年龄(小学及以前)教育，成长出一个细分市场，与目前电销+网销驱动的K12大班直播课形成明显的对比(事实上，从这些思考出现，到近两天把它写出来，大概过了小半年时间，就已经在这段时间中，各个教育巨头已经大量推出了各类AI课\轻课产品)。

　　由于这类产品是在后台以高效率生产，可以快速迭代试错，让市场选出受欢迎的爆款，进行不断的优胜劣汰。加之获客环节的成本被快速推高，整个品类的竞争水平会快速抬升，留给新创业公司的窗口也会随之逐渐关闭。

　　在这几个大领域外，还有一些细分的功能和产品，可以再单独分析。但如果要看影响力，以当前几大块做个概括也比较有代表意义了：

　　• AI教育中，如果论单功能，目前切入练习环节的自适应学习最体现AI的意义。

　　• AI教学产品最能满足客户的基础要求，但AI的价值并不占主导，内容和运营占据了上风。

　　• 测评、搜题这些工具向的产品最容易实现，最容易聚拢用户，却需要其他业务来承接和转化。

　　至此，相对成熟、常见的产品就告一段落了。后续我们来畅想未来，也看一些新的类别。

　　未来可能出现超级AI教师，目前商业化公司可尝试小而美的突破

　　接着，以终为始，我们做个想象，如果教育科技极度发达，那么教育交付的场景会是?那时候的一个兼具通用性和个性化教学能力的教育AI是什么样?

　　可能会有个“超级AI教师”，它理解人类认知范围内几乎所有的知识，能够全天候陪伴，根据所服务个体的行为发现教学任务并主动响应，比学生更懂自己的状态和目标，从而以恰当的方式去讲解、启发、设计任务，达到高效率的知识传授。(说不定AI形象可以金毛飘飘，No one knows xx better than me...)

　　为了达到这个效果，相应产品所需要具备的知识内容、教学交互两个大方向的智能：

　　知识内容：系统要做到全能全知，那么会存在一个覆盖人类既有知识体系的超级数据库，里面的单点知识还需要横跨各学科领域，根据它们的关联，连接成一个无比复杂的知识图谱。对于单个知识，系统需要知晓其本体的全维度状态，以及在特定多个维度下的具体表征形态，以及对该形态的属性有一套完整的分析、评价指标(比如难度)，才能看作是系统本身理解了知识。

　　在此之后，需要在各个知识节点上进行海量的、以音视频等各形态展现的素材储备。此外，因为底层对知识的理解是以机器形式进行的，要跨越机器语言，以人的思维逻辑和语言形式去持续整理、重构、优化，以最终适宜于对教学对象的传达。

　　教学交互：以主动和被动的监测、交互，了解学生状况(能力、知识水平，学习需求)，就其个体情况及学习需求，匹配制定学习计划，并规划学习路径，组织材料，实现输出教学、练习，并不断循环优化直至任务最终完成。

　　回到当前，限于技术水平，目前商业化的公司，需要在上述两个大方向下的各个小领域，进行相对封闭场景的技术研发和应用，努力做到小而美的单点突破，是面临技术挑战和变现压力下的实际方案，包括：

　　一、内容的生产：

　　1.数据库&知识图谱：

　　数据库不用多说，属于标准化基建。典型例子是各大公司积累的K12精品题库，机器知道题目所对应的知识点标签，其题干和答案内容，却没有理解知识本身。当这些各知识点的简单关联被建立，包括学习路径的先后等关系得到梳理，初级的知识图谱就开始建立。

　　所以，知识图谱大概率会在K12教育领域最早成熟，因为其处理对象为教学大纲组织下的有限知识点和应用方法，相对容易实现。

　　相较而言，知识图谱如果进入开放类学科\跨学科领域知识，则立即变化为一类难度以指数形式上升的挑战，构建图谱需花费大量人力物力，却无法在短期带来足够的营收。因此，知识图谱作为一种分析工具，应在能够直接创造价值的领域(比如在金融领域内，反欺诈、辅助投资决策等)率先成熟，尔后才能期待迁移到教育领域。

　　此外，笔者也关注到一些公司的尝试性/非盈利类产品，比如全历史，搜罗泛历史领域的国家、事件、人物、古籍画作等，并构建这些事物相互之间的关系，虽然产品还很初级，但应有助于我们去理解这样的图谱雏形。

　　2.素材的生产和重构：

　　如果说知识图谱是架设知识网络，勾稽关系，那么这些网络节点上的知识，都需要通过丰富的内容来展现。当前在各领域的教育线上化过程中，还是以PGC的方式录制线上课程，或者通过动画等形式制作课程为主。如果要实现内容制作效率的大幅提高，有难度逐渐提升的三类手段：

　　i.类似于好莱坞做特效的逻辑，通过成熟的素材包和工具库实现效率提升。教育科技公司可以预制动画、模型等素材，并辅以TTS等技术，实现快速的课程内容生成，目前的轻课和AI课程逐渐进入了这一阶段;

　　ii.分析既有的文本、视频、音频等学习内容，以关键词识别等方式推测其概念，并切割、组织生成碎片化的学习材料。在国外的职业教育中得到应用，诸如Volley等公司就采用了此类技术;

　　iii.对于教育课程的自动生成。和第二种方法类似，素材还是既有的教育视频等素材，但技术就不仅仅是自然语言识别等相对成熟的技术了，需要进入认知科学的范畴，在大量视频的学习基础上(视频分析、行为推理等)，建立认知架构，并自动将课程内容分解、梳理为可理解的素材。以期生成按时间序列进行教学的脚本，再调整脚本生成可互动的课程，目前DMAI等公司有在研的产品雏形。

　　二、教学交互：

　　教学交互需要以某些形式唤起AI系统，然后识别问题并导向教学行为。当前的技术产品，是从”有没有问题发生“和”遇到了什么知识点“这两个逻辑为起源，设计解决方案：

　　当从问题发生侧出发时，系统需要自行(依靠情绪、表情的识别，学习行为的变化等)判断并确定特定时点上学生遇到了困难。之后，再结合当前场景的教学内容做时间线比对，分析疑问对应的知识是什么，以此结合，进行教学调整和补充。面部识别技术公司在教育领域的应用多属于这一条线，好未来等领域巨头也在研发类似产品。如果后续再进一步，随着脑机技术等能直接与人脑思维活动相关的技术发展，则监测问题的难度将大幅降低。

　　当从知识点侧出发时，则重点在于让系统识别到使用者当前遇到什么样的知识，并即时提供大量的可学习内容。至于个人是没有需求则可，由个人主动自助点选的方式来进入教学。典型案例的是在企业培训领域近几年比较热的概念——learning in workflow，即在工作流中学习，通过将学习系统与企业的原本的办公系统(OA等)集成，根据员工的工作任务和聊天中出现的关键字等因素，即时推送碎片化的知识、内容。国外涉及企业学习的在线/技术类公司，诸如Degreed、Edcast都在优化此类方案。

　　更多的方案居于两者之间，同时判断疑问的有无、确认问题对应的知识。以现在的技术，则是要求个人与机器多次交互，和AI自适应学习的方案很类似，可能的发展点在于：

　　1. 教学能力的提升：

　　教学能力如要提升，需要AI老师讲得好，讲得准。这除了和前面提到的素材生产重构有关，也需要进一步加强AI教师授课效果，体现在针对性、引导启发的能力等方面。

　　我们以K12自适应学习为例，AI交互的基础单元是知识点，以及知识点所匹配是单个题目的整体，因为机器无法做到对知识点的真正理解，所以题目内部是完全的黑匣。机器针对学生出错的题目，只能按照完整的解答和知识点来讲解。但是，从学习法来看，题目不是独立的，往往是多个知识点、方法的分步组合。

　　解答整个题目就如同攀岩，需要经历一条完整的路线，中间一步的动作不会，都会让学生无法顺利到达终点，而学生需要的也是找出并教会他那不会的一步或几步，而不是笼统的都教一遍。所以，更好的方案要把将机器对题目的分析，切割到各步骤层面，判断学生是具体哪个步骤没有掌握，按需讲解。

　　要实现此方案很难，前些年类似于高考机器人的技术，培养机器自主解题的能力。理论上机器先会做，再会讲，会逐渐达到我们期待的效果，但当前做题的技术都进展缓慢，按这条技术路线直接到讲题更是遥遥无期。那么，现阶段只能以降低难度的方案，曲线救国，让机器做到在一定程度上的“理解”，从而实现对题目的分步讲解，国内的悉之教育就在此方向进行尝试。

　　此外，在拍照搜题方案中，目前也只能实现对题库内题目输出文本答案，但诸如火光摇曳等公司，通过预设动画和模板的方式，能做到对任意数值题目的自动视频讲解等，也符合这样的逻辑。

　　2 领域的拓展：

　　脱离相对成熟和封闭的K12知识体系，在职教等领域应用，重构一套交互的知识库和交互题库，形成细致的技能测评系统，再与员工成长路径及学习知识联系，会是很好的一套方案。

　　类似IBM的Watson Talent Framework，就集成了3000多个职位简介和2000多种技能，职教老牌企业Pluralsight也有成熟的技能测试服务。

8.15 3.png

　　Pluralsight的测试分析

　　这套技术能够让企业员工的学习有明确路径和计划，学习的个性化水平和效率都得到提高。对于企业而言，则是能更清晰地监测员工的学习效果，看到技能提升的状态，从而更突出培训的结果导向。直接能体现的好处比如缩短新员工上岗时间、提高员工专业技能水平等，都是能体现出投入产出比的。

　　自2019年至今，美国Edtech公司最大规模的投资中，企业培训及在线职业学习公司的融资保持了相当比重，更体现出此市场的潜力。

8.15 4.png

　　美国2019年规模靠前的教育科技公司融资(Source：Edsurge)

8.15 5.png

　　美国2020年上半年规模靠前的教育科技公司融资(Source：Edsurge)

　　此领域在国内获得的关注远低于K12领域，也是K12领域竞争红海之后，在线教育有望爆发的领域，在后续的文章中可进一步探讨。

　　以上主要是针对于学习者/学生的产品，另外也可以兼顾教师端，开发对应的辅助产品，在教授、督学过程中进行效率提高和劳动解放。例如，将一些公认为在学习中行之有效的方式和任务，听写、默写、背诵等，下放给AI来解决，过程中还可以通过结合硬件的方式，使得使用场景和使用方法更贴近传统的学习场景，比如通过智能笔等硬件，在日常书写中进行笔迹采集和智能交互。

　　在列举一些例子之后，我们应该理性来看待Edtech，教育不是前沿技术最先应用的场景，据现在的经验，在尖端技术的领域，常见的技术公司会切入教育，但大多将教育作为了一个优先级不靠前的应用场景。

　　如何能够在当前时点做好AI教育，关键在有限技术水平条件下，通过在产品逻辑下功夫（比如用一些后端看起来很笨，但用户端感受很好的方法），先做出高体验产品，实现应用和商业化，这样的产品不仅可以在自封闭的产品和体系中实现数据的积累，也可能通过开放服务的类安卓模式去做2B合作。在数据的训练下，迭代优化模型，去进阶更深层次、适用范围更广的AI。

　　最后，举个产品设计上可参照的正面例子，权当彩蛋吧。如果各位小时候玩任天堂游戏机，可能会对一款系统自带的打鸭子游戏有印象。不需要手柄，仅端着塑料枪，对准屏幕上的鸭子射击，就能看到鸭子飞走或者被击落。

　　在那个时代，这无疑是了不起的体验突破。我和我的小伙伴们还一度以为枪能发射激光瞄准。实际上，硬件上并不先进，只是枪口上装了个接收装置——一个简易的感光器件，可以感应光线强度的变化。

　　关键在于游戏的设计，玩家扣发扳机、屏幕一闪的那几帧的时间内，鸭子被白色方块取代，屏幕其他位置为纯黑，根据感光器件监测到的光强，系统实现了射击判定。

　　在教育领域，我们也期待更多这样的光枪类独创产品的出现。

8.15 6.png

　　任天堂的光枪打鸭子游戏

　　(本文为投稿，不代表多知网观点。作者Bryce为教育行业投资人，如有问题请联系z_yuhao@yeah.net)

商学院

Open Talk

标准化的“AI+教育”产品未来能否实现“任天堂”式的创新？

相关阅读