AI 和教育到底谁在变革谁?

瞿炜在 2019 钛媒体 T-EDGE 科技生活节做主题演讲

教育行业内已经普遍认可“人工智能+教育”的重要性了,但当我们在大谈特谈 AI 如何重构教育时,它又会面临哪些真正的挑战?

7月13日,新东方 AI 研究院院长瞿炜来到 2019 钛媒体 T-EDGE 科技生活节谈了谈他的看法。

作为一家创立已经26年的老牌教育巨头,新东方积极拥抱新技术。在瞿炜看来,未来 AI 大势不可阻挡,“AI +教育”是新东方承担历史责任,必须要全力以赴。

在 AI 浪潮席卷各个产业的大背景下,去年,新东方教育科技集团成立了 AI 研究院。据瞿炜介绍,新东方 AI +教育的作战地图,主要从从教、学、考、评、测、练等维度进行,结合线上和线下的混合学习、学科维度等场景落地。

不过,就在他们这一年间快速落地“AI +教育”的时候,也发现了许多意想不到的挑战。这些挑战体现在语音识别、人脸识别、文字识别、自然语言处理,以及 AR 与 VR,几乎涵盖“AI +教育”的所有场景范畴。

就在行业热捧“AI 教师”的趋势下,瞿炜提出了一个值得注意的观察,他们通过研究市场上所有做 AI 教师直播课的产品,得出一个规律,无论产品模拟真人多么逼真,在8分钟之类,基本上学生都能发现 AI 教师是一个假人。

而在谈论 AI 变革行业,在具体落地场景时,我们也应当明确,行业也在发生变革与分化,不同行业的 AI 有截然不同的一套理论、算法和系统。(本文首发钛媒体,作者/李程程)

以下是新东方AI研究院院长瞿炜在2019 钛媒体 T-EDGE 科技生活节的演讲全文,经钛媒体编辑:

大家好,非常高兴今天受钛媒体邀请参加分享,刚才也听到了非常振奋人心的消息,今天是一个好日子,祝贺赵总今天融资1个亿。

这个时代科技和AI,某种程度上成为科技会议代名词,作为一个做AI做了20年的学者,我想分享一点我们不同的看法。我今天的题目既和教育相关也和AI相关,但是稍微不一样的是,到底谁在变革谁?

先介绍一下新东方,大家对新东方很熟悉了,不太一样的是,我们最新的数字大家未必很清楚。新东方除了英语学习很有名,其实在中小学全科教育,在中国也帮助了很多的孩子。新东方现在有1200个校区,5万间教室,6万名老师,去年班教超过1000万名学生。

当我们谈论AI+教育的时候,意味着有海量的数据,同时还拥有中国乃至世界上最全的教育场景,从3到30岁几乎全覆盖。

新东方在去年成立了新东方AI研究院,就是NAIR。新东方有26年的历史,这是非常年轻的团队,在新东方里是很新的团队,我们希望这支全新的团队能够跑得最快。

未来AI大势不可阻挡,AI+教育是新东方承担历史责任,我们要全力以赴。我们希望有更多的才俊投入到“AI+教育”造福全世界事业当中。

借着新东方平台,把AI+教育系统、产品快速实现大规模应用,不仅是一个创业的团队,我们更希望能够和现有业务紧密结合,和外面公司相比落地能力和技术更快。同时,我们进行商业模式创新;和投资伙伴一起构建AI+教育生态和跨领域合作。

简单谈一下AI变革教育,我们认为教育AI作战地图,新东方怎么做呢?我们从教、学、考、评、测、练等维度,同时也从AI技术维度、场景维度,无论是线上线下混合学习、学科维度共享这样一个作战地图。

举几个小小的例子,也是我们在过去一年快速落地的场景。

案例一,透明课堂。传统课堂是一个黑盒子,大家上过学也感同身受,教学质量更多时候靠老师的自觉和随机抽查而已,是一个很传统行业。当AI来了以后,一切发生巨大的变化,我们称之为“AI深度感知平台”,这个项目在新东方快速落地了,推出了一个边缘计算设备,称之为小N引擎。

第一个落地的项目在做“管”的层面,推出了“小n督课”,在很多城市、新东方几百个小区规模化的试点。今年新东方决定投资1个多亿,在新东方所有校区、所有教室落实督课,未来的新东方不光老师好,什么才叫老师好,AI告诉你。

案例二,教育在如何变革AI。大家可能很少听到,但是作为在一线实战的,深刻体会到如今的AI不光是大家耳熟能详变革这个、变革那个,当AI和传统行业结合的时候,通用化的AI已经不够了。

举几个例子,大家听过我的演讲大家感受到了,比方说我们进入教育的行业,我们会发现传统AI尽管在很多通用场景,但也面临很多挑战。

语音识别的挑战。比方说我在这里演讲,如果没有科大讯飞、微软百度引擎做语音识别,如果接入从麦克风接入的话,准确率达到99%是没有问题的,但是如果识音器在距离我20米之外,如果还有一定噪音的话,识别率直线下降的。但是在真实实战场景理想状态不存在,语音识别面临很多问题。

人脸识别的挑战。也是一样的,我们试图做行为分析,但新东方不做监控学生的事情,我们做的是提高教学质量,做的是有温度的AI,即使你这样做的时候,你会发现特别有挑战。你希望低成本,用最快的速度把AI的产品技术惠及更多的人,意味着更大挑战。你用最普通的摄像头做这件事情的时候你会发现,无论是超低分辨率、强大即便角度、遮挡下的人脸,这远比无人驾驶更现实的问题。

文字识别的挑战。OCR技术作为一个极其传统的技术,因为每个人手机几乎都用手指识别,进入教育行业大家发现如此挑战,你试图用一个手写板解决所有问题,不现实。因为你改变不了学生使用习惯,相当长一段时间之内还是会接受纸质板。如何线上线下结合,解决文字问题就会难倒一众教育公司。

自然语言处理的挑战。如果一个聊天场合,机器人不知道怎么办的时候可以闲聊,可是教育不是。当你教一个学生的时候,学生希望在最短的时间里知道准确答案。这个挑战我认为可能在一众的英文行业里面是最大的。

AR/VR的挑战。可实时交互的AI老师,从去年开始,如何用一个模型让你看不出它是一个假的人,逼真度要做到绝对逼真,有非常多的问题,除了图像上的问题,还有声音上的问题。我们做了一个实验,把市场上所有做AI直播做了一个测试,有一个规律发现,很少能挺过8分钟,8分钟之内基本上一个孩子能够发现这是一个假人,这对于AI+教育这件事来说是一个巨大挑战——如何挺过8分钟乃至于80分钟?

机器学习的挑战。大家普遍接受这个词了,过去5年大家对它不是很熟悉,被热炒一番以后。实际上机器学习才刚刚开始,现在AI是一个两三岁的孩子,我们做这行人来讲,连两三岁都不到。人从猿进化而来的,但是不能说人就是猿。大家总会去讲AI能够变革这个、变革那个,但是实际上从做AI的人来讲,当AI和教育结合的时候,AI不仅变革传统行业,真正落地的话,行业也在变革分化,不同行业的AI有截然不一样的理论、算法和系统。

我们重构教育AI能力体系,所有这些技术都是打引号的。联合行业内顶级合作伙伴一起做这件事情,这件事情难度非常大,实际上刚刚开始。不光要靠像新东方这样既有数据、又有场景同时有众多资源公司、行业龙头企业去做,同时需要最顶级研究机构加入,我们在进行深度合作,实际上是很开放的。给大家做一个小小的广告,如果有意愿从事AI+教育领域,无论是创业还是投资的朋友们,包括各个产业链条上的朋友们,如果愿意去投资AI+教育的未来的话,新东方绝对是你最好的合作伙伴。

最后一句话,“携手一起努力,让AI在教育领域落地开花”。

推荐文章

波士顿 - Neurala公司今天推出了一款新的视频标注工具,该工具由Brain Builder平台的人工智能辅助。“自动视频注释将显着加速神经网络的数据标注,从而帮助组织更快地培训和部署AI,”该公司表示。标记图像和视频对于开发用于建模和训练AI应用程序的数据集至关重要。Neurala  以软件即服务(SaaS)为基础提供Brain Builder,以帮助简化深度学习的创建,分析和管理。Neurala的联合创始人兼首席执行官Massimiliano Versace说:“人工智能数据准备的传统方法极其耗时且耗费人力,需要大量数据,需要经过精心和昂贵的注释。” “我们与Brain Builder的目标是通过易于使用的注释工具降低进入门槛。通过添加视频注释,我们能够进一步自动化数据准备,帮助组织将AI数据准备的时间和成本降低至少50%。“Neurala的专利和获奖技术源于2006年NASA,DARPA和空军研究实验室的神经网络研究。2013年,该公司加入了Techstars商业化计划。“每个人都想要AI,但他们不知道为什么,”Neurala的联合创始人兼首席运营官Heather Ames Versace说。“视频注释工具是终身AI技术堆栈的一部分,可提供透明度。”启用AI的注释可节省时间,提高工作效率当用户标记视频中的人物,物体或缺陷时,Neurala的新工具可以反复学习。Neurala表示,在用户在第一帧中标记感兴趣的项目后,该工具会自动在后续帧中注释相同的项目。例如,如果五个人输入一个框架,则在用户仅用一个人标记第一个框架后,它们将全部自动注释。相比之下,用户必须在他或她进入框架时标记每个人,这将花费更多的时间。此外,AI辅助视频注释可以提高标签处理速度并提高生产力,Heather Ames Versace告诉“ 机器人商业评论”。例如,用户可以注释10秒视频的一帧并获得300个注释的输出,而使用传统的注释方法,用户需要手动标记300个不同的图像才能获得相同的结果,Neurala说。“可解释性和信任始于数据,”Heather Ames Versace在最近的AI World大会上说。“通过在更短的时间内对数据进行注释和标记,团队可以进行更快速的原型设计。”用Brain Builder存钱“最终,它将帮助组织和开发人员更有效,更具成本效益地构建,培训和部署人工智能,”Massimiliano Versace说。“当涉及视觉AI的构建方式时,Neurala的Brain Builder平台已经在改变游戏规则。而现在,视频注释将进一步扩大可访问性和生产力的可能性。“Neurala说,Brain Builder还可以提供可观的投资回报。使用Brain Builder,组织可以以每小时6,750美元的视频进行注释,而没有它的则为13,500美元。Neurala发布  了一个教程  ,概述了使用Brain Builder在视频中标记对象的过程和好处。它还解释了如何使用TensorFlow训练语义分段网络。此外,本教程还引导观众了解跨多个GPU的培训步骤,这可以进一步缩短培训时间。

热门文章

简单讲:互联网数据标注员是借助电脑或者移动设备对一些原始的数据进行处理,生产出满足AI公司机器学习需要数据的一群人。按照数据处理对象的不同,工作内容也会有差别,标注员的工作内容可以分为:分类;框选;注释;标记。按照所处公司的不同,标注员的工作方式也会有差别:有的人工智能公司处于对数据安全性考虑会自建标注团队,在这些公司工作的标注员可以保证自己工作内容不会出现太大变动;但一些服务于人工智能公司非专业外包公司标注员的工作则是项目制的,一个项目忙完紧接着做另一个项目,这样工作内容连续性较差,对一种类型的项目经验也不会积累的太多。就目前来说,人工智能还处于人工增长阶段,机器依然需要大量的数据进行训练,测试。标注员在当下也会一直存在,而且从业群体会越来越多,所以暂时不用担心这份职业会不会短期消失。就标注员从业来说,建议选择人工智能公司和专业的数据公司,这样可以保证自己在一个方向上了解的足够深入。就职场晋升来说,以牛牛数据为例:标注员——项目经理——项目总监——数据运营总监。首先谈谈什么是数据标注。数据标注有许多类型,如分类、画框、注释、标记等等,我们会在下面详谈。要理解数据标注,得先理解AI其实是部分替代人的认知功能。回想一下我们是如何学习的,例如我们学习认识苹果,那么就需要有人拿着一个苹果到你面前告诉你,这是一个苹果。然后以后你遇到了苹果,你才知道这玩意儿叫做“苹果”。类比机器学习,我们要教他认识一个苹果,你直接给它一张苹果的图片,它是完全不知道这是个啥玩意的。我们得先有苹果的图片,上面标注着“苹果”两个字,然后机器通过学习了大量的图片中的特征,这时候再给机器任意一张苹果的图片,它就能认出来了。这边可以顺带提一下训练集和测试集的概念。训练集和测试集都是标注过的数据,还是以苹果为例子,假设我们有1000张标注着“苹果”的图片,那么我们可以拿900涨作为训练集,100张作为测试集。机器从900张苹果的图片中学习得到一个模型,然后我们将剩下的100张机器没有见过的图片去给它识别,然后我们就能够得到这个模型的准确率了。想想我们上学的时候,考试的内容总是不会和我们平时的作业一样,也只有这样才能测试出学习的真正效果,这样就不难理解为什么要划分一个测试集了。我们知道机器学习分为有监督学习和无监督学习。无监督学习的效果是不可控的,常常是被用来做探索性的实验。而在实际产品应用中,通常使用的是有监督学习。有监督的机器学习就需要有标注的数据来作为先验经验。在进行数据标注之前,我们首先要对数据进行清洗,得到符合我们要求的数据。数据的清洗包括去除无效的数据、整理成规整的格式等等。具体的数据要求可以和算法人员确认。二、常见的几种数据标注类型1.分类标注:分类标注,就是我们常见的打标签。一般是从既定的标签中选择数据对应的标签,是封闭集合。如下图,一张图就可以有很多分类/标签:成人、女、黄种人、长发等。对于文字,可以标注主语、谓语、宾语,名词动词等。<img src="https://pic2.zhimg.com/50/v2-df93dc0a7e8a5fe387dc3774748b5f05_hd.jpg" data-caption="" data-size="normal" data-rawwidth="700" data-rawheight="400" class="origin_image zh-lightbox-thumb" width="700" data-original="https://pic2.zhimg.com/v2-df93dc0a7e8a5fe387dc3774748b5f05_r.jpg">适用:文本、图像、语音、视频应用:脸龄识别,情绪识别,性别识别2.标框标注:机器视觉中的标框标注,很容易理解,就是框选要检测的对象。如人脸识别,首先要先把人脸的位置确定下来。行人识别,如下图。<img src="https://pic2.zhimg.com/50/v2-7824903d6d840e2bb08d96b5c2fa5874_hd.jpg" data-caption="" data-size="normal" data-rawwidth="591" data-rawheight="398" class="origin_image zh-lightbox-thumb" width="591" data-original="https://pic2.zhimg.com/v2-7824903d6d840e2bb08d96b5c2fa5874_r.jpg">适用:图像应用:人脸识别,物品识别3.区域标注:相比于标框标注,区域标注要求更加精确。边缘可以是柔性的。如自动驾驶中的道路识别。<img src="https://pic3.zhimg.com/50/v2-4bc1dd2278182acf94fc426d7e6f2dc1_hd.jpg" data-caption="" data-size="normal" data-rawwidth="601" data-rawheight="377" class="origin_image zh-lightbox-thumb" width="601" data-original="https://pic3.zhimg.com/v2-4bc1dd2278182acf94fc426d7e6f2dc1_r.jpg">适用:图像应用:自动驾驶4.描点标注:一些对于特征要求细致的应用中常常需要描点标注。人脸识别、骨骼识别等。<img src="https://pic4.zhimg.com/50/v2-5e24f394516c75e45942c37ba0da85c0_hd.jpg" data-caption="" data-size="normal" data-rawwidth="583" data-rawheight="387" class="origin_image zh-lightbox-thumb" width="583" data-original="https://pic4.zhimg.com/v2-5e24f394516c75e45942c37ba0da85c0_r.jpg">适用:图像应用:人脸识别、骨骼识别5.其他标注:标注的类型除了上面几种常见,还有很多个性化的。根据不同的需求则需要不同的标注。如自动摘要,就需要标注文章的主要观点,这时候的标注严格上就不属于上面的任何一种了。(或则你把它归为分类也是可以的,只是标注主要观点就没有这么客观的标准,如果是标注苹果估计大多数人标注的结果都差不多。)三、有什么发展前途?数据标注员可以说是AI消灭了一部分工作又创造出来的一种工作。在未来AI发展良好的前提下,数据的缺口一定是巨大的。可以预见3-5年内数据标注员的需求会一直存在。至于发展,其实所谓一些熟能生巧的工作,都是有被替代掉的风险的。深度学习解决的一件事情就是熟能生巧。在这个岗位上,其实你的一些想法就代表了AI的想法,AI会根据你标注的数据进行学习,想想还是有点成就感的。数据标注可以说是AI的入门级岗位,未来可转向其他AI岗位。如项目实施顾问等,这就要求更多的工作技能,需要再工作中积累。作者:跹尘链接:https://www.zhihu.com/question/30654399/answer/264828926来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。