创新工厂李开复:AI+”有四个阶段

编者按:这是创新工场董事长李开复在2019上海世界人工智能大会上的主论坛演讲。

 

  此前对于AI开启的行业赋能,已经被很多次阐释、验证并不断产出成果。

 

  但对于“AI+”的发展路径、逻辑和未来,在李开复之前还没有人有过如此大道至简式的分析。

 

  或许跟李开复的履历和现在密不可分。他是80年代的计算机博士,论文成果就是AI领域的研究,是懂AI的科学家。

 

  他又先后任职微软、谷歌等巨头,完整经历了IT、互联网和移动互联网的演进,是继往开来的产业变迁一线参与者。

 

  现在AI复兴以来,他创办的投资机构创新工场已投资60家AI公司,其中独角兽就有5家。以及思考着作《AI未来》,在中美都成畅销读物,后又被印成多国语言,周游列国AI。

 

  所以这一次“AI+”4时代的思考,更是真正全球视野之下的分析。

 

  参考这个逻辑,或许还能解答另一个问题:

 

  AI公司如何发展?又会往哪里去?

 

  原演讲题为《“AI+”时代的到来》,小标题为后添加:

 

 

  尊敬的陈市长、王部长,各位嘉宾,今天我要讲的题目是《“AI+”时代的到来》。“互联网+”曾经是一个非常普遍的口号,今天我们要讲的是“AI+”。

 

  “AI+”是什么意思?我们可以看到在过去的每一波浪潮当中,我刚刚从日内瓦回来,和施瓦布教授(达沃斯世界经济论坛发起人)交流,我们看到的是第四次工业革命在过去的蒸汽机、电气化、信息通信技术和互联网基础上,AI将带来第四次工业革命,AI在各种不同行业都有应用。

 

  AI演进4浪潮

 

  在我的书《AI未来》当中,我们描述了四波“AI浪潮”:

 

  AI是数据驱动,海量的数据是AI成功的要素,所以第一波浪潮一定是互联网数据的这一波。

 

  第二波浪潮是金融和很多其他的有标准化产品机会的各种领域,所谓的商业智能化,数据仓库。

 

  第三波浪潮是AI将有眼睛、耳朵还有更多传感器可以听到,感受到人类更多的信息。

 

  第四波浪潮AI将能够动,有手有脚,有轮子,在制造方面,在机器人方面,在无人驾驶方面将带来很大价值。所以它将重塑各个行业。

 

  从互联网进入商业,进入实体世界,进入全自动的智能化,我们可以看到,下面的各个领域几乎涵盖了人类社会的所有的商业领域。所以“AI+”就是把AI赋能到这四波浪潮当中的一个机会。

 

  另外我们学术界朋友谈的一个重要话题就是深度学习是不是走到底了?我们做科研的人是不是该启动新的科研课题?这个答案是肯定的。因为深度学习进入了成熟期,我们在产业界开始使用它,但是在学术界确实需要再发明更多更好的技术。

 

  这个话题的另外一面在于,虽然说我们在学术界要发明更多更好的技术,取代深度学习的技术,但是这是不可预期的,因为科学发明无法预期什么时候发生。但是非常确定的是在工业界和产业界,我们把深度学习发扬光大还有非常大的机会。

 

  一个研究告诉我们,AI在传统行业的渗透率只有4%,如果说我们对比前两次巨大的革命,我们今天的AI的普及状态就和当年的“黄页”是一样的。“黄页”大家都知道吧,马云先生的第一次创业就是“中国黄页”,那个时候互联网普及率就只有4%。

 

  这一方面意味着AI应用还非常少,另一方面意味着,未来发展的机会非常大。虽然我们看到AI在安防等领域有一些落地,但实际上我们只要问周围的企业家朋友,你的公司有没有全面使用AI,我相信96%的回答是“No”。

 

  “AI+”4阶段

 

  如果说从我们投资角度来划分AI的四个时代,我认为分为:AI技术时代、AI B2B时代,AI+传统企业时代、以及 AI 无处不在的时代。

 

  最开始AI是很难的,只掌握在非常优秀的博士手中。慢慢的它越来越好用了,最近在创新工厂我们做了一次培训,仅仅4周的时间,我们招了600个当届的学生,让他们做出了包括无人驾驶、对话机器人等超级应用。这意味着AI门坎在下降,AI技术平台越来越好用,所以AI普及带来了更多工程师,他们可以赋能更多行业,这是驱动的一个重要力量。

 

  回到四个AI的阶段,我们可以和互联网时代对比。

 

  我们记得20多年前,互联网貌似是一个黑科技,当时雅虎等都是让人不可想象的技术,这些技术大家非常快的掌握了,我们开始买Web Server等互联网内部服务器的一些软件。

 

  再下面各个公司就建立了互联网部门,有了互联网专家来帮助公司寻找方向。当时我在微软,我们就建立了一个互联网部门,专门教公司的人怎么切入互联网,但是这个部门很快解散了,因为互联网无处不在。随着技术的普及,一定会从黑科技走向一个无所不在的过程。现在我们正处于第二和第三个阶段中间。

 

  什么是黑科技时代呢?我非常有幸98年在微软中国研究院(现微软亚洲中国研究院),带了一批我的同事们做了中国最早的AI的科研人员。在2005年,又带了一批非常优秀的工程师做了很多好的AI工作。

 

  非常有幸,我在黑科技的时代接触到了很多伟大的公司,包括很多在座的朋友们,当时是一个以科研为主,以博士主导,把AI技术作为切入点,再去寻找商业应用的第一个阶段。

 

  第二个阶段是AI公司开始做2B产品,比如说保险、银行、客服、金融、教育领域能做什么产品,教育产品能卖给学校,金融产品卖给保险公司五世或者银行,包括我们投的第四范式、旷视科技、追一科技、迅策科技等等,他们都是行业的产品的领跑者。

 

  非常有幸,创新工厂投出了60家AI公司,其中有5家独角兽,未来一年还会有3-4家独角兽诞生。这是第二阶段,把AI做成产品,变成2B的应用。

 

  第三个阶段,普华永道认为2030年AI将给全世界带来大约100万亿人民币的GDP提升。在中国,我们看到大约是在200万亿人民币左右,其中40万亿左右是AI赋能达到的,远远超过其他国家。

 

  一方面这是一个巨大的机会,所以要赋能AI的各主要传统行业。但是话说回来了,我们想想今天的AI独角兽,包括我们投的5家,包括今天早上的商汤科技,包括在座的科大讯飞等等的公司,都是很伟大的AI公司,但是这些公司一年就是几十亿的收入,如果说我们在国内要创造50万亿的价值,这绝对不是再去创1万家公司可以带来的。

 

  这些AI公司会继续创造价值,但是更大的价值一定是要把AI价值赋能传统行业,如果说2030年我们是传统行业是近200万亿规模,我们只要在这个基础提升20%、30%、40%,就可以达到50万亿的规模,50万亿的价值一定是来自于AI赋能传统行业,一定不是来自于黑科技,这是一个巨大的差别。

 

  AI赋能传统行业三种模式

 

  AI怎么去赋能传统行业呢?我这里有三种模式。

 

  第一种是优化赋能,也就是说你的公司的所有的运营一点不变,但是我用AI帮助大数据赚更多钱,省更多钱。

 

  第二种模式是流程化赋能,也就是说要改改赋能模式,帮你创造更大价值。

 

  第三种模式是重构颠覆整个产业。

 

  这里我有六个例子来介绍这三个不同的方式:

 

  第一个是BPO的例子。

 

  就是在企业级应用服务当中,我们做了很多外包,简单来说,所有外包给印度的工作都可以外包给AI,现在有一个新技术叫RPA,就是把一个软件放到你的机器上,学你做的事情,过一会儿,10%、20%、30%就不需要人做了,机器就可以做了。

 

  这个对产业的节省成本是巨大的。我们可以看到的一些BPO的例子,包括在财务、法务、人力资源方面节省重复性的白领劳动,可以节省最多91.2%的成本。

 

  另外一个例子就是呼叫中心,用语音识别的技术和最新的语音识别加自然语言处理的技术,可以处理80%打来的客服电话,而且它的客户满意度是超过人可以提供的,这是我们投资的追一科技所做到的。

 

  再讲一下流程的智能化。在零售合作伙伴身上,我们用AI来预测销售,每一个产品在每家商店,每一天可以卖掉多少,它有海量的数据进来,可以做非常精准的预测,降低了它的仓储,对接到它的物流,不但带来了仓储物流节省的钱,人员培训的钱,它的店长都可以AI化,一个公司扩张找店长是非常困难的,店长现在也可以AI化了。

 

  这队对一些零售类的公司应该是上亿的价值。这个我们就可以明显看到AI赋能传统产业带来的价值是超过一个AI公司本身的。

 

  再比如说用AI了解传统数据。左边是用AI来做卫星数据,了解地面上农作物的温度和湿度,预测每年的产量和价钱。各种植物等等。右边的例子是更加精确的用太阳的高度和阴影的强度来预算那些储油罐里面有多少油。这些在没有AI的时候是不能做到的,这些只是冰山的一角,后面还有更多的机会。

 

  下面一个例子就是投资了,我们知道很多投资都是靠人和基金来做的,你去买基金可能有100种选择,1000种选择,但是是千人一面的。而且不是针对你的风险承受能力来定制的。

 

  未来AI基金会有各种收入,刚刚讲到油的收入、农产品的收入,对每个公司的股票可以做精准的预知。对于每个公司今天的士气,一个分析员是不可能做到的,但是如果说我们可以把社交媒体上,每个人属于每个公司,他今天发出来的社交媒体信息是高兴的还是不高兴的,把这个作为一个员工情绪的指数再输给AI,用AI判断这个股票是应该买还是应该卖呢?

 

  这个例子我可以讲一千个例子给你,因为一个基金经理决策只是靠几十个,几百个因素,几千个因素,而AI可以用无限的数据,无限的因素,而且针对千人千面做出更高回报的投资。

 

  美国顶级量化基金有两家,已经达到了600亿美金的规模,已经超过了人的回报。未来这个取代会比人更好,在二级市场股票基金一定会更好,因为它对海量的数据分析能力一定远远超过人。

 

  最后一个更加神奇的例子,制药。

 

  今天的制药是靠化学、生物专家去拍脑袋想一些疑难杂症用什么新方法来治疗,未来我们可以用生成化学的方法,再加上AI自然语言处理和对抗网络去寻找哪些可能的药的新分子是可能可以最快通过动物试验和临床试验的。根据我们初步的看法,对一个药的发明可以加快4倍,整个制药行业也被重构了。

 

  对于一个传统行业,AI赋能价值是巨大的,传统行业面临各种挑战,主要的挑战是AI行业怎么懂AI赋能在哪里,他们怎么去找AI专家?

 

  这一点我们也有我们了想法,创新工厂和我们的子公司创新奇智现在对8个领域提出解决方案,这些专家怎么介入呢?我们希望扮演的角色不只是VC投资公司,我们希望成为传统企业的首席AI官,我们会进来帮助每个传统企业分析在你各个部门里面,哪一个部门用AI可以产生最大价值。

 

  我们会把技术卖给你,或者是把技术送给你,连源代码,甚至派人进来,就和传统的咨询顾问一样。咨询顾问按照小时收费,我们不用收费,我们直接进去投资你这个公司,所以我们投黑科技公司,投2B公司,下面我们准备投传统公司,用AI力量来为他们赋能。

 

  总结

 

  所以今天我的演讲是分三个重点。

 

  第一个是AI会影响所有行业,尤其是传统行。

 

  第二,只有那些拥抱AI的传统行业才能得到最大的增长。

 

  最后,中国的传统行业某些领域还不是领先世界的,但是反而有可以弯道超车的机会,因为他同时做到IT化、数据化和AI化,这一定会帮我们带来2030年的50万亿的价值。

推荐文章

Calamari是一种新的开源OCR识别软件,它使用了最先进的Tensorflow实现的深度神经网络(DNN)。 提供了预训练模型和多模型投票技术。由卷积神经网络(CNNS)和长短时记忆(LSTM)层构成的可定制网络架构通过Graves等人的连接时间分类(CTC)算法进行训练。而GPU的使用大大减少了训练和预测的计算时间。我们使用两个不同的数据集来比较Calamari与OCRopy,OCRopus3和Tesseract 4的性能.Calamari在用现代英语写的UW3数据集上达到0.11%的字符错误率(CER),在用德语写的DTA19数据集上达到0.18% 错误率,其性能远远优于以上现有开源软件的结果。使用了目前OCR最先进的的技术,CNN+LSTM+CTC+voting。calamari OCR引擎,使用Python3编写,基于OCRopy和Kraken构建,它的设计使你既可以方便的使用命令行运行,也可以把它模块化嵌入到其他python脚本中。在UW3和DTA19上的识别结果错误率,与OCRopy、Tesseract4、OCropus3相比较:与其他软件相比的识别速度,有GPU加持当然很快:值得注意的事,该库主要是用来识别印刷体古籍文字,在自然场景图像上的识别并没有实验说明。文中识别所用的数据库图片示例:转载来源:《开源OCR文字识别软件Calamari》 

热门文章

波士顿 - Neurala公司今天推出了一款新的视频标注工具,该工具由Brain Builder平台的人工智能辅助。“自动视频注释将显着加速神经网络的数据标注,从而帮助组织更快地培训和部署AI,”该公司表示。标记图像和视频对于开发用于建模和训练AI应用程序的数据集至关重要。Neurala  以软件即服务(SaaS)为基础提供Brain Builder,以帮助简化深度学习的创建,分析和管理。Neurala的联合创始人兼首席执行官Massimiliano Versace说:“人工智能数据准备的传统方法极其耗时且耗费人力,需要大量数据,需要经过精心和昂贵的注释。” “我们与Brain Builder的目标是通过易于使用的注释工具降低进入门槛。通过添加视频注释,我们能够进一步自动化数据准备,帮助组织将AI数据准备的时间和成本降低至少50%。“Neurala的专利和获奖技术源于2006年NASA,DARPA和空军研究实验室的神经网络研究。2013年,该公司加入了Techstars商业化计划。“每个人都想要AI,但他们不知道为什么,”Neurala的联合创始人兼首席运营官Heather Ames Versace说。“视频注释工具是终身AI技术堆栈的一部分,可提供透明度。”启用AI的注释可节省时间,提高工作效率当用户标记视频中的人物,物体或缺陷时,Neurala的新工具可以反复学习。Neurala表示,在用户在第一帧中标记感兴趣的项目后,该工具会自动在后续帧中注释相同的项目。例如,如果五个人输入一个框架,则在用户仅用一个人标记第一个框架后,它们将全部自动注释。相比之下,用户必须在他或她进入框架时标记每个人,这将花费更多的时间。此外,AI辅助视频注释可以提高标签处理速度并提高生产力,Heather Ames Versace告诉“ 机器人商业评论”。例如,用户可以注释10秒视频的一帧并获得300个注释的输出,而使用传统的注释方法,用户需要手动标记300个不同的图像才能获得相同的结果,Neurala说。“可解释性和信任始于数据,”Heather Ames Versace在最近的AI World大会上说。“通过在更短的时间内对数据进行注释和标记,团队可以进行更快速的原型设计。”用Brain Builder存钱“最终,它将帮助组织和开发人员更有效,更具成本效益地构建,培训和部署人工智能,”Massimiliano Versace说。“当涉及视觉AI的构建方式时,Neurala的Brain Builder平台已经在改变游戏规则。而现在,视频注释将进一步扩大可访问性和生产力的可能性。“Neurala说,Brain Builder还可以提供可观的投资回报。使用Brain Builder,组织可以以每小时6,750美元的视频进行注释,而没有它的则为13,500美元。Neurala发布  了一个教程  ,概述了使用Brain Builder在视频中标记对象的过程和好处。它还解释了如何使用TensorFlow训练语义分段网络。此外,本教程还引导观众了解跨多个GPU的培训步骤,这可以进一步缩短培训时间。