未来人类将被AI取代?

如果说有一项技术彻底改变了 21 世纪,那一定是人工智能。Google 新掌门人 Sundar Pichai 曾说:“人工智能带给我们生活和工作的改变,甚至将超过火和电。”虽然噱头满满,但不可否认的是,人工智能正在翻天覆地的改变着人们的生活方式。以前只有在科幻小说中才能了解到的工具和生活方式正在人工智能的加持下,从各个角度渗透进我们的日常生活,并带动着技术进步、产业升级、推动市场经济整体快速发展。因此,正确理解人工智能的概念就变得非常重要。本文将帮助你理解人工智能的定义、阶段、类型以及研究领域。

人工智能的定义

1956 年,John McCarthy(1927~2011)在达特茅斯会议上提出了“人工智能 (artificial intelligence,AI)”一词。他将人工智能定义为:

“制造智能机器的科学与工程。”

‘The science and engineering of making intelligent machines.’

人工智能也可定义为能够执行需要人类智能的任务的计算机系统的开发,如制定决策、检测对象、解决复杂问题等等。

 

 

人工智能的阶段

很多文章都认为,强人工智能(Artificial General Intelligence)、弱人工智能(Artificial Narrow Intelligence)以及超人工智能(Artificial Super Intelligence)是不同类型的人工智能。其实更确切地说,它们是人工智能的三个阶段。

弱人工智能(ANI)

弱人工智能,又称为狭义人工智能。在这一阶段,机器并不具备任何思维能力,只是执行一组预定义的功能,如语音识别、图像识别等,是擅长单个方面的人工智能,类似高级仿生学。它们只为解决某一特定具体的任务而存在,大多是统计数据,从中归纳出模型。比如, AlphaGo 只会下围棋,并不能执行其他任务。

 

 

弱人工智能的例子包括 Siri、Alexa、自动驾驶汽车、AlphaGo、人形机器人 Sophia 等。到目前为止,几乎所有基于人工智能的系统都属于弱人工智能。

强人工智能(AGI)

强人工智能,又称为通用人工智能。不同于弱人工智能,强人工智能可以像人类一样应对不同层面的问题,而不仅仅只是执行一组预定义的功能。不仅如此,强人工智能还具有自我学习、理解复杂理念等多种能力。也正如此,强人工智能的开发比弱人工智能要困难得多。事实上,人工智能国际主流学界所持的目标也仅局限于弱人工智能。目前很少有人进行强人工智能的研究,也尚未形成相应的成果。

 

 

强人工智能还被许多科学家视为对人类生存的威胁, Stephen Hawking 警告称:

“完全人工智能(Full Artificial Intelligence)的发展可能意味着人类文明的终结……人工智能一旦脱离束缚,会不断加速重新设计自身。而人类由于受到生物进化的时间限制,无法与之竞争,很可能会被取代。”

超人工智能(ASI)

当弱人工智能已经大部分实现,强人工智能正在通过深度学习不断逼近之时,超人工智能的概念呼之欲出。在这一阶段,计算机的能力将超越人类。目前,强人工能智能是电影和科幻小说中描述的一种假想情景:机器已经接管世界。

 

 

“人工智能(我指的不是狭义的人工智能)的发展速度快得令人难以置信。除非你能够直接接触到 DeepMind 这样的组织,否则你根本不会知道人工智能的增长速度有多快——它正以接近指数级的速度增长。在五年内(最多十年)将存在发生危险事件的风险。"

——Elon Musk

人工智能的类型

当有人让你解释不同类型的人工智能系统时,你必须根据它们的功能进行分类。密歇根州立大学 Arend Hintze 将人工智能分为以下几种类型:单一反应型、有限记忆型、具有心智型以及自我意识型。

单一反应型(Reactive Machine AI)

这种类型的人工智能是最基本的人工智能系统,它仅基于当前数据运行的机器,只考虑当前情况。也就是说,反应型机器只能进行反应,它既没有记忆能力,也无法利用过去的经验来制定现在的决策。

 

 

反应型机器的一个典型例子就是著名的 IBM 国际象棋程序 Deep Blue 。1997 年 5 月,它以 3.5:2.5 的战绩击败了世界冠军 Garry Kasparov,成为首个在标准比赛时限内击败国际象棋世界冠军的计算机系统。

Deep Blue 看似拥有人的智慧,实际上,它只关注棋盘上的现状,并在可能的走法中作出决策。除了遵守重复棋局不能连续出现三次的规定外,和经验丰富的人类不同,它对过去并没有任何概念。

目前的人工智能,要么对世界没有概念,要么只对其执行的特定任务有极其有限、具体的概念。Deep Blue 的创新之处在于,它放弃了拓宽计算机可能考虑的棋路范围的这种思路。相反,开发人员找到了一种方法,让它缩小自己的“视角”,根据它对某些走法的结果进行评估,停止追求一些可能的走法。类似地,AlphaGo 也无法评估所有的走法,但它采用了比 Deep Blue 更为复杂的方法:使用神经网络来评估棋局的走势。

这种类型的人工智能无法在专业领域之外发挥作用,而且容易被愚弄。它们无法通过交互的方式成为世界的组成部分。很显然,它们只是最基本的人工智能系统,并不符合我们对人工智能系统的未来预期,即能够与人类展开真正的互动,甚至对周围的环境作出真实的反应。

有限记忆型(Limited Memory AI)

有限的记忆,顾名思义,指人工智能可以通过研究以往的数据作出明智的决策。这种类型的人工智能具有短暂或临时的记忆,可以用来存储过去的经验并评估未来的行为。

 

 

自动驾驶汽车就是这种类型的人工智能,它利用最近收集的数据作出即时决定。例如,使用传感器识别过马路的行人、陡峭的道路以及交通信号等,从而作出更好的驾驶决策,这有助于防止交通事故的发生。

然而,自动驾驶汽车的历史信息存在的时间很短暂,无法像经验丰富的人类驾驶员那样将其存储在“经验库”中。这种类型的人工智能,并不能构建全面的“表现”(representations),它并不能记住自己的经验,并学会如何应对新的情况。

具有心智型(Theory Of Mind AI)

心智理论,心理学术语,是人类能够理解自身及周围人的心理状态的能力。这一理论来源于哲学,进入心理学领域后,慢慢成为认知心理学与神经心理学的研究重心之一。心智理论是人类社会形成的关键,通过这一理论,人们可以更好地理解社交、互动的内在动力。试想,如果人类不能理解彼此的动机和意图,那么,相互间的沟通、合作就会变得异常困难,甚至毫无可能。

 

 

这种类型的人工智能较前两种更为先进,它在心理学中扮演着重要的角色,主要体现在对机器“情商”的开发上。

如果人工智能系统真的能够与人类并肩行走,它们就必须能够明白,每个人都有思想和感受,理解人类预期,并由此调整自身行为,这正是我们目前的人工智能与未来的人工智能之间的重要差异。

自我意识型(Self-aware AI)

这是人工智能发展的最后一步:构建一套能够形成自我表征的系统。像 Elon Musk 和 Stephen Hawkings 这样的天才一直警告我们警惕人工智能的进化。让我们祈祷,我们永远不会达到这种人工智能的状态。因为,在这种状态下,机器将拥有自己的意识,它能够意识到自我,知道自己的内部状态,还可以预测他人的感受。当前,具有自我意识的人工智能离我们还有很远的距离。然而在未来,到达超人工智能的阶段仍存在可能。

 

 

人工智能的研究领域

人工智能可以通过以下技术解决现实问题:

机器学习
深度学习
自然语言处理
机器人
模糊逻辑
专家系统

 

 

机器学习

机器学习是一门借助机器解释、处理和分析数据以解决实际问题的科学。它的根源可以追溯到 1952 年就职于 IBM 的 Arthur Samuel(被誉为“机器学习之父”)设计的一款西洋跳棋程序。机器学习有三种类型,分别为监督式学习、无监督式学习和强化学习。

毫无疑问,机器学习有助于人类克服知识和常识方面的瓶颈,而我们认为这些瓶颈会阻碍人类水平的人工智能的发展,因此许多人将机器学习视为人工智能的梦想。

想了解有关机器学习的更多信息,你可以浏览以下博客:

Machine Learning Tutorial for Beginners

What is Machine Learning? Machine Learning For Beginners

深度学习

深度学习是在高维数据上实现神经网络以获得洞察力并形成解决方案的过程。深度学习是机器学习的一个高级领域,可以用于解决更高级的问题,它是 Facebook、自动驾驶汽车、Siri、ALexa 等虚拟助手人脸认证算法背后的逻辑。

想了解有关深度学习的更多信息,你可以浏览以下博客:

What is Deep Learning? Getting Started With Deep Learning

Deep Learning Tutorial: Artificial Intelligence Using Deep Learning

自然语言处理

自然语言处理是一门从人类自然语言中提取洞察力,以便与机器交流并发展业务的科学。它也是人工智能中最古老、研究最多、要求最高的领域之一。开发智能系统的任何尝试,最终似乎都要解决一个问题,即使用何种形式的标准进行交流。例如,比起使用图形系统或基于数据系统的交流,语言交流通常是首选。

20 世纪四五十年代,人们使用有限自动机、形式语法和概率建立了自然语言理解的基础。但是,20 世纪五六十年代,早期使用机器翻译语言的尝试被实践证明是徒劳无功的。20 世纪 70 年代,当时的潮流趋于使用符号方法和随机方法。进入 21 世纪后,随着机器学习的兴起,自然语言处理迎来新的突破,并推动了随机过程、机器学习、信息提取和问答等现有方法的应用。比如,Twitter 使用自然语言处理技术来过滤推文中的恐怖主义的语言,Amazon 使用自然语言处理了解客户评论并改善用户体验。

机器人

人工智能机器人是在现实环境中行动的人工智能体,通过采取负责任的行动来产生结果。这一领域在计

推荐文章

    在人脸识别应用中,很多场景能够获取某一个体的多幅人脸图像的集合(比如在监控视频中),使用人脸图像集来做识别,这个问题被称为基于模板的人脸识别(template-based face recognition)。对于多幅图像,当然可以使用单幅人脸图像的识别方法,综合多幅图像的识别结果确定最终的人脸识别结果,但更好的方式是直接基于人脸图像集提取特征,比较人脸图像集的特征相似性。这涉及到如何聚合多幅人脸图像的特征向量成为一个特征向量,使该特征紧凑而又更具鉴别性的问题。几天前公布的一篇来自DeepMind和VGG组被ACCV2018接收的论文《GhostVLAD for set-based face recognition》,正是解决这样的问题,文中提出的算法GhostVLAD在具有较高难度的大型真实场景人脸数据集IJB-B上的识别精度,远超过目前的state-of-the-art结果!非常值得参考!作者信息:算法原理作者的想法非常简单,当聚合多个人脸图像特征时,现有的平均池化等方法没能考虑到人脸图像集中一些低质量的图像(比如模糊人脸)的作用,这些图像含有的信息对识别并没有太大的贡献,应该降低这些低质量图像对最终聚合特征的贡献。一种直接的处理方法是,在人脸图像预处理阶段将低质量图像找出来,降低其贡献权重,但作者认为,端到端自动训练的方式让网络自身去优化识别并降低该部分样本的权重更好。作者发明的算法网络结构如下:多幅人脸图像(每次图像个数可不同)通过CNN网络提取特征并L2归一化,然后被送入聚合模块,GhostVLAD网络模块将多个人脸特征聚合称固定维数的特征矩阵(与输入图像个数无关),再通过全连接层FC、BN层和L2归一化为紧凑鉴别的特征。其中的关键网络模块GhostVLAD既实现特征聚合,同时降低低质量图像的权重,提高高质量图像的聚合权重。GhostVLAD是如何实现上述功效的呢?说白了一句话,既然不要人为参与,那就要构建一种网络结构,让网络自动学习对识别不重要的信息,并丢掉它。作者是在NetVLAD上做出的算法改进,NetVLAD可以理解为一种可微分完全可训练的VLAD编码聚合方法,它的作用大致是自动计算特征聚类中心,计算残差,然后把残差加权,构建聚合特征矩阵,整个过程方便加入到神经网络中。在NetVLAD中,其聚合的特征矩阵中的元素计算方法如下:其中K是NetVLAD中手工设置的聚类中心个数,xi是第i个特征向量,ck是可训练的聚类中心,ak、bk是可训练的参数控制着加权的权重。由上述公式得知,NetVLAD中所有聚类中心ck都参与了聚合,GhostVLAD的改进则是增加聚类中心的个数到K+G,但是增加的聚类中心在构建聚合特征矩阵的时候不参与贡献权重。如下图所示:红色位置即标示出的Ghost 聚类中心,后续步骤中被去除,Ghost有“幻象”的意思,可能很多模糊的人脸的确看起来是“幻象”,这也是GhostVLAD名称的由来。这些多出来的不参与聚合特征矩阵构建的Ghost聚类中心,就相当于给了神经网络丢弃一部分信息使得网络更具鉴别性的可能,而在原来的NetVLAD中是体现不出来的。实验结果作者首先设计的实验是比较网络加上GhostVLAD层跟不加的精度,验证其有效性,作者使用的训练集是VGGFace2。实验设置不再赘述,这里直接给出结果。在IJB-B数据集上的1:1人脸验证结果比较如下图,取得了大幅度的精度提升。在IJB-B数据集上的1:N人脸识别结果比较如下图,同样取得了大幅度的精度提升。然后作者将提出的算法GhostVLAD与目前的state-of-the-art比较。如下图中Table 3和Table 4,在IJB-A和IJB-B上比较验证和识别结果,同样所提算法精度也胜出不少,请注意作者使用的训练集比其中很多state-of-the-art算法规模要小,但依然实现性能超越!最后作者可视化了使用GhostVLAD后对输入样本权重的影响,发现对于那些低质量模糊人脸的确权重被降低了。总结:该文从一个简单的直觉开始,构建了一种帮助神经网络丢弃鉴别性不足的信息的有效方式,大幅改进了基于图像集合的人脸识别方法,算法具有较高的实用价值,思想也很值得借鉴!值得一提的是,该文中的GhostVLAD方法不仅仅适用于人脸识别,在图像检索、行人重识别等领域也同样适用。论文地址:https://arxiv.org/abs/1810.09951关于代码:可惜的是,该文目前并无开源代码,但DeepMind和VGG组都是一向乐于分享代码的,期待作者早日开源~

热门文章

        对数据标注行业稍微有些了解的人都知道数据标注进入门槛低,适合很多人兼职也适合创业。        正是因为数据标注行业的门槛低这个特点最近两年从事数据标注的小公司小工作室如雨后春笋般的遍布全车大大小小的县城。        但是目前有个有趣的现象,那就是有很多进入数据标注行业做了一段时间的人慢慢的感觉数据标注行业就是个坑?为什么有些人会说数据标注就是个坑呢?        其实对与有上述问题认识的人我们认为,这些人多数都是有于对这个行业对自身条件的不了解,盲目的开始进入数据标注行业的。为什么我们会这样说呢?下面就给给大家来分析下到底有哪几方面的原因:        一、有相当一部分人是听了朋友或者网上消息说这行很火爆,好做,门槛低,也有一部分人了因此租办公室买电脑招人,然后就去群里面找分发项目的人就开张干起来了。可实际上这些人他们大多数都没有充分了解数据标注行业,更没有认真仔细得去调查分析,到底自己能不能做好一个项目,到底自己能不能有质有量按时交付的完成一个项目,到底自己有没有这个能力来管理项目。更多的人也没有去用长远的眼光去考虑数据标注项目。        二、数据标注项目虽然入门门槛低,但是相当一部分有于理解认知应变能力上都不能保证去做好数据标注项目,还有一部分人由于自己对标注项目重视程度不足接到项目之后呢?不仔细认真的去阅读理解项目规则,更没有很好的对规则质检标准去培训员工,而对员工的要求主要看重每天的产出效率,从而导致接到手的项目做的质量很差,频繁的返工,有提项目甚至因为质量太烂项目方不给结算或者是结算比例很少,最终的结果就是做好些个项目但基本都是赔钱。        三、虽然业内人都 说数据标注简单,但是标注项目他也是一个系统性的工程,一个项目能不能做好并不简单的看项目好做就能赔钱。实际上决定项目赚不赚钱考验的是一个团队的项目管理水平,质量管理能力,运营能力各方面因素的。一句话再好赚钱的项目也照样有人赚钱也有人赚钱,要赚钱不是那么简单的。        四、还有些工作室 、小公司因为对行业不够了解等他们做了一段时间后发现,自己团队经常会没有项目做,而自己团队接项目的业务能力又不具备,甚至有的时候为了员工有活干去接一些价格极低根本就不赚钱的标注项目,时间稍微一长这些工作室团队就会赔上很多钱最终关门倒闭。        五、下来要说的就是一部分人人兼职人员由于认识不到位,对项目的规则质量要求 文件不认真阅读消化理解导致做的项目质量差返工有的甚至最后不结算,最终退出这行。更有一些人由于经验不足被标注行业的项目骗子给忽悠到辛苦劳动到最后结算时找不到人。        标注行业本身由于进入门槛低,做的人很行业内盲目打价格战,导致很多转手二手三手的项目在质量工期的要求下根本就不赚钱甚至赔钱,所以在这里也提醒大家做任何事都要谨慎而行。