中国学者为 AI 系统测了测智商,Google 遥遥领先但仍不及 6 岁儿童

摘要

研究团队表示,他们明年将进行第三次世界范围内的 AI 智商测试。

如果你一直很好奇各大公司的人工智能系统跟人类比起来到底有多聪明的话,今天你将收获一份「标准」答案。

几天前,一篇上传到康奈尔大学网站上的论文吸引了媒体的注意,这篇题为《人工智能的智商评测与智能等级研究》的论文由 3 位中国学者所著,出自中国科学院虚拟经济与数据科学研究中心,研究者们在论文中分析了 Google、微软必应、百度和苹果 Siri 等系统,并且为人工智能系统划分了 7 个智能等级。

根据作者的阐述,该论文的部分研究成果如下:


人工智能的 IQ

AI 到底有多聪明?随着越来越多的人开始鼓吹人工智能威胁论,人们也开始对这个问题表现出关心,而来自中国科学院的 3 位学者也关注到了这一问题,通过研究,他们提出为人工智能系统建立一个标准的智能模型。

为了更好的分析 AI,人类等智能体的智能水平,我们把「知识的获取,掌握,创新和反馈」又分成 15 个小分类,从更多维度评测 AI,人类的智能。

这 15 个小分类是「图像、文字、声音的识别和输出,常识、计算、翻译、排列,创作、挑选、猜测、发现等」。


简单来说,就是给人类和机器的智能水平建立了一个统一的标尺。

在模型建立完成后,研究团队在 2014 年和 2016 年两次对世界范围内的大公司人工智能系统进行了智商测试。

在 2014 年的测试中,他们对世界 50 个 AI 系统和 3 个不同年龄段人类进行了测试,测试结果显示 Google、百度和搜狗在这些这些系统中表现最佳,但对比人类仍相去甚远。


随后 2016 年,研究团队对 Google、百度、搜狗和苹果 Siri、微软小冰等人工智能系统进行了测试,目前工作仍在进行中,不过从已经完成的工作来看,Google 和百度等人工智能系统比起两年前已经有了大幅的提升,但相较人类 6 岁的儿童还有一定差距。


研究者之一的刘锋在其博客中表示,「虽然人工智能系统,这两年得分增长很快。但在创造性这个大分类上,得分一直进展不大。而且这个分类的权重又比较高。」


人工智能的 7 个智能等级

根据上面的人工智能「标准智能模型」,论文还为智能系统划分了 7 个智能等级,从 0 级到 6 级。

第 0 级系统,其基本特征在理论上存在,但现实中并不存在这样的人工智能系统。

第 1 级系统,其基本特征是无法与人类测试者进行信息交互。

第 2 级系统,其基本特征是能够与人类测试者进行交互,存在控制器和存储器,但系统内部知识库不能增长。

第 3 级系统,其基本特征是除具备 2 级系统的特征外,其控制器、存储器中包含的程序或数据可不联网进行升级或增加。

第 4 级系统,其基本特征除了包含 3 级系统的特征外,最重要的是可以通过网络与其他智能系统共享信息和知识。

第 5 级系统,最基本的特征就是能够创新创造,识别和鉴定创新创造对人类的价值,以及将创新创造产生的成果应用在人类的发展过程中。

第 6 级系统,最基本的特征就是随着时间的向前推进,并趋向于无穷点时,不断创新创造产生新知识的智能系统其输入输出能力,知识的掌握和运用能力也将趋近于无穷大,按照基督教对于上帝的定义「全知和全能」,可以看出智能系统在不断创新创造和不断积累知识的情况下,在足够的时间里以人类为代表的智能系统将最终实现「全知全能」的状态。


AlphaGo 属于第 3 等级

规划了系统后,论文对去年至今大热的围棋 AI AlphaGo 做了分析与探讨,他们认为,从公开的资料看,AlphaGo 虽然可以通过网络实现大量 CPU 和 GPU 协同工作,但是目前 Google 目前还没有在互联网上开放 AlphaGo 接受用户的在线挑战,所以该系统不具备第 4 级智能系统的条件。

论文作者认为,对人工智能系统进行智商测试和分级有助于人们对智能系统进行分类和评判,同时也能为低等级的智能系统提供发展方向的参考。

研究团队将在 2018 年进行第三次世界范围内的 AI 系统智商测试,通过测试检验人工智能的发展水平,并绘制出对比人类智力发展的曲线。

最后,今天下午论文作者之一刘锋在自己的博客上对有关论文出处的误解做了辟谣,他声明该论文出处为中国科学院虚拟经济与数据科学研究中心,研究者为该机构的刘锋、石勇和刘颖,而不是很多媒体报道中的康奈尔大学。


文章插图来源:刘锋博客

头图来源:视觉中国

打开极客公园App阅读更多内容

最新文章

极客公园

用极客视角,追踪你最不可错过的科技圈。

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

顶楼

关注前沿科技,发表最具科技的商业洞见。