世界首批智能音箱 AI IQ 测试结果发布

摘要

2018 年 1 月 30 日,科学院虚拟经济与数据科学研究中心刘锋,石勇,刘颖团队公布了小米,京东和阿里智能音箱的 AI 智商测试结果,这是该研究团队基于 2014 年以来团队形成的 AI IQ 测试方法进行的又一次重要的人工智能测试。

2018 年 1 月 30 日,科学院虚拟经济与数据科学研究中心刘锋,石勇,刘颖团队公布了小米,京东和阿里智能音箱的 AI 智商测试结果,这是该研究团队基于 2014 年以来团队形成的 AI IQ 测试方法进行的又一次重要的人工智能测试。

该研究团队 2014 年第一次在世界上发表论文提出 AI 的标准智能模型,提出任何一个智能系统或智能产品都是一个同时具有「知识的获取,掌握,创新和反馈」的系统。只是不同智能系统在这四个方面表现强弱不同。例如鹰的识别能力很强,IBM 沃森系统掌握的世界常识很多,人类科学家能够发现万有引力,相对论,创新能力很强。相声演员的语言表达能力很强等等。


基于这个模型,研究团队又将这四个领域拆分成 15 个更为精细的分类。如声音,图像的输入输出,常识,数学,翻译的掌握,发现规律,创作文章,猜测预测的创新能力等等。在 2014 年和 2016 年对包括 SIRI, 谷歌,6 岁,12 岁,18 岁人类进行了世界第一次 AI 与人同时开展的智商测试。测试结果发现到 2016 年得分最高的谷歌离 6 岁儿童依然有一定差距,虽然在这两年内人工智能有了快速的发展水平,但在知识的创新领域依然进展缓慢。

刘锋、石勇、刘颖团队的研究成果受到世界范围科学界和媒体的广泛关注,2017 年麻省理工科技评论,美国 CBNC, 日本每日新闻,以及中国,欧洲,中东等国家和地区主流媒体对 AI 智商的研究进行了深入的报道。

按照刘锋,石勇,刘颖团队的最新研究成果,AI 产品的 AI IQ 分为三种,第一种是 AI 系统与人类以平等的身份参与测试形成的 AI 智商,也就是 AI 通用智商(AI G IQ)。第二种是 AI 系统作为人类的服务者,在服务人类的过程中体现的 AI 智商,也就是 AI 服务智商(AI S IQ),第三种是购买者用多少价格可以购买到多少 AI 服务智商,这就是用 AI 服务智商除以公开定价,于是就得到 AI 价值智商(AI V IQ)。

本次重点测试智能音箱在服务人类过程中体现的智能,因此本次没有测试 AI 通用智商。测试得到了小米,京东,阿里智能音箱的 AI 服务智商和 AI 价值智商,结果如下。

从测试结果看,小米音箱在基本常识和专业技能,交互友好度等方面表现较优,在设备互联方面京东叮咚和阿里天猫精灵表现较好,原因是小米音箱目前只能控制小米的智能产品,而京东和阿里属于平台型互联网企业,合作商家多于小米音箱。阿里天猫精灵在识别用户身份上略优于其他两个品牌。

智能音箱总体在自动联网方面明显较弱,用户需要多步骤配置,不够智能。由于智能音箱主要通过声音进行交互,因此总体得分不高。但作为人类重要的交互方式,图像输入和展示未来是不是智能音箱必备的功能值得厂家关注,目前亚马逊和腾讯的智能音箱产品已经具备了图像输入和展示功能,但带来的负面影响是成本会大幅度提高。据研究团队介绍,在春节后将发布更多和更完整的智能音箱 AI 智商测试结果。


最新文章

极客公园

用极客视角,追踪你最不可错过的科技圈。

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

顶楼

关注前沿科技,发表最具科技的商业洞见。