让计算机掌握常识：微软亚研院发布 Microsoft Concept Graph 和 Microsoft Concept Tagging 模型

当我们在讨论人工智能时，请注意，我们通常在讨论弱人工智能。

虽然我们现有的资源与之前可谓不同日而语——部署在云端的海量计算资源已经像水和电一样唾手可得了；互联网所容纳的信息也远远超过了过去几千年来人们所有的知识储备；以深度学习等为代表的机器学习算法的发展，也让计算机能够从这些庞大的数据中获取知识。

但是我们也不得不正视一些事实：当前的人工智能更多的是针对某个具体的问题，发展对应的算法和技术，然后再组合出一个完整的智能系统出来。这种工作方式大概相当于组合一个模型：把视觉模块、语音模块、推理模块等各个子领域的功能做好，然后把它们组合到一起。

随着人工智能拼图不断趋于完整，科学家们仍然在问自己：计算机真的能像人类一样智能了吗？我们还需要什么样的努力才能让计算机具有像人类一样的学习能力？

近日，微软亚洲研究院发布了 Microsoft Concept Graph 知识图谱和 Microsoft Concept Tagging 模型，这两款工具都用于帮助机器更好地理解人类交流并且进行语义计算（了解更多信息，请访问 https://concept.research.microsoft.com/）。对于帮助计算机进行语义方面的工作，也许它们能起到很有效的作用。

苹果是什么？

你也许会意识到，很多时候帮助你做出判断的并不是一些能够清晰列在书本的知识，而是大量常识性的概念。例如「笔是一种写字的工具」、「笔是竖直形的可以捏在手里」、「苹果是一种水果或一家公司」等等概念。

当下，计算机究竟有多智能了？它可能能轻而易举的战胜一个三四十岁经验丰富的世界顶尖棋手，但是它的学习能力以及完成一般任务的能力可能都远不及一个三四岁的孩童。研究员们从人类的学习成长过程开始入手，试图找到逐步实现机器智能的解决方法。

这个问题的答案可能是「常识」。人们在正式上小学、初中接受系统性教育开始，已经早早地开始了学习的过程。这种与生俱来的本能能让你进入小学之前已经了解诸如「糖是甜的食品」、「水是一种液体」这一类基础的概念，并且随着年龄的增长，这种并不属于某个专业领域的开放性常识也在人们的认知中日积月累，并不断丰富。

微软语义识别1.png

微软亚洲研究院发布的 Microsoft Concept Graph 就在试图让计算机复制这些常识性概念，其核心知识库包含了超过 540 万条概念。除了包含一些被绝大部分通用知识库包含的概念，例如「城市」、「音乐家」等，Microsoft Concept Graph 还包含数百万长尾概念，例如「抗帕金森治疗」、「名人婚纱设计师」、「基础的水彩技巧」等，而这些概念在其他的数据库中很难被找到。

除了概念，Microsoft Concept Graph 同样包含了大量数据空间（每条知识概念都包含一系列的实体或者子概念，例如「太阳系」底下可能就会包括「水星」、「火星」、「地球」等等）。

与一般的语义图谱相比，Microsoft Concept Graph 最大的优势就在于其能够走出单个词汇的范畴，将目光投向更复杂的语义概念，这对于计算机更好地理解自然语言有更积极的作用。

苹果是甜的

当你看到「苹果是甜的」这句话时，你几乎可以肯定这里的「苹果」指的是我们最常见的那种水果。在这几毫秒的时间里，你触发的是「根据上下文语境确定语义」这一技能，而微软亚洲研究院要做的就是让计算机业学会这一技能。

Microsoft Concept Tagging 模型可以将文本词条实体映射到不同的语义概念，并根据实体文本内容被标记上相应的概率标签。例如「微软」这个词可以被自动映射到「软件公司」和「科技巨头」等概念，并带有相应的概率标签。这个模型让计算机拥有常识性的计算能力，让机器「了解」人类的意识，从而让机器可以更好地理解人类的文本交流。具体来说，概念模型根据人类的概念推理将实体或者短语映射到大量自动习得的概念空间（向量空间）。这种映射关系是人类和机器都可以理解的。因此该模型提供了文本理解所需的文本概念映射、短语语义化理解等功能。

微软语义识别2.png 微软语义识别3.png （输入 Apple，你能在不同的语义库中得到不同的对应概念比例）

Microsoft Concept Tagging 模型区别于以往常见的文本推理模型的根本区别是他是基于网络之上的一个推理模型，将文本映射到一个显式的知识空间，将文本概念化。以搜索引擎为例，绝大多数的用户的查询词数量是很少的，搜索引擎在返回结果时需要将查询词进行额外的信息化，将很短的文本映射到大量的概念空间里面，从而解释了这一段文本。

传统的模型对于文本的推理几乎不可解释，而 Microsoft Concept Tagging 模型用不同的概念去描述一个词，并给出对应的概率，使机器能够更好地理解文本，另一方面可计算的显性词向量也体现了我们人类智能与人工智能相结合的理念（HI+AI，human in the loop）。例如社交网络的设置中，工程师可能会人为设置一些关键字去屏蔽一些不当言论，但是并不是每一个敏感词工程师都能准确找到。例如工程师屏蔽了「希特勒」、「纳粹」，却忽略了「法西斯」，现在 Microsoft Concept Tagging 模型就能对已有的概念进行延展，在系统中找到其他类似的相关性很大的关键字，做更多智能的扩展。

理解是万事万物的基础

「我们想做的，是让计算机能够更好地理解人类。」现负责 Microsoft Concept Graph 和 Microsoft Concept Tagging 模型的微软亚洲研究院资深研究经理闫峻博士说，「理解是万事万物的基础，我们用计算机抓取过去这些不成文的开放领域的常识，能够帮助计算机更具象地了解这个世界。」

微软语义识别.jpg

图（从左至右）为微软亚洲研究院研究员纪蕾，资深研究经理闫峻，研究员张大卫

对于这类知识图谱，学术界和工业界都有参与，但始终离不开一些根本问题：如何去获取实体、实体和实体之间的属性和关联。在过去，知识库系统和人类的思考方式差异巨大。例如「奥巴马生日」，过去计算机能理解这个词的含义，却不能直接给你回答，而此次微软开放的 Microsoft Concept Graph 和 Microsoft Concept Tagging 模型就希望能为人们提供一个更智能化知识图谱，借助它，从实体到抽象概念，计算机都能够理解。

谈及 Microsoft Concept Graph 和 Microsoft Concept Tagging 模型的下一步计划，闫峻博士表示目前该模型暂只能支持英文，还要和高校合作完成中文的支持工作。在完成中文的知识库构建之后，再逐步扩展到多语言版本。其次，人类的语言还涉及到比喻、夸张和玩笑等高层次跨领域的抽象表达方法，这也是接下来需要让机器不断学习的方向。最后，从短文本的理解到长文本的理解，如理解两个完全不同的故事，但语义层面在表达同样的道理，也是他们接下来不断努力的方向。

Microsoft Concept Graph 和 Microsoft Concept Tagging 模型可以应用于不同的文本处理应用，包括搜索引擎、自动问答系统、在线广告系统、推荐引擎、聊天机器人、以及人工智能系统等。目前这个模型已经进入了微软的多个产品和服务中。微软亚洲研究院资深研究经理闫峻博士表示：「我们希望 Microsoft Concept Graph 和 Microsoft Concept Tagging 模型的发布可以推动知识挖掘、自然语言处理等领域的发展，最终推动人工智能的进步。」

（本文根据微软亚洲研究院提供的资料整理而成）

苹果是什么？

苹果是甜的

理解是万事万物的基础

最新文章