最伟大 Windows 降临,微软要用大模型彻底改变操作系统和交互

摘要

2023 Build 上,微软公布了 AI 服务 Copilot 全家桶,其中最引人关注的就是 Windows Copilot。

2023 年微软 Build,注定是载入史册的一届。

ChatGPT 掀起 AI 热之后,微软已经成为这股浪潮中最重要的企业之一。不仅因为其是 OpenAI 的大股东,或者推出 AI 加持的 New Bing。

更重要的是:作为全球第一大操作系统服务商、全球第一大办公软件开发商,以及全球第二大云服务商,微软的动向已经成为大模型落地最重要的推动者和风向标。

微软 CEO 纳德拉也没有让等待的信徒们失望。

昨晚 Build 开场,他在不到 30 分钟的演讲里公布,微软将在 Build 期间带来超过 50 项 AI 相关的更新,其中有 5 个重中之重,涉及 Windows、Office 365、Copilot、Bing、Azure 云等微软当下最重要的产品和服务体系。

不需要改名或者挂在嘴边「All in」,微软已经用行动证明了自己全面拥抱 AI 的决心。

Copilot 全家桶:一种全新的工作方式

「还记得软件没有连接到互联网的时候吗?」微软首席技术官 Kevin Scott 表示,几年后,对于没有 Copilot 助手的软件来说,情况也是如此。

Copilot 简单来说,就是一项嵌入各种不同软件服务的 AI 组件。基于 AI 和大语言模型构建的推理能力,Copilot 可以帮助用户完成所有需要的认知工作——从编写邮件、代码、宣传稿,到生成图像、视频,制定工作计划或者获取工作和生活建议。

大约两年前,微软在 GitHub 首次引入了 Copilot(副驾驶)的概念。GitHub Copilot 是一个辅助程序员的 AI 服务,帮助开发人员编写代码。

今年,在大模型的加持下,Copilot 迎来全面升级,可以解决更多更复杂的问题,微软也在更多核心产品和服务中心开始嵌入 Copilot。

Build 大会上,微软宣布 Copilot 生态的进一步扩展计划,包括推出 Dynamics 365 Copilot、Microsoft 365 Copilot 和 Power Platform Copilot。

其中,Power Platform 平台重要组件的 Power Pages 与 Power BI 中的 Copilot 开启公共预览,让用户更自如地通过自然语言创建网页和数据洞察。此外,Power Virtual Agent 中的生成式智能也将开启受邀预览,进一步提升构建对话机器人的体验,并为 Power Automate 增加更多的定制化可能性。

「Copilot 是一种全新的工作方式。」此前,Microsoft 365 负责人 Jared Spataro 说,「它与你一起工作,嵌入到数百万人每天使用的程序中:Word、Excel、PowerPoint、Outlook、Teams 等等」

Windows 11:AI 来了

Build 上公布的一众 Copilot 全家桶中,最重磅的当属 Windows Copilot 的到来,这意味着最先进的 AI 将作为一项基础的软件服务进入到 Windows 的核心系统。

新的 Windows Copilot 工具将位于 Windows 11 的底边栏——就像新 Bing 的 AI 聊天功能一样,用户可以在 Copilot 中输入问题并将其作为一个问答式搜索引擎使用。

表面上看,Windows Copilot 像是一个类似 ChatGPT 或者 New Bing 的对话式 AI 机器人或者文本生成工具。但与 Windows 深度集成的 Windows Copilt,可以调用其他 Windows 组件,这意味着它有潜力成为比 Siri 或者微软的小冰、小娜更强的个人 PC 智能助手。

现场演示了四个 Windows Copilot 的使用场景。

调整 PC 的个性化设置,比如打开夜间模式。

帮助处理文档,解释、重写或者总结,提升工作效率。

控制 App,比如让它推荐音乐,然后根据用户的选择打开音乐软件并播放相应的歌单。

还有辅助创意工作,根据你的要求生成一个宣传用的图片,并发送给聊天软件里的工作群组。

其实类似的处理语音或者文字命令的功能,过去在其他智能助手身上也有过尝试,包括微软自己的小娜、苹果的 Siri,以及亚马逊、阿里的智能音箱,但客观来说其效果都是令人失望。

微软 Copilot 本质上并没有换汤,但大语言模型强大的推理能力,却可能是补齐智能助手能力短板的良药。过去的智能助手处理事务的能力只有几岁小孩的水平,而至少从 ChatGPT 展现出的能力来看,已经不弱甚至很多方面强于普通的成年人。

Windows Copilot 预计将在 6 月开始提供预览版,让我们拭目以待。

Bing——ChatGPT 的默认搜索引擎

纳德拉在演讲中透露,Bing 也将有一些新的变化。OpenAI 将开始使用 Bing 作为 ChatGPT 的默认搜索引擎,提供实时检索的答案,并包括引用。

这项功能今天就向 ChatGPT Plus 用户推出,很快也将向所有免费的 ChatGPT 用户启用。

值得注意的是,ChatGPT 在调用 Bing 回答问题时,会通知用户使用了 Bing。以 ChatGPT 的流量带 Bing,这似乎有助于 Bing 的品牌。

更重要的是,Bing 通过 ChatGPT 获得更多的使用来改善其答案,并且也可能在赢得内置浏览器的默认选择时,有更大胜算——成为 Mozilla 的 Firefox 和 Apple 的 Safari 浏览器中的默认搜索引擎。

Azure AI Studio

不止提供全方位的 copilot,现在,微软还提供怎么制作 copilot 的服务。纳德拉表示:「我们已经用一个通用的架构堆栈构建了所有这些 copilot。现在,我们希望使其可用,每个人都可以为他们的应用程序构建自己的 copilot,从 AI 基础设施到基础模型再到 AI 编排的一切,一直到 copilot 及其可扩展性。」

对此,微软推出的主要产品是 Azure AI Studio。这是一个完整的工具链,帮助开发者更便捷地将外部数据源整合到 Azure OpenAI 服务中,构建智能 AI 应用程序和 copilot。

Azure AI Studio 简化了将外部数据源集成到 AzureOpenAI 服务中的过程,还引入 Azure 机器学习提示流,使开发人员更容易构建提示,同时利用 Semantic Kernel 等流行的开源提示编排解决方案。相比之下,传统的构建方式——获取数据、选择模型、训练模型、测试模型、部署模型,每个环节都很复杂。

对于 Azure AI 帮助开发者降低门槛的系列发布中,安全是微软反复提及的关键词。其中,Azure AI Content Safety 能帮助开发者构建更安全的线上环境和社区,其内置模型能检测出文本或者图片中的不当内容,并通知人工监督员采取行动。

另外,在 Azure Machine Learning 工具中,有一项功能——Responsible AI dashboard support for text and image data。该功能能够让开发者在构建、训练或评估模型阶段,评估使用非结构化数据来构建的大模型。这将有助于开发者在部署模型之前发现模型错误、公平性问题以及模型解释,从而实现更具公平性的高性能计算机视觉和自然语言处理 (NLP) 模型。

瞄准下一代 AI 应用程序的关键——数据

作为 Build 大会上一个完全的新品,微软看中了下一代 AI 应用程序的数据层,发布了端到端的数据分析产品——Microsoft Fabric。纳德拉表示,这可能是自 SQL Server 以来,微软推出的最大规模的数据产品。

Microsoft Fabric 的核心是「统一」,用一个产品、一种体验、一种架构、一种业务模型汇集了所需的所有数据和分析工具,包括数据工程、数据集成、数据仓库、数据科学、实时分析、应用可观察性和商业智能,所有这些都连接到一个名为 OneLake 的数据存储库。

除此之外,借助 Microsoft Fabric 中的 Copilot,客户可以使用会话语言创建数据流和数据管道、生成代码和整个函数、构建机器学习模型或可视化结果。客户甚至可以创建自己的会话语言体验,将 AzureOpenAI 服务模型及其数据结合起来,并将其发布为插件。

Azure Data 副总裁 Arun Ulagaratchagan 解释道:「随着进入由 AI 定义的新时代,数据变得更加重要。为特定的 AI 体验提供动力,需要从管理良好、高度集成的分析系统持续提供干净的数据。过去,使不同服务一起运行需要高额的『集成税』」。同时,Microsoft Fabric 使开发人员能够利用生成式 AI 在其数据中获得见解。

AI 插件生态系统

如果说 copilot 开启了大模型时代人机交互的新方式,那么插件(Plugin)就是扩展 copilot 能力的必要一环。事实上,继 OpenAI 3 月份推出了 ChatGPT 插件后,微软在本月早些时候也宣布了 Bing 插件。比如,插件允许 ChatGPT 和 Bing 聊天使用 OpenTable 插件查找和预订餐厅。

在今天面向开发者的 Build 大会上,微软宣布采用与 OpenAI ChatGPT 相同的开放插件标准,从而确保今后 ChatGPT 与微软一系列 copilot 产品服务之间的互操作性。

这意味着开发者使用任一平台开发的插件均同时适用于 ChatGPT 和微软的 Microsoft 365、Dynamics 365 Copilot 等服务,用以满足个人客户与商业客户的业务需求。开发者在 Azure OpenAI 企业版服务上开发的 AI 应用程序,也默认支持同样的开放插件标准——这意味着任何开发者都可以选择使用人类自然语言交互,作为其软件的互动方式。

并且,开发人员现在可以使用插件将他们的应用程序和服务集成到 Microsoft 365 Copilot 中。还可以通过将他们的数据带入 Microsoft Graph 来扩展 Microsoft 365 Copilot,使用最近宣布的 Copilot 语义索引将相关和可操作的信息上下文化。

在这个演示中,Teams 软件中的 Copilot 可以通过调用插件软件,在邮件、网站、本地数据库等各个不同地方检索信息、生成要点,还可以进一步调用其他插件,生成工单,分发给对应的人。通过插件调用,copilot 实现了深度检索、执行生成内容的步骤。

此外,Bing 正在增加对插件的支持。除了之前宣布的 OpenTable 和 Wolfram Alpha 之外,它还将在生态系统中拥有 Expedia、Instacart、Kayak、Klarna、Redfin、TripAdvisor 和 Zillow 等众多产品。

结尾

过去几个月,在「AI 正在吞噬软件」的浪潮中,一些软件创业者表示,不是 OpenAI,最怕的是微软。无论是工程能力,还是执行能力,Build 2023 都让 48 年的微软再次「刷新」。

再次立上潮头,是引领者的姿势——Copilot、插件生态、探索 PC 中的 AI 交互,微软瞄准了大模型时代的交互入口。

在过去,无论是 PC 时代的 Windows 操作系统和 Office,还是移动互联联网时代逐渐追赶的智能云和在线办公软件,微软一直是跟随者的姿态。但跑进大模型时代的微软,一手让新业务领先行业,另一手让老业务焕发生机。但正如纳德拉的开场词,PC 到 iPhone,再到云,所有这些都将是一个连续的旅程。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。