我们到硅谷看了看这里的人工智能公司都在做些什么 | 极客公园超频之旅

摘要

低调的硅谷创业公司们,离商业化总是更进一步。

九月,极客公园一年一度前往美国的「超频之旅」又来了。今年,我们带着腾讯创始人之一张志东,大众点评创始人张涛以及数位国内创业公司 CEO 一起前往西雅图、旧金山和洛杉矶,探访微软和 Google的秘密实验室,深入NASA「新地平线号」的背后,了解量子计算及微软神秘的产品军火库,一睹即将在 VR 领域带来变革的 Google Daydream,也将与前沿科学家探究引力波到底意味着什么……

硅谷始终是最新技术的发源地。在结束了对微软的访问后,极客公园来到硅谷,探访了丹华资本。丹华资本由斯坦福教授张首晟创办,专注于深科技领域的投资。而在丹华资本的众多portfolio中,我们也看到了在现在大热的人工智能领域中,硅谷的创业团队们都在做着怎样的尝试。·

Pilot.ai

Pilot.ai 是一家定位于计算机视觉方向的深度学习算法公司,由四个斯坦福 CS 背景的博士和博士后创办。简单来说,Pilot.ai 做的事情就是基于基本的处理单元,在终端设备上部署深度学习算法,并且是不需要依赖于云的部署,以此来完成对环境的主动感知和计算机视觉识别。

在传统的计算机视觉中,摄像头总是在进行被动的影像录制。过去十年,深度学习越来越盛行,在脸部识别中,已经不需要工程师来寻找脸部特征,而是可以由机器来学习。这么做无疑将更加精准,但对硬件的计算能力也有了更高的要求,这便无形中限制了深度学习的运用范围和潜力。因此,Pilot.ai 希望把深度学习的能力装入嵌入型芯片,直接应用在很多小型的摄像头里,比如 GoPro。Pilot.ai 希望用有限的计算量来解决问题。

可见,Pilot.ai 的主要应用场景就是智能摄像头,变被动摄像为主动识别。落地到产品上,Pilot.ai 能在非 GPU 集群(如 ARM 处理器)上完成深度学习算法的部署,这可以大范围应用在计算能力有限的一体机上,比如无人机、VR/AR 设备、安防摄像头、运动相机等。

从技术上来看,Pilot.ai 团队对计算芯片有非常深刻的理解,能直接在汇编层面进行算法编写,不需要传统深度学习的高性能处理器,无需云端,可以在廉价计算设备和一般的图像获取设备上进行深度学习算法部署。

_DSC3741.JPG(Pilot.ai创始人在介绍自己的公司)

具体来看,Pilot.ai 的技术优势集中在三个方面:

  • 深度学习,而非传统计算。
  • 对嵌式的装置做优化。
  • 不受计算能力的限制(但还是根据不同的应用场景对计算能力有最低要求)。

如此一来,Pilot.ai 可以让自己的使用门槛大大降低,即使没有高性能的硬件,客户也可以直接将 Pilot 的技模块术嵌入到自己的产品中。可以说,pilot.ai 的目标就是:让任何地方的摄像头都能够主动识别周围的环境。

Pilot.ai 的应用场景很丰富,这也决定了它在商业化上的空间很大。

无人机便是一个重要的应用场景。Pilot.ai 将为无人机做视觉追踪降低门槛。对应到产业中,这会大大缩短业界其他无人机和大疆在计算机视觉方面的差距。对于这些新晋无人机厂商来说,直接购买嵌入了 Pilot.ai 算法的芯片就可以获得其计算机视觉识别能力,从而摆脱 GPS 追踪定位,通过直接对人体特征的识别来进行追踪。

安防摄像头的应用场景也非常广。对环境和人的主动识别将大大提高识别的精度,并且,深度学习的能力也将不断优化其识别能力。而 Pilot.ai 的特别之处在于,其所有的计算过程都在摄像头内完成,不需要额外的计算机视觉芯片。目前,在美国,Pilot.ai 正在和某大型国际电子消费品牌进行合作,由其渠道资源(线下零售商店)来帮助 Pilot.ai 快速进入各大线下超市。

汽车是更大的市场。比如,将摄像头安装在汽车正面挡风玻璃上,用来识别司机和乘客的情况,这将会是 Uber、滴滴等共享出行服务上会需要的。Pilot.ai 认为,如果要定义自己的市场,就要找最大的市场来定义。

目前,在上述诸多应用场景中,Pilot.ai 首先选择了跟一家无人机合作。这份订单为 Pilot.ai 带来了 800 万美元的收入,已经超过了公司的上一轮融资额。而之所以可以获得这么高的定价,是因为这是一个排他性的合作,也是多方竞价的结果。

而 Pilot.ai 保持前进的关键在于快速产品化,通过和芯片公司合作快速打通渠道,进入市场。一旦产品大规模铺向市场,其能够捕捉到的数据量也将大大增加,从而反哺其计算能力。总之,大量的客户是 Pilot.ai 最重要的壁垒。

在 Broadlink 创始人刘宗孺看来,Pilot.ai 是有机会成为一家平台型公司的,其对应的几个应用场景背后都是巨大的市场需求。眼下,Pilot.ai 需要做的是加快融资、加快投入人力,尽量保持先发优势。

GraphSQL

这是一家试图颠覆甲骨文的公司。

图1.JPG(GraphSQL 创始人在介绍自己的公司)

从甲骨文时代开始,数据库几乎都是基于表格来架构的。但表格的问题在于数据之间的关系难以清晰的呈现出来,不利于用户去发现藏在数据之中的 insight。GraphSQL 想做的就是将图表变为更加直观的关系图谱,基于图谱来做数据库,让繁复的数据之间的关系能够一目了然。

传统的关系型数据库(如 Oracle,SAP, MySQL 等)用于存储关系复杂的数据导致查询复杂、缓慢。GraphSQL 应用图形理论存储实体和实体之间的关系信息,开发出了一套不一样的数据存储和处理技术,让算法更高效,并且对于复杂性高、非结构化的数据也表现出更强的计算能力。GraphSQL 建立了快速且大规模的图谱数据库和分析平台,使得企业用户可以实现基于图谱的应用和解决方案,以充分发挥大数据的实时分析潜力。

更通俗一点来说,就是 GraphSQL 改变了人们一直以来用 excel 式图表来记录和描述数据的习惯,而是通过画像、画像与画像之间的关系来描述数据。这其中,需要的便是 AI 的计算能力,把数据中的规律挖掘和提炼出来,再通过图谱化的数据结构表现出来,让数据的可用性变强。

因此,GraphSQL 的核心就是数据结构和基于大数据以及人工智能的计算能力。

这样的一套新数据算法和机构产品将更加适用于需要处理关系复杂的数据的商业领域,比如社交网络、社交游戏、推荐引擎、机票搜索、银行诈骗侦查等。例如,在金融风险领域,GraphSQL 能将一个人的社交关系链、与信用相关的场景等信息都关联出来,并用图谱的方式呈现出来,从而将这个人的信用等级直观的展现出来。

目前,不少对图关系数据有大量需求的大型企业都是 GraphSQL 的合作伙伴,其中,付费的大客户有支付宝、乐视、携程、Wish 等。GraphSQL 与支付宝的反洗钱和反欺诈项目已经上线,与新浪的合作也已经开始。另外,公司正在与国家电网合作优化电路调度和实时电力配置,顺丰也有初步合作意向在物流领域进行系统优化,在银行、电商领域基础上进一步提供能源与物流垂直领域的解决方案。

但就合作方式来讲,GraphSQL 为这些大客户提供的都是高度定制化的服务,这在未来或许会使它们遇到瓶颈。

深度定制意味着要为每一个客户的个性化诉求服务,这将不利于未来的规模化扩张。更理想的方式,或许是将这套算法和数据结构做成标准化的产品,比如能够直接调用的 API,让更多中小客户可以直接通过 API 获得服务,按图索骥,生成自己想要的数据图谱。

而更激进的方式是做成开源平台,通过这样的方式让更多客户快速的接受这种新的数据库模式,让自己更快的成为一种新的标准。随后,再在这个基础上提供增值服务。其实,这也是国内大部分 SaaS 公司的思路。

LOOM.AI

LOOM.AI 同样是一家计算机视觉公司,他们基于机器学习、逆向绘制以及视觉特效等核心技术,让数以万计的用户在他们的移动平台上快速创建属于自己的 3D 数字形象。

图2.JPG(LOOM.AI创始团队在介绍自己的公司)

随着计算资源越来越便宜,他们把原来在电影里才能实现的特效都移植到了手机里。也就是说,只需要一张手机拍摄的正面人脸照片,便可以在手机上实时为用户生成高度仿真的 3D 脸部模型,这个过程大概只需要 20 到 30 秒。而生成的模型可用于游戏、视频通话、虚拟现实、安全应用、电子商务等多个领域。

在做 CG 建模这件事上,真正做的好的团队都是从好莱坞「特效大厂」出来的 LOOM.AI 的创始团队便来自工业光魔和梦工厂。其中,创始人&CEO 为梦工厂近 20 年工作经验的高级特效总监 Mahesh Rama,曾指导制作的电影有马达加斯系列、HOME、Mounster&Pumpkins。创始人&CTO Kiran Bhat 曾任工业光魔工作室的的高级特效总工,负责制作的电影特效有星球大战、复仇者联盟、加勒比海盗等,其特效作品曾获奥斯卡和安妮奖提名。

团队背景也在一定程度上决定了 LOOM.AI 起步阶段的应用领域。现阶段,LOOM.AI 的应用场景主要集中在 VR 内容的制作上,VR 游戏团队 Raw Data 便是它们的客户。

但他们还想做的更多,尤其是想往 C 端迁移,借助社交网络、IM 等应用,进入「个性化表情包制作」市场。试想一下,用户仅用一张正面自拍照就可以在 30 秒内生成一个自己的 3D 头像,针对现有的 3D 头像生成技术还是有竞争力的,但关键在于 3D 头像生成的相似度和精准度。

所以说,试图切入表情包市场也是为了借助社交网络庞大的用户基础快速收集到足够多的用户面部数据,从而优化自己的 3D 模型算法,提高精准度。

不过,即使提供的是面向 C 端的服务,LOOM.AI 的主要商业模式应该仍然是与 B 端合作,将技术授权给相应的公司,再由它们来向用户提供相应的服务。举个例子,假设LOOM.AI的一个合作对象是 QQ,它的技术将帮助它们在 QQ 表情、QQ 秀上向用户提供更多尝试。

不过,LOOM.AI 公司的技术虽强,现阶段在应用场景上确实有限,团队对于商业化的方向也没有想的很清楚。随着 VR 的消费市场逐渐起势,LOOM.AI 或将找到更多机会。

最新文章

极客公园

用极客视角,追踪你最不可错过的科技圈。

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

顶楼

关注前沿科技,发表最具科技的商业洞见。