开放旧阵地,寻找新战场,商汤这一年

摘要

一边开放,一边夯实,一边先锋实验。

又是一年春运时。在这机场火车站最繁忙最拥挤的一个月,你会发现相较于往年,不论是出行秩序还是效率,都让人满意很多。

首都机场 T2 航站楼,一套智能旅客安检系统正在紧张工作。在它的帮助下,旅客「人」「票」「证」三合一核验能够自动完成,并且在安检过程中能够实现「人包绑定」,防止行李误拿或丢失。这样一来,旅客的通过效率提升了超过 40%,安检压力得以有效缓解,旅客也不再需要那么早出门排队。

这套智能安检系统的核心是商汤科技的视觉分析技术,在去年春运之前已经工作超六个月。同样的,你会发现,在石家庄正定国际机场以及刚刚投入使用的北京大兴机场,类似的系统也在运行。

在 2019 极客公园评选的极客雇主 Top 30 榜单中,商汤科技榜上有名。在评选过程中,我们发现,作为全球领先的人工智能平台公司,商汤在成立五年多的时间里,已经长出了一套完整的从自主研发到落地应用的有效路径,为员工提供了极佳的创新环境,同时其良好的盈利能力又给员工提供更多的职业保障。在学术和商业的双轮驱动下,商汤正处在健康发展的正向循环中。

智慧城市——在全球范围内寻求更高市占率

盘点 2019 商汤的动作,你不难发现一些表征。

作为计算机视觉技术厂商,智慧城市是商汤的重要业务板块之一。2019 年,我们看到商汤在智慧城市方面进行了一次「大版本」的思维升级,将以往单个改造的城市场景进行统一考量,推出「智能城市操作系统」(AI City OS)。

操作系统作为底层基础设施,是行业协作游戏。关于商汤 AI City OS,官方说法是,这是一个全面、可靠、开放的架构参考,「希望以此为宏图,与全行业伙伴一起,将『能看懂、能思考、能指导行动』的核心能力带给城市的各个场景。」

在一个行业里,「头羊」做平台是惯有路数。作为计算机视觉行业的头羊,商汤也未能免俗。做平台的好处多多,一方面,合作伙伴的加持可以让商汤将触手伸到以往自己没办法亲力亲为的细分场景中;另一方面,多源、多态的数据也能带来更加精准的运算。

然而大规模运算也会带来挑战。城市是复杂的生命体,有着大量的碎片化和长尾业务。要在更大规模运算的前提下取得更灵活的调度,要求商汤拥有工业级算法的生产能力,且具备为伙伴提供低成本、高效的架构的能力。

以升级的「城市视觉中枢」为基础,商汤不断扩充「AI City 端边云一体化方案」,推出多款开放的边缘智能算法产品,借助合作伙伴的力量满足智慧城市全场景业务创新的需求。包括人行道违章停车、烟火检测、伞棚违规占道、共享单车杂乱摆放和违停、垃圾满溢和暴露检测、工程车抛洒检测等,全面提升从街区、公园、校园、社区,到写字楼、银行、机场、地铁等场景的综合管治效率。

商汤的智慧城市落地不仅局限在国内。圣诞节前夕,商汤与泰国 SKY ICT 及泰国知名地产开发商 Sansiri 签署三方合作协议。根据协议,商汤将为 SKY ICT 提供 AI Cloud 云技术,由此为 Sansiri 提供「智慧楼宇」解决方案。此前,商汤 AI 技术亦为万科集团、世茂集团等中国本土地产企业提供智能化升级服务。此次向泰国地产的延展从一定程度上标志了商汤智慧城市全球化探索的第一步。

不断展露的 AR 野心

尽管仍旧面临传输、应用创新等多项挑战,AR 还是成为 2019 年的新热词。在 CES 2020 现场,三星、Nreal 等公司的 AR 眼镜展台前人满为患,业内正翘首等待着这项新技术对包括导航、导购、游戏、测量、教育教学在内的多种场景的变革。

在这片战场上,为了抢占生态先机,2017 年,苹果、谷歌等国际巨头不约而同地发布开发者工具。就国内而言,商汤在 2016 年推出 SenseAR 平台也是抱着同样的目的。

作为一家 AI 公司,商汤将 AI 和 AR 结合的思路在国内的 AI 产业中非常独特。这受益于其「产学研」结合的发展路线。2017 年,商汤与浙江大学共建「浙江大学-商汤三维视觉联合实验室」,重点研究 SLAM 和三维重建等方向。

这一年是商汤 AR 秀肌肉的一年。在移动设备上,商汤助力多个手机厂商实现体感游戏及尺子测量等功能。腾讯手游「一起来捉妖」在部分安卓手机上也采用商汤 SenseAR 平台提供的特效引擎,以取得视觉延展能力及自然真实的互动。

2019 冬天,在北京王府中环,一场有关古代科举考试的展览正在进行。这场名为「金榜题名」的互动式展览由故宫文化主办、紫禁书院策划,商汤作为技术合作伙伴提供了人脸关键点识别及 AR 技术能力。

其中,商汤应用 240 人脸关键点定位技术,与故宫文化共同打造「号舍考生相」展项。观众走到互动屏幕前,设备自动将观众的动作与号舍考试的虚拟考生形象连接在一起,用头部运动驱动虚拟考生的姿态。

另一个 AR 互动式展项「孔庙祭孔」采用商汤 SenseAR 平台的手势识别、人脸识别等 AI+AR 技术。当观众走到展区时,与现实场景融合的孔子等比例虚拟人像出现,在观众摆出标准的「拜礼」手势向孔子回礼后,触发设备拍照合影。这样一来,观众就能拿到一张与孔夫子的合影照片。

这一年,商汤在 AR 领域的野心实打实地展现出来,通过与多个文化艺术项目的合作展现技术实力。在与故宫的合作之外,商汤还联合湖北省博物馆、苏州云观博合作打造 AI+AR 博物馆项目「曾侯乙编钟」。观众将移动设备的摄像头对准编钟实物或图片,以手代槌敲响 AR 技术生成的虚拟曾侯乙编钟。2019 年 6 月,商汤携手上海当代艺术馆举办「Art×AI」系列艺术展览。

2019 年春天是商汤与浙大联合实验室的丰收时刻。5 月,实验室发布了首个面向 AR 的单目视觉惯性 SLAM 数据集和评测标准,更全面地覆盖移动 AR 环境下的场景,向行业引领者及标准制定者的角色更进一步走深。

智能汽车——面向未来的隐形发力点

在计算机视觉领域的技术积累将商汤引入智能汽车行业,这是很自然的事。2017 年 12 月,本田与商汤签订长期合作协议,共同深耕自动驾驶技术,让商汤的视觉技术在自动驾驶方面的应用受到行业关注。

但事实上,自 2016 年起,商汤便开始布局 AI 技术驱动的自动驾驶解决方案的研发工作。拥有包括感知、分析预测、决策规划控制、城市级三维地图重建及无人车高精度定位等技术能力,以摄像头为主、多传感器融合的策略构建 L4 级自动驾驶解决方案。

目前商汤的自动驾驶汽车已在日本常总市、上海临港及中国杭州等地进行路测,实现在半开放场地内的无接管自动驾驶。此外,商汤还在日本常总市打造了一座「AI·自动驾驶公园」,这里也将成为商汤智能汽车技术在日本的研究开发基地,并将用来进行自动驾驶车辆测试。 

除了面向车外的视觉技术,在 4 月的 2019 上海国际汽车工业展览会上,商汤首次整体对外展示了面向车内的「智能车舱」产品与解决方案,为未来新一代车载智能系统提供身份识别、疲劳检测、分心检测、刷脸开门、视线追踪、手势识别、乘客属性分析(如婴幼儿状态识别)、遗留物检测、AR 汽车伴侣-Avatar 等功能,为汽车的智能化、数字化提供技术支撑,并为终端用户带来高安全、高科技、个性化的体验。

去年,商汤还与全球汽车座舱电子科技行业的代表性企业 Visteon 正式签署战略合作协议,商汤的 AI 技术将与 Visteon 的座舱解决方案结合,以多类型的整合方案推向市场。

创新的源头

在未来 AI 时代,AI 将像水电煤等基础能源一样,赋能各个行业与职业。对于每一个人来说,具备一定的 AI 素养,掌握一定的 AI 知识和技能成为拥抱 AI 时代的基础。

新一代的 AI 教育是商汤一直以来非常重视的事情。商汤曾连续于 2018 和 2019 年发布面向高中和初中的人工智能基础课程教材,将 AI 基本原理和所需编程语言送进青少年课堂。目前,商汤 AI 基础教育已推广至青岛、上海、北京、深圳、晋中等 20 余个城市,536 所中小学,共培训 1482 名一线任课教师。

这一思路一脉相承自商汤的学术基因。众所周知,商汤初创于香港中文大学多媒体实验室,创始人汤晓鸥教授拥有深厚的学术背景。创立之初商汤便采取人才垄断和技术垄断的策略。彼时行业内人工智能人才稀少,公司联合创始人、首席执行官徐立认为,在商汤进行人才垄断之后,新一批人才的成熟至少需要 3-5 年的时间,这将为商汤带来时间壁垒。由此,商汤一度成为人工智能行业中拥有最多博士的公司。

截至目前,商汤拥有超 2000 位研究人员。在大量研究者的共同努力下,商汤已发表顶级学术论文 500 余篇,在全球各类人工智能竞赛中获奖 60 余次。最近一次,在 11 月举办的 ICCV2019,商汤及联合实验室共有 57 篇论文入选 ICCV 2019(包含 11 篇 Oral),同时在 Open Images、COCO、LVIS 等 13 项重要竞赛中夺冠。

一年前,商汤在上海联合麻省理工学院、清华大学、上海交通大学等全球 15 所高校共同发起「全球高校人工智能学术联盟」。一年后,汤晓鸥又在上海世界人工智能大会期间谈到了商汤的人才观。

他用「源头创新」的「源」字中的三滴水比喻商汤人才观的三个核心要素:好的创新环境、对人才的尊重,以及学术的充分交流。我们认为,这也很好地阐释了本次商汤上榜极客雇主 Top 30 榜单的原因。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。