人工智能+「以图搜图」，细分巷道里的千亿级市场

「国外有谷歌，国内有百度，再想做一搜索产品还有什么机会？」

这是几年前就困惑着黄鼎隆的问题。那时候，他还在微软的 Bing 团队任职产品经理。那是一款 2009 年推出的、被微软寄予厚望的搜索产品，时任微软 CEO 的史蒂夫·鲍尔默甚至承诺将会有 60 亿至 120 亿美元投入到 Bing 的开发——这相当于当时微软运营收入的 5% 至 10%。

但是现实很骨感。在海外，Bing 的市场份额一直屈居于 Google 之后，国内更不敌百度。「竞争对手已经占据了市场先机，技术也非常好，如果一定要打胜仗，唯一的机会就是搜索的对象要有变化。」黄鼎隆说。

这个「搜索对象」最终被他认定为二维图像。2014 年，从微软离职后又先后就职于腾讯、TripAdvisor 公司的黄鼎隆和在微软时的旧搭档 Matt Scott，创办了码隆科技。这家公司目前推出的两款产品都致力于利用 AI 的视觉识别技术来识别商品。

根据平安证券发布的一份关于「人工智能图像识别」的专题报告显示，图像识别正在多领域被广泛应用，而且具有巨大的市场空间。在现实中，图像识别的应用已经在金融、安防和医疗领域被提前布局。但是在黄鼎隆和 Matt 看来，把人工智能技术直接跟「交易」相关的领域结合，提高生产效率，将是把人工智能技术推向成熟商业化的最短路径。

这一定程度上也是这家公司的内在价值观念：高高在上的人工智能技术，必须要找到细分的巷道落地，它必须成为生产力工具，才能产生他应有的效能。

（码隆科技创始人黄鼎隆和 Matt Scott）

人工智能的商业化落地：2C 还是 2B，是个问题

真正让黄鼎隆开始感到创业计划可行的起因，是相关产业链的陆续成熟。这个具体的信号来源于 ImageNet 的比赛结果：在 2010 年，ImageNet 比赛图像识别中对象分类项目的准确率是 72%，到了今年，这个数字达到了 97%。这项由斯坦福、卡内基梅隆、北卡以及密歇根等一流名校发起的一项计算机视觉竞赛，一直是计算机视觉方向发展的风向标。而 97% 的分类项目识别准确率则代表着，机器视觉的识别能力已经超过了人类。

这算是质的飞跃。2014 年，黄鼎隆觉得之前自己一直在思考的产品方向终于有机会成型。

关于图片的识别和搜索技术，其实一直在百度、谷歌等公司的搜索框架体系下有所成长，但是由于对图片中各种元素的标记效率低下等原因，搜索的结果准确率与文字搜索相比还有很大差距。

最开始，码隆科技推出的是一款面向 C 端的产品：Style AI。这款产品的功能被定位于用人工智能为用户「打造时尚」，为此，这个技术团队还专门聘请了一位服装设计师作为时尚顾问。通过识别用户上传的图片，Style AI 可以识别出图片中的同款服装商品并给出搭配建议，同时附带购买链接。

用人工智能切入「时尚」领域，这算是一个「讨巧」的方向。但是这个 to C 的 app 面临着较高成本的用户推广问题，这是擅长技术的码隆科技团队相对欠缺的方向。另一方面，为电商导流的「识图」技术似乎很难带来用户积累，的商业想象力也实在有限。

这是黄鼎隆和团队从 Style AI 里摸索出的道理：如果想要更快实现商业化，就必须用更开放的心态，把技术开放给更多成熟的商业力量使用。于是，这家公司的解决方案是及时转型：2016 年，码隆科技又推出了面向 to B 用户的 Product AI。

这款新产品的最大价值是为「以图片为驱动」的商业网站实现低门槛的以图搜图功能。背后的技术逻辑是相通的：通过机器学习，分析上亿个训练素材，从而形成对图片中各种元素的认识和了解后，机器就可以根据某一素材的「内部规律」，识别和搜索目标图片中的语义标签。根据黄鼎隆给出的数据，目前 Product AI 能够识别的㲏准确率已经优于人工识别，而相对于原本传统的「人工贴标」的方式，这家公司提供的解决方案提高了 8% 左右。

其中，柔性的服装类商品是这家公司最先切点入，也是把识别率磨砺的最为锋利的领域，但放大到其他领域时，这套系统依然能够发挥作用。与此同时，黄鼎隆也提到了自家产品与百度等平台的「以图搜图」功能不同之处：当人们进入某些网站上搜索图片时，希望找到的也许不是与原图「一模一样」的图片或者商品，而是「同款类似」的图片或者商品。他对极客公园记者以 Product AI 的 B 端客户视觉中国为例做了一个展示。

同样以一张「正在化妆的女模特」作为原图搜索时，百度和接入 Product AI 的视觉中国分别给出了以下的搜索结果。

CE4F.tmp.png

（百度展示的搜索结果）

马龙1.png （植入Product AI的视觉中国展示出的搜索结果）

视觉中国网站中出现的一排标签，就是 Product AI 根据对原图片的认知自动标注的。

「有时候我们需要的不是骑驴找驴，而是骑驴找马。比如一个设计师进入类似视觉中国这样的网站时，他需要找到的也许是某种特定地素材，比如一个化妆的模特，而这时候他只需要上传一张类似的图片，机器就可以帮他识别出他需要的素材中的标签是什么，从而帮他找到更多选择。」黄鼎隆解释。这种解决方案也可以根据 B 端客户的需求进行修改。

1.2 万亿次图片搜索背后的千亿级机会

简单说，这家以人工智能作为技术驱动的公司现在的新方向，就是寻找那些需要植入或者升级图片搜索需求的商业网站进行合作。黄鼎隆对于合作伙伴的选择有一个基本原则，那就是对方的产品必须有「交易属性」。

也就是说，在某个以图片（比如视觉中国）为主要驱动的商业网站里，Product AI 可以根据对方提供的图片以及视频数据，专门为该网站建立或者升级搜索引擎。同时帮助该企业实现图像标记、分类、聚类和定位等功能。最终在每一次搜索过程中，网站用户可以更加轻易的做出购买决定。

「人工智能技术应该落到一个可以发挥实际商业作用的领域里去，而我们认为交易才能够产生现金流。」黄鼎隆说。现在，码隆科技 Product AI 已经通过 API 接口开放给的合作伙伴包括：视觉中国、微软在线、瑞丽、暴风影音、优料宝（纺织品交易平台）等等。而每笔通过「以图搜图」行为产生的购买行为发生时，码隆科技则可以得到一定份额的分成。

这实际上构成了码隆科技这家公司商业化的最初探索。根据黄鼎隆介绍，该公司已经实现正向现金流，并且在今年 10 月刚刚获得了来自达晨创投和远镜创投、中信建投等机构的 6200 万 A 轮融资。

目前，这家以人工智能作为驱动的公司现在切入的领域似乎很难定义，它和「购买」、「交易」有关。这个概念似乎过于宽泛，但是黄鼎隆认为：「粗略的说，我们希望做的是把任何一个图片跟某一个商品连接起来，这个事情产生的价值可以跟一般的搜索引擎类比，根据谷歌每年的收入，除以每年搜索量，可知每一次产生的链接，他产生的价值是 7 美分，而全球去年有 1.2 万亿次的搜索量。而一张图片跟一个商品连接起来的时候，保守估计每次链接能够产生的价值是 5 美分，全球每年产生的图片搜索量是 1.2 万亿次。如果把同时快速增长的两个变量相乘，得到的结论大概就是以图搜图这件事能够产生的商业价值，你可以期望它能获得千亿级别的空间。」

当然，这只是黄鼎隆目前的构想和预设。当市场空间足够庞大和这家公司的技术足够领先时，商业上的想象力能否落地，对这家初创公司的考验依然不小。根据艾媒咨询发布的一份关于《2016 年上半年移动搜索市场研究报告》调查显示，至少在移动端，目前在国内搜索市场，89.7% 的用户偏好使用文字进行搜索，排名第二的搜索偏好则是语音搜索，以图搜图的使用偏好仅有 25.3%。同时，包括百度、阿里巴巴以及搜狗等巨头也开始在图片搜索方面发力。

不过最起码，他们已经初步在回答「人工智能+？」问题中的空格该怎么填充，

然而黄鼎隆和码隆科技依然可以看做是一个样本。现在人们已经不可否认的是，未来在人工智能领域将会产生千亿级别的大公司和生意，它有潜力做到任何人类可以做的事情，并且做的更好更快，根本意义在于促成社会生产效率的提升。不过无论是硅谷还是中国，人们暂时都无法预测这个「巨大的机会」到底什么时候到来，所以在此之前，作为一家创业公司，也许现阶段尽快筑建起自身技术壁垒，并且生存下去才是更关键的命题。（编辑：王伟）

人工智能的商业化落地：2C 还是 2B，是个问题

1.2 万亿次图片搜索背后的千亿级机会

最新文章