天眼查:解一道关于隐秘商业关系的方程

摘要

通过公开信息发掘出隐秘关系,这是一道难解的数学方程。

不久前,海航集团旗下的凯撒旅游与另外两家「海航系」公司成立 12 亿基金参与乐视体育的 B 轮融资,预计获得乐视体育 5.85% 的股权。至此,乐视体育 B 轮融资规模共 70 亿元,融资完成后,乐视体育估值达 205 亿元。消息显示参与其中的投资方,还有王健林父子、华人文化基金等。

乐视股东信息图.png

乐视股东信息图

罗振宇与 2016 年第一网红「papi 酱」合影爆出,双方一起谈起了投融资。逻辑思维背后有哪些股东关系呢?

luozhenyu.png罗辑思维周边商业关系

在这两个例子的背后,都隐藏着一些微妙的商业关系。天眼查就是可以通过公开数据,捕捉到这些隐藏关系的工具,在线免费查寻企业工商信息,财务数据,股东股权,司法信息等数据,并通过可视化的形式展现出来。

柳超的「公平」梦

天眼查创始人柳超,原是搜狗科技首席科学家。

搜狗之前,柳超在美国微软研究院,曾带领 CMU 耐基梅隆大学的学生做项目。当时的论文主要聚焦:能否通过公司之间的拓扑结构和公开信息,发现哪些公司能否得到投资,能得到什么投资。

这个项目是关于美国一个网站 TechCrush 的项目。TechCrush 类似国内的 IT 桔子,里面有初创企业的信息数据,类似于工商信息,有关联的人,投资机构等。柳超当时研究的方向是能否通过公司之间人实体之间关系的投资结构,以及新闻上的信息预测哪些公司得到投资,会得到谁的投资?

这种理念的基础来源在于:我们处在一个由人组成的社会,很多决策在于人,人是决定因素。依据这样的理念做出预测模型,并发布几篇文章。

开始,这件事被作为一次常规的学术论文研究。过了大概几个月,美国的《商业周刊》转载这篇学术论文并且做了评价,认为这是一个很有趣的工作。

柳超很受触动,「原来自己的研究跟商业价值是紧密联系的,那这件事在中国有机会吗?」

柳超心中那个关于「信息」公平的想法越来越清晰:应该让每个人公平看清这个世界。

「公平」的含义是所有数据来自公开渠道,不碰触黑数据、暗数据。在每个人都有资格接触数据的前提下,让每个人都有能力看清数据背后的商业。

2012 年回国,柳超想做这件事情,但是当时国内很多数据并不公开。他索性加入了国内互联网企业,准备学习一些中国互联网的产品脉络。

2013 年,在腾讯与搜狗的战略合并之际,柳超加入搜狗科技,出任首席科学家,从零组建了搜狗数据科学研究院,负责搜狗互联网业务的数据挖掘与机器学习的前沿研究。

柳超在搜狗搭建了大规模并行深度学习平台,将搜狗搜索的线下模型训练加速 50 倍;发明「字根嵌入」技术,这是世界上第一个有关汉字的深度神经网络模型,用于揭示仓颉造字的数学原理,在世界顶级计算语言学会议 ACL2015 上发表。

解一道「公平」的方程

时机逐渐成熟。2015 去年 7 月份,柳超正式创立天眼查,天使融资 2500 万元,估值 2 亿。客户包括中国人民银行征信中心等。

和之前的那篇论文相比,虽然做的具体事情不同,但对于柳超来说,产品结构和思路是一样的——组建人、实体,形成一个关系网来看清这个世界。

天眼查为媒体、法律、金融、政府等专业机构和人员提供从大数据维度的信息分析。

针对 to C 用户,提供网页版标准版本和专业版定制版本。针对 to B,提供企业版标准版本和定制版定制版本。定制版强调更多个性化。目前 to C 方面的版本已正式对外发布。

在网页版上,不需要用户注册和登录,可以开放式查询。也就是说因为无需注册,天眼查不会收集访问者的手机号。

用户只需在天眼查专业版中输入某个人名、企业名或者品牌名称,就可看到该主体下所有关联信息直观呈现,还能发现更多隐藏在背后的商业利益关系,自动生成一张关系图。

举个例子,《太阳的后裔》火爆播出,除了中韩同步播出、题材优质外,这部电视剧背后的推手到底是谁?

《太阳的后裔》一剧背后的制作公司 Next Entertainment World,2014 年还处在 IPO 阶段,国内电视剧制作商华策影视旗下公司以 3.23 亿人民币获得 NEW 股权共计 13.03%,成为第二大股东。

2014 年 8 月爱奇艺与华策共同成立合资公司华策爱奇艺影视公司,爱奇艺在内容上占据优势。

《太阳》一剧,爱奇艺以单集 23 万美元、总计 2400 万元人民币的版权价格引进,尽管称为韩剧进中国的天价,但比本土剧的版权购买价还是要便宜的。

2015 年华策影视与 NEW 合资成立了华策合新文化传播(天津)有限公司,合资公司注册资本 4000 万元人民币,华策影视出资 2000 万元,持有其 50% 的股权,双方共同进行电影、电视剧项目的开发。

在《太阳》一剧背后,出现了一条清晰的中韩合作,电视剧投资、制作、播出关系链条。

屏幕快照 2016-04-20 下午3.12.37.png

如果关系较为负责,移动端难以显示完整,可以用 App 扫描网页版的二维码,可以立即把生成的图片传到 PC 端放大查看。

天眼查的数据同步了国内近 8000 万家企业、个体商户工商信息,以及企业商标信息库、公开的诉讼信息等海量数据库。技术抽象出的 2000 多项数据指标,10000 多个数据模型。

降低「熵」值的盈利模式

在查询关系过程中,天眼查对一些高价值的点进行了隐藏。收费标准是依照背后的复杂深度学习计算出来的,单次查询费用在各个价格区间不等。这也是天眼查的商业盈利模式。

隐藏点一般是好奇心聚焦的点。这个机制有点像打游戏,哪些东西是比较重要的,大家好奇心比较强的,选择性隐藏。

例如,如果查询出了三个关联的人和三个关联的公司,究竟用户是想看人还是想看公司?取决于哪些点是用户自己添加的,哪些点是发现出来的,基于这样一个逻辑来判定那些点是显示的,哪些是隐藏的。根本原则是最「有用」的信息价值越大。

「有用」的含义是,如果在一个系统中,信息能够最大地降低这个系统的熵(熵是对体系混乱度或无序度的量度),那这个信息是最有价值的。哪些信息能够将整个图上的熵减少最多,其价值就是最高的。

屏幕快照 2016-04-20 下午3.16.20.png

天眼查上的收费点设置

天眼查另外一个独特设置是「天眼评分」。「天眼评分」指的是每个企业在天眼查上都有自己的数据分数。这个评分显示出企业的发展态势,用户可以通过分数,对所查询到的企业作出初步判断。

评分的背后是不同维度的数据模型,例如一家公司的新闻、产品进展等,以及一些细小的判断维度如诉讼量。一个小企业有很多诉讼可能要减分,一家大企业有很多诉讼则需要加分。

天眼评分.jpg

阿里巴巴、海尔和华为的「天眼评分」

题图为乐视投资信息图

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。