关于计算机视觉创业,这家传统公司会给你不少启示

关于计算机视觉创业,这家传统公司会给你不少启示

2015 年 3 月,斯坦福大学人工智能实验室和视觉实验室主任李飞飞登上 TED 舞台,讲述自己的项目 ImageNet,以及她是如何教会计算机理解图片的。

自 2007 年起,李飞飞同普林斯顿大学的李凯通过互联网上近十亿张图片数据训练卷积神经网络,已经能让计算机用简单的自然语言描述图片「一架大型飞机停在机场跑道上」。

Snip20150626_9.png李飞飞 TED 演讲页面

「我们已经有了自动驾驶汽车原型,但如果没有智能视觉,它就无法区分路上是一个可以被碾过去的纸袋子,还是需要避开的石头。」科学家们希望教会计算机用人的方式看懂、而不只是看到这个世界,从而在工业、医疗、公共安全等各个领域实现「智能」,解放重复劳动人力。

半年前,极客公园曾报道过以计算机视觉技术为基础的格灵深瞳,当时作为初创公司他们选择安防作为突破口。因为目前大部分安防监控设备只能实时播图像,仍需要人甄别危险情况是否出现,通过在设备上增加对环境「深度」的感知和行为认知算法,他们能让安防摄像头对图像中的情况有所感知,从而提醒安保人员是否有危险情况出现。

8e42efb434cfd55bd7f29afd495dec0c-1.jpg当时格灵深瞳使用的设备

然而今天的主角并不是计算机视觉领域的创业公司——而是一家在安防领域耕耘了 20 年的传统公司。

他们的产品叫感知型摄像机

科达是一家成立于 1995 年、专注于视讯与安防产品及解决方案的提供商,产品以视频会议、视频监控及其他视频应用为主。就在去年,他们推出了一款应用了计算机视觉技术、名为感知型摄像机(Intelligent IPC)的安防监控设备。

「感知型摄像机能够基于视频的智能分析,识别出监控画面中的内容,并对其进行语义描述和最佳图片抓拍,然后通过后端大数据平台进行分析,代替我们做出思考和判断。」科达的感知型摄像机外观与普通安防设备类似,但能够在接收到图像的同时实时提取图像中我们想要的信息(人和车的特征)。

OG7G2G9P1TH5_L.jpg感知型摄像机产品示例,图片来自网络

根据不同的应用场景,他们将感知型摄像头分为三类:特征分析摄像机、车辆卡口摄像机、人员卡口摄像机。

在视野广阔的场景,特征分析摄像机能够找到画面中的人、车、物等目标,将这些元素全部提取出来。不仅能对运动目标进行轨迹跟踪,还能持续对目标进行特征分析。同时针对不同应用环境,「特征分析摄像机有枪机、红外枪机、高速球、红外高速球、枪球联动、红外枪球联动等多种产品形态」,即便是远处较小的目标,枪球联动的方式也能以满足监控场的需求:枪机负责全景拍摄和目标检测,球机负责特写跟踪和特征识别,拍摄更清晰的细节图片。

车辆卡口摄像机专门针对车进行特征识别,不仅能够抓拍识别车牌,车标、车型、车身颜色等特征同样能准确识别,同时车辆中的人像同样能够被记录。无论是夜间还是白天逆光环境,车辆卡口摄像机都能看清车内细节,抓拍车内司乘人脸照片。

人员卡口摄像机能抓拍人脸并识别人员的特征,包括人的行进方向、速度都能被记录。通过自有研发的专利技术的应用,人员卡口摄像机还能抓拍人的整个轮廓,即使背对镜头,头部的轮廓和全身也能被抓拍。

前端智能的真实应用

目前主流能够对画面进行智能分析的安防设备,采用的方案往往是「后端智能」:由普通摄像机采集图像、后台进行存储,再通过后端智能服务器进行分析后将结果返回到存储设备中。

感知型摄像机则通过在高清摄像头中添加芯片,对图像内的要素特征进行实时分析,人的行进方向和衣着色彩、车辆的颜色和速度等信息不需要经过后端服务器,这些已经被分析好的要素结果就可以实时输出上传云端存储。不仅节省了计算资源,也减轻了后台服务器所要存储的数据量,更重要的是为实际的应用提供了帮助。

Snip20150626_11.png感知型摄像头的监控界面,能够实时提取画面中元素的特征

安防设备中存储视频内容用来回溯,大多是通过图像寻找曾经出现在附近已经被锁定的嫌疑人。往往为了寻找嫌犯的蛛丝马迹,警务人员花费大量人力观看安防监控录像寻找其中的关联信息。感知型摄像机通过记录画面中的人、车特征,并将这些特征以结构化的文本信息保存,警务人员需要寻找相关信息时,只需使用系统进行自动搜索,这就变得十分简单。

举个例子,如果需要寻找 6 月 10 日出现在关键地点摄像头视野中的「黑色奥迪车」,只需要在后台搜索引擎中输入「黑色」、「奥迪」关键词即可得到相关图片信息,点击即可找到视频记录判断是否是嫌疑车辆。

对于特征的提取也能定制,如果该路段属于敏感路段,可以让感知型摄像机提取更多信息,车牌、车中人像、人行走的方向等等细节特征都可以添加其中。

由于感知型摄像机识别的是目标的内容和特征,而不是简单的报警信息,因此在办案等场景中能为公安机构提供更多帮助。同时海量的特征信息上传云端,在大数据平台下可以开展一系列实战化的应用。比如想要寻找曾出现在某市的嫌疑人「黑色衣着男子」,只搜索寻找「黑色」、「男」特征人像照片,再通过计算机与嫌疑人照片进行比对,就能找到所有与该嫌疑人相关的信息,从而推导出此人何时出现在何处。

目前该系统已经协助警方侦破了多起案件,解放人力的同时加快了办案速度。同时由于文字信息占用的存储空间非常小,图片占用的空间也远远小于视频。即便是一个月后原有视频信息已经被覆盖(大部分安防设备存储视频信息的周期都是一个月),文字描述和关键图片信息依然可以长时间的保存在系统中,一年、两年甚至十年,为长案侦破同样能提供帮助。

技术的对立面不是现实,而是如何更好的和现实相处

除了以公共安全管理为主的平安城市,感知型摄像头在商业上也已经有了应用。通过对店内消费者流动的方向、停留时间进行分析,后台能够为门店中商品的摆放提供更多建议,目前多家知名服装零售品牌的连锁门店已经部署了该系统。

和大部分初创企业相比,科达感知型摄像头的应用步伐似乎要快得多。出于多年合作的信任并不是最重要的因素,对关键领域的长期积累和分析,如对办案流程、警方需要的信息类型的了解,使得感知型摄像头能够抓住「痛点」,并在实际应用中提供真实帮助,才是关键所在。

如果「传统企业」一定等于「守旧」,那就是热爱「年轻」的科技世界戴在我们每个人眼上的有色眼镜。扎实的研究和背后的技术能力同样功不可没——在科达成立于 2001 年的上海研发中心,一千多名技术人员正在研究与视频相关的各类技术。遍布全国的经销网络和积累下的合作伙伴就像血管,将研发成果快速推广——如果没有血液,血管就没有用处。

Snip20150626_12.png即便没有正面图像,行人的背部图像也会被记录,为科达专利

在与科达的工作人员交流中,他告诉我「老板」非常喜欢新鲜事物,苹果的新产品一出便会立刻买来试用(包括苹果表),对新鲜事物一直褒有好奇心。

手握技术的确是自信的成本,如何与现实更好相处(让技术更好的在现实中发挥作用)同样是「年轻人」都该学习的课程。

因为现实中多的是你想不到的事。

一次在和同样以安防为主要业务之一的 CV 创业者聊天时,她给我讲了这么一个故事:

某市想要部署平安城市,自信的表示关键路口的摄像头几年前就已经布好,他们要做的只是提供算法和平台。然而这些「几年前」的摄像头启动时大家都傻了眼,屏幕上满满的都是绿——正在实行「绿色城市」计划的某市种了太多树——伸出的树枝和茂密的叶子把摄像头盖得严严实实。

改变摄像头位置就要重新订制支架调整角度成本太高,作为公职部门又不能光天化日去砍树。他们只好等到半夜夜深人静,架上两人多高的梯子去剪掉那些遮挡摄像头的枝枝桠桠。

世事维艰,创业不易,且行且珍重。

安防计算机视觉
下载极客公园客户端
iOS下载
反馈