关于智能眼镜的一些冷知识,你弄清楚了么?

关于智能眼镜的一些冷知识,你弄清楚了么?

编者注:本文为易瞳科技 CTO 艾韬投稿,艾韬毕业于多伦多大学计算机工程专业。多年跟随「世界穿戴电脑之父」Steve Mann 教授,专注于智能眼镜的基础研究。在读期间获全额奖学金,其研究领域涉及半制定芯片和计算摄影学,研究成果多次发表在 IEEE 和 ACM 的国际知名研讨会上,并通过实验室对相关行业多个公司提供技术支持。作为推动智能眼镜行业的核心研究员,曾为加拿大国防研究部(DRDC)部长 Dr. Guy Vezina 做军用智能眼镜的学术研究报告。其归国创业获得导师 Steve Mann 和其实验室全力支持。

如果你也对 VR/AR 感兴趣,欢迎投稿(wanghonglei@geekpark.net)。


智能眼镜的崛起是必然的趋势。大约在四年前,我认识 Steve Mann 教授时,就毅然决然地去研究智能眼镜了。Steve Mann,世界穿戴电脑之父,是一个疯狂的全才,号称「当代达芬奇」。没事作个小曲,有空印个电路,搞搞服装设计,解个微分方程,闲时写个剧本,熬夜撸个代码在他那儿完全不是事儿。

图片 1.png

穿戴电脑是个大交叉学科。在他的实验室里忙碌的这三年,不但学到了各种奇葩技能,更重要的,是让我系统地了解到一个从事穿戴电脑研究长达四十年之久的教授的思想体系,让我了解到智能眼镜的方方面面。从今年年初毕业回国到现在也快一年了,在国内看到了智能眼镜越来越旺的发展势头,内心非常激动。在这里,我想把自己所学到的关于智能眼镜的浅薄知识分享给大家。同时也欢迎大家抱着纯洁的心态与我讨论接下来会提到的一些观点。有不当之处,请读者谅解指正。

认识复杂事物,先从概念开始。

首先,虚拟现实(Virtual Reality, 或 VR),增强现实(Augmented Reality, 或 AR)和介导现实(Mediated Reality, 或 MR)不是技术而是概念。在智能眼镜硬件上实现这些概念的方法才是技术。抛开各个公司各种越来越多的营销名词,我们需要来系统地理解一些基础知识。智能眼镜的这些核心概念是一个连续体,像爱因斯坦提出的由时间和空间共同组成的时空连续体(Space-Time Continuum)一样, 真实的物理世界和虚拟的数字世界也共同组成了一个叫介导现实连续体(Mediated-Reality Continuum)的东西。在这个连续体中,我们可以清楚地理解虚拟现实,增强现实和介导现实的区别和联系。

需要指出的是,在论文中的这个连续体是一个庞大的体系。为了增加阅读性,从而让大家简单地了解最近听到的这些名词,我会用自己的理解把它暴力地做一个非学术性的简化。

VR/AR—虚拟现实和增强现实的关系

  让我们先从一个点 R0 开始聊,这个点叫做原生感知现实。这是正常人类的视觉系统能看到并理解的世界。简单点来说,这就是一对叫「人眼」的相机拍到的一组照片,就是裸眼画面。

图片 2.png

  以此为原点,向右延伸,我们就有了一根数轴。数轴上的标度代表了我们往裸眼画面上投放数字信息的多少(Amount of Augmentation)。投放后呈现在我们眼中的画面就是增强现实。

图片 3.png

  当数轴上的标度不断增加,我们会离 R0 越来越远。最终,我们会得到一个极端情形,即虚拟现实。在这个离 R0 无穷远的点上,我们的裸眼画面完全被数字内容覆盖。现实中的事物,也和我们的双眼毫不相关。因此,VR 是 AR 轴上的一个点,是 AR 的一个极端情形。我们说 VR 是 AR 的一个真子集。如下图。

图片 4.png

  根据增强现实量的多少,我们可以标出各个主流智能眼镜在数轴上的位置。接下来,我们来看几个眼镜形态例子,并对它们进行标注:

1. 轻量级 AR—类似 Google Glass 的智能眼镜

  轻量级 AR 只可以小范围的显示数字信息。由于不需要生成电脑图像,通常是单眼棱镜光学透视的设计方案。我们把这类眼镜称为 Notification System(提示型系统)。这类眼镜的市场是在于拍照,里面有个指导思想叫做 Equivalence,大概讲的是如何通过分布在每个人身上的相机来构建和谐社会。这个有机会我以后再跟大家分享。

图片 5png.png

2. 中量级 AR—类似 Microsoft Hololens 的智能眼镜

  这类眼镜视角最大达到 50 度,是中量级 AR,可以在视野里叠加 3D 数字模型。为了立体效果,通常是双目棱镜光学透视。微软也把这类眼镜叫 Mixed Reality(混合现实)。但这是他们做 AR 眼镜的商用名称,有别于学术上的概念。为了防止大家混淆,真正的混合现实涉及的范围在我们的文中没有提及,以后有机会再聊。在国内,有一家做中度 AR 的公司叫亮风台,创始人和我一样都是云南人,也是巧得一逼。

图片 6.png

3. 重量级 AR—类似 HTC 和 The Void 的所谓动态 VR 眼镜

  戴上 VR 头显,背上电脑,在一个布满标记和外置相机的体验馆里进行游戏。大家把这种体验叫做动态 VR(真实环境会被渲染成游戏场景)。在我们的图上,大家可以看到它离 VR 很近,但已经不属于纯 VR 了。理论上来讲,它实际上是重量级 AR 体验。虽然用的是 VR 头显,但形态不能决定本质,所以大家要认识清楚。我相信动态 VR 是虚拟现实行业下一步的发展方向,也可以看出 VR 在从一个点慢慢往左延伸。

图片 7.png

4. 纯 VR 眼镜

  纯 VR 头显大家就见得比较多了。今年在国内涌现出了大批的 VR 头显设备。个人觉得头显硬件做的不错的公司是乐相科技。纯 VR 体验设备一般是固定式的,打个游戏、坐个过山车啊什么的,这种体验做得好的公司很多,大家碰到的时候可以花个几十块钱去体验一下。

图片 8.png

  从以上例子不难看出 VR 和 AR 的融合趋势,一方面轻量级 AR 开始在视角扩大的进程中向着中量级 AR 靠拢;另一方面,像 The Void 一样的体验馆,将现实环境的几何结构融入 VR 体验中,使得 VR 向重量级 AR 转变。那 AR 之后的 MR 如何实现呢?要实现 MR,只需要在头戴显示器中加入一对特殊的相机。刚才理清楚了 VR 和 AR 的关系,我们就开始聊聊 MR 了。

MR—数字化的视觉感知

让我们再回到 R0,并开始另一个维度的延伸。之前说 R0 是裸眼画面,不同的人甚至是不同的物种,各自的裸眼画面是不一样的。有的人高,有的人矮,老鹰看得远,驯鹿看得暗。因此,在对现实本身的感知能力上我们还有另一条线。这条数轴从 R0 往竖直方向延伸,标度代表视觉感知能力的大小。这条线和原先的 AR 轴相交构成一个平面,这个平面就是之前提到的叫 MR Continuum 的东西。

图片 9png.png

在我看来,智能眼镜终极理想不是变成游戏机,而是革新人类视觉感知。智能眼镜不但要让人们看到比裸眼更多或更少的现实画面,还要在这画面上任意叠加数字内容。因此,可以修改的眼前画面就包括了现实画面和要叠加的数字画面。在下图中,裸眼无法直视的烧焊场景在 MR 眼镜中变得清晰柔和,眼镜使得佩戴者在看清场景的同时通过数字内容的指导去完成正在进行的工作。

图片 10.png

我还在实验室时,曾经帮助一家美国的医疗成像公司做肤下血管成像的相关算法。这也是 MR 的一种应用。眼镜佩戴者就像有了 X 射线般的超级视力,即使是在具有挑战性的临床环境,也能快速容易地确定血管位置。

图片 11.png

脑洞如果开大点,基于可以被数字化的现实,我们可以试着去做一些很神奇的事情。像下图这种立体街头艺术可以做到眼镜中来。

图片 12.png

甚至,我们可以通过各种滤镜把双眼看到的景物以某种画风重新渲染。让你身处在一片花园中看到梵高或达利眼中的世界。

图片 13.png

实现了 MR 概念的智能眼镜,就是给你一双神奇的眼睛,然后根据你的需要再让你看增强现实。因此,AR 比 MR 少了一个维度,是 MR 的一个真子集。这样我们在 MR 连续体中就衍生出下图关系。

图片 14.png

看到这里,有心人可能已经发现易瞳科技设计师的匠心了。除了像大眼套小眼外,它表示的就是 MR 连续体。实际上 Logo 有四个圈,那少了的一个圈(虚线部分)包含的部分是什么呢,今后会继续提到。

15.png

较之 VR 和 AR,MR 的概念范围更大,不仅要身兼 AR 和 VR,还需要在协调的基础上,开创新的技术,钻研新的算法。以这些概念为核心的智能眼镜的出现将使人们对计算机的认识产生观念上的变化。这是一个哲理,也是人类史上计算机发展的一个潮流。接下来,我会陆续发文,讲一些关于智能眼镜其他方面的知识。有兴趣聊天的人,发邮件给我(info@visionertech.com)。如果文中有误,欢迎指正。

栏目二维码
科普ARVR
关注极客公园公众号
反馈