2.2 深度线索

形成视觉空间知觉(视空间知觉)需要获取立体感和远近感,即深度知觉。深度知觉是对同一物体的凹凸或对不同物体的远近的反映。不同的深度提取原理形成不同的深度线索,包括心理深度线索、运动深度线索、立体深度线索、生理深度线索等。

2.2.1 心理深度线索

视空间知觉的获得是双眼协调并用的结果,但在很多时候使用单眼仍然可以获得准确的空间知觉,因为通过人的心理作用可以在平面图像上形成深度线索,提取3D信息。绝大部分心理深度线索的提取,需要事先对所观察物体有一定的了解。心理深度线索又叫单像深度线索或单眼深度线索。

1.基于光觉的心理深度线索

基于光觉的心理深度线索包括遮挡、阴影与高光、影子等。

遮挡是指两个或多个物体在同一平面上,其中一个物体的一部分被另一个物体所遮盖,形成的重叠现象。由遮挡或重叠所构成的画面就可以使人产生深度知觉。被遮盖的地方看起来距离较远,全部显露出来的地方看起来距离较近。

投射阴影与反射高光是指人眼的光觉功能通过分析物体表面的光强程度,感知物体的体积、质感和形状。如图2-13(a)所示,通过阴影与高光的明暗对比,可以感知物体的凹凸感(立体感)。如图2-13(b)所示,物体投射阴影一面离光源较远,相对较暗,从阴影的后退程度可以提取深度线索。物体反射高光一面离光源较近,相对较亮,从高光,特别是光泽物体的高光突出程度可以提取深度线索。

图2-13 阴影与高光

影子的深度线索与阴影几乎一样。通过辨认被光照物体生成的影子,能感受到那个物体的空间位置。如图2-14所示,由于影子的存在,右图的花瓶位置比左图的花瓶感觉更靠近观看者。

图2-14 影子

2.基于色觉的心理深度线索

人眼的色觉功能使同样大小、同样形状的物体在不同颜色的渲染下会给人以不同距离的感觉:亮度较高的物体给人的感觉要比亮度较低的物体近;亮度相同的颜色,波长较长的光线给人近的感觉;暖色调的物体给人的感觉要比冷色调的物体近。

空气透视是典型的基于色觉的心理深度线索。空气透视是指空气中的微粒对光的散射与吸收使景物的对比度随着距离的增大而下降,导致远处物体在细节、形状和色彩上发生衰变,使人有一种强烈的深度感。由于空气的介质作用,使远处的物体不如近处的物体清晰,所以空气透视也叫空气模糊。如果是水汽扩散形成的空气透视,因为短波长的蓝色光更容易穿透空气抵达视网膜,所以远处的物体颜色一般偏蓝色。如果是灰尘、硫酸、硝酸等污染物形成的空气透视,由于这些污染物在削弱能见度的同时更容易散射波长较长的光,所以远处的物体颜色一般偏灰色或棕色。如图2-15所示,通过远景偏灰色、偏蓝色,从而可以判断物体的远近距离。

图2-15 空气透视

3.基于形觉的心理深度线索

基于形觉的心理深度线索包括相对大小、纹理梯度、视界高度、线性透视等。

被观察对象的相对大小也叫视网膜像大小,是在确知对象物体大小的前提下,因为物体在视网膜上的成像与距离、几何尺寸等有直接关系,所以距离越近的物体在视网膜上成的像越大,距离越远的物体在视网膜上成的像越小。例如,看到图片上大象和人一样大时,就会认为大象距离观察者更远,因为大象要比人大很多。这种小的物体距离远,大的物体距离近的视觉现象,称为透视现象。

纹理梯度又称质地梯度或结构梯度,指在某个维度上某种物体的递增或递减,相应地表现为物体在视网膜上的投影大小及投影密度上的递增和递减。如图2-16所示,站在一条砖块铺的路上观察远处,随着距离的增加产生近处稀疏和远处密集的纹理梯度,由于在视网膜上的远处部分每一单位面积上的砖块影像的数量较多,所以越远的砖块显得越小,于是产生了向远方伸延的距离知觉。

图2-16 纹理梯度

视界高度指受地球重力支配,在视界上方看到的是远景,在视界下方看到的是近景。如图2-17所示,根据这个经验,可以判断视界内物体的远近距离。

图2-17 视界高度

线性透视指平面上刺激物本身在面积的大小、线条的长短及线条之间距离远近等特征上,所显示出的能引起深度知觉的线索。同样大小的物体,近大远小。观察景物时,景物的轮廓线条或许多物体纵向排列形成的线条,越远越集中,甚至会聚。这样一组线称为消失线,消失线的会聚点称为消失点(或灭点)。现实环境中的典型消失线为地平线,离地平线越近,物体越远。同样,图像中的物体离消失点越近,感知深度越大,反之越小。如图2-18所示,根据消失点数目的不同,线性透视分为一点透视、两点透视和三点透视三种。一点透视看到物体的正面,两点透视看到物体两个以上的面并且面的两侧垂直,三点透视看到物体两个以上的面并且面的两侧不垂直。

图2-18 线性透视

在欧几里得(或称笛卡儿)空间永远都不会相交的两条平行线,在投影空间会相交于无限远处,如两条铁轨在地平线处看起来相交于一点。在计算机图形学中,将3D场景投影到2D平面需要采用齐次坐标。如式(2-3)所示,2D齐次坐标(xyw)中的新分量w=0时,对应笛卡儿坐标点(XY)移到无限远处。

2.2.2 运动深度线索

运动的物体同时揭示了物体的速度、方向、空间位置。通过运动可以创建影像物体或影像场景的三维模型。因为运动是相对的,根据观察者与物体之间的关系,运动深度线索分为人动而物体不动的视点运动视差、物体动而人不动的物体运动视差及物体相对运动速度。运动视差提取的深度线索比心理深度线索更可靠,因为伪造运动视差的难度很大。

1.视点运动视差

在无法清晰判断前方多个物体之间的具体深度关系时,人会习惯性地左右移动头部来确定这些物体在场景中的具体位置关系。头部移动引起眼睛移动的视点运动,使头部移动前后在视网膜上接收到的图像存在差异,形成视点运动视差。从行驶的车窗向外看到远近物体的运动,就属于视点运动视差。

头部移动前后获得的两幅图中,同一对象的两个位置的间距就是视差。视差可以用运动矢量表示,矢量的大小与方向通常用于描述所观察物体离开观察者的深度距离。近处的物体视角大,在视网膜上运动的范围大。远处的物体视角小,在视网膜上运动的范围小。

如图2-19所示,观看单个静止对象A时,设定头部移动距离为M,观察对象A的运动视差就是头部位置H1H2在水平方向上的距离。因为观看距离D远大于头部移动距离M,所以角度θA(绝对运动视差)可以表示为

图2-19 观看单个物体的视点运动视差

根据式(2-4),如果M已知,则视觉系统利用绝对运动视差θA,可以估算出距离D

如图2-20所示,当被观察对象A后面还有一个对象B,到观察者之间的距离为D+d时,根据式(2-4)可以求得对象B的绝对运动视差θB。对象A和B的相对运动视差

图2-20 观看多个物体的视点运动视差

根据式(2-5),有

根据式(2-6),已知相对运动视差、头部移动距离M、对象距离D,可以计算出两个被观察对象的进深d。如果头部移动距离和运动视差的比值一定,则进深d与绝对距离D的平方成正比。

2.物体运动视差

运动物体在不同的时间点上,离观察者的距离不同,呈现的图像信息不同,从而形成不同的视差信息,可以形成立体视觉。物体运动视差提供连续知觉,形成立体视觉所需的信息,所以称为时间轴上的立体视,即时间积分立体视。

通过观察运动物体的运动速度,可以大致判断运动物体的距离。从跑道中央观察飞机的起飞过程,可以看到飞机不断地加速,过了观察点上方速度就降了下来,之后离观察点越远,速度越慢,直到有停止的感觉。在高空飞翔的飞机,如果没有云层的参照,好像停在天空中。所以,运动物体离观察者越远,看起来运动速度越慢。

如图2-21所示,设定对象A到观察者之间的距离为D,对象A仅移动距离m,运动的结果是对象A在运动方向上变化角度θA。这个绝对的物体运动视差θA可以表示为

图2-21 物体运动视差

式(2-7)和式(2-4)在计算深度距离D的原理是一样的。

3.物体相对运动速度

远近不同的物体产生在不同速度下的像,在人脑意识中表现为:近处物体移动得快,远处物体移动得慢。所以,当不同的物体同时运动时,可以从远近物体的运动矢量中提取对应的深度线索。

如图2-22所示,两个被观察物体A和B,B在A后面,与观察者之间的距离为D+d,A和B之间的相对运动视差ω

图2-22 两个物体等速运动视差

整理式(2-8),可得

根据式(2-9),已知运动视差ω、对象运动距离m、对象距离D,可以求出对象进深d。如果对象运动距离m和运动视差ω的比值一定,对象进深d与距离D的平方成正比。此外,如式(2-10)所示,对象进深d也可以用对象A和B的绝对运动视差θAθB表示。

如果被观察的多个物体运动速度不同,当参照物体的运动速度知道后,另一个物体的相对运动速度就是一个单像深度线索。影视拍摄也常模拟这种运动视差来营造一种纵深效果。在图2-23中,如果知道飞机A的速度,通过测量飞机B、C与飞机A之间的相对速度,就可以大致判断飞机B、C与飞机A的距离。

图2-23 物体相对运动速度

坐火车时,以火车为参照物,无论是近处的还是远处的景物相对于火车来说都是向后运动的。但移动相同的距离,近处的景物对人的眼睛造成的视角大些,所以看起来移动的速度快些。所以在火车上的人看来,近处的景物向后运动得快,而远处的景物向后运动得慢。当人同时看近处和远处的景物时,人会不自觉地以近处的景物为参照物,这样看起来远处的景物就在向前运动了。实际上,过一会儿再看,远处的景物也落到火车后面去了。

2.2.3 立体深度线索

立体深度线索基于双眼视觉功能,利用左右双眼视网膜图像的细微差异创造出深度感。所以,立体深度线索又称为双眼深度线索。其中,左右双眼分别代表一个视点,说明立体深度线索是一种特殊的视点运动视差深度线索。但是,左右双眼属于同时视觉,所以立体深度线索可以获得比运动视差更多、更准确的深度线索。立体深度线索主要包括双目视差、遮挡提示、形变等。

1.双目视差

双目视差是一个完整的立体视觉生理功能,是人眼最强烈的深度线索与生理立体视觉因素。在排除了其他所有深度线索的条件下,一组完全无意义的视觉刺激,只要具备视差条件,即能产生深度知觉。

在空间场景中,同一物点投影到左右双眼的视差图像所成的像点称为同源像点,而同源像点的位置差异定义为视差。分别向左右双眼投射具有视差的图像对,为双眼提供视差信息,可以在人脑中形成立体视觉。

双目视差产生的前提是双眼存在6.5cm左右的瞳距,并且双眼视野存在重叠。这样,左眼看到物体的左边多一些,右眼看到物体的右边多一些,两个视网膜像不完全重合,它们都偏向鼻侧,如图2-24所示。观察物体时,左右双眼视网膜上的物像差异就是双目视差。基于双目视差原理的立体显示为观看者的左右双眼提供同一场景的立体图形对,采用光学等手段让观看者的左右双眼分别只能看到对应的左眼视差图像和右眼视差图像,从而使观看者感知到立体图像。

图2-24 双目视差

2.遮挡提示

遮挡是前后物体相互重叠,是最简单也是明显的深度线索。作为单像深度线索,遮挡就是前像挡住后像,把部分背景物体隐藏起来。

作为立体深度线索,如果背景物体还有一小部分能够被一只眼睛看到,则这一小部分就成为大脑重建场景的主要深度线索。如图2-25所示,在右眼视网膜的图像中,房子挡住了树,可以获得简单的房子在前树在后的深度线索。在左眼视网膜的图像中,房子与树完全分离,补充提示了右眼不能获得的树的更多、更准确的信息。

图2-25 遮挡提示

3.形变

凭借看到物体的多少,或者与一个参考形状相比较,就可以获得足够的信息来推断缺少的信息,如判断物体的距离和形状。如图2-26所示的骰子,左侧的左眼图看不到5点,右侧的右眼图看不到3点。骰子形状没变,但每只眼睛看到的是不同的面,大脑将两幅图片组合成一个立体的物体。因为左右双眼的距离为6.5cm左右,使得每只眼睛看到的物体侧面信息与物体的大小、距离形成关联。拿在手上的骰子看到的侧面要比放在桌上另一端的骰子所看到的侧面多一些。

图2-26 骰子的形状变化

在双目立体显示中,戴上3D眼镜后,观察者从屏幕正前方慢慢移动到屏幕斜方向,3D场景跟着倾斜。这就是立体深度线索中的形变效应。观察者从屏幕正前方移动到屏幕斜方向,大脑本能地希望能够看到与正前方不同的斜方向3D场景。但是,原本静止的正前方3D场景并没有发生变化。为了在屏幕斜方向满足大脑的期望,大脑本能地认为3D场景跟着双眼移动并发生形变。作为立体深度线索的形变效应,必须双眼协调才能感受到。如果闭上一只眼睛就不能感受到3D场景跟着倾斜的现象。

2.2.4 生理深度线索

肌肉、肌腱和关节囊中分布有肌梭与腱梭等本体感受器,能够分别感受肌肉被牵拉的程度及肌肉收缩和关节伸展的程度。这种本体感受器受到刺激所产生的躯体运动觉称为本体感觉。与深度线索有关的本体感觉都要通过眼睛的内部生理结构获得。所以,本体感觉获得的深度线索又称为生理深度线索,包括单眼立体视觉的焦点调节和双眼立体视觉的辐辏。支撑生理深度线索的眼球运动,由六条眼外肌协同完成。所以,同样受到眼外肌控制的单眼焦点调节和双眼辐辏运动具有联动效应。具体地,辐辏角增大的斗鸡眼状态与观看近处物体的晶状体增厚联动发生,辐辏角变小与观看远处物体的晶状体变薄联动发生。

1.焦点调节

人眼的适应性焦点调节指眼睛的睫状肌调节晶状体的屈度使图像落在视网膜的中央凹上,以保证网膜图像的清晰。焦点调节可以提供单像深度线索。如图2-27所示,看远处物体时晶状体较扁平,而看近处物体时晶状体较凸起。通过焦距的变化,可以看清楚远近不同的景物和同一景物的不同部位。

图2-27 人眼的适应性焦点调节

晶状体的调节是通过其附属肌肉的收缩和舒张来实现的。肌肉的运动信息反馈给大脑,给大脑提供了物体远近的信息,有助于立体感的建立。人眼的最小焦距为1.7cm,没有上限。一般这种线索所提供的信息只限于距眼睛10m以内才有效,并且分辨力较差。设定能够清晰聚焦的最远点为Pf,最近点为PnPfPn就是焦点调节的检出深度。调节固定时的聚焦深度T

式中,nf分别表示位置PnPf上的物体能被清晰分辨出来的距离,单位为m。

2.辐辏

双眼注视远处物体时,双眼的视轴是平行的,调节是放松的。看近物时,双眼不但产生调节,而且双眼的视轴也要向鼻侧转。这种使两只眼睛的视轴在被观察物体的某一点上相交,该点视像落在两只眼睛中央凹的作用称为辐辏,又称双眼集合。

观看客观景物时,辐辏的同时,晶状体的聚焦点会调节到最适当的位置(注视点)以减轻模糊,即辐辏距离与焦点调节距离是一致的。由于双眼辐辏的会聚程度受到眼外肌的控制,所以在观察近处物体和远处物体时,肌肉紧张程度的差异所产生的本体感觉会给大脑提供物体远近的深度或距离线索。

如图2-28所示,辐辏存在一个眼睛休息时的舒适辐辏距离,称为调节休息点(Resting Point of Accommodation,RPA)。当注视物体持续靠近鼻子到达辐辏近点时,辐辏角达到最大值,会聚程度最高,注视物体继续靠近鼻子时两眼放弃会聚而突然转向外侧,形成复视。出现复视前的临界点称为调节近点(Near Point of Accommodation,NPA)。最近点的距离zn一般为250mm左右。当注视物体远离鼻子达到一定程度时,双眼辐辏接近平行,辐辏角接近0°,已不能提供有效的辐辏信息。

图2-28 辐辏提供深度线索的原理

双眼图像的融合过程需要双眼的着眼点在同一固定点上,左右眼分别到着眼点的光轴与双眼瞳距线段构成的夹角是确定的,在几何上构成了一个确定的三角形。通过这个三角形可以判断出被观察景物与人眼的距离。根据图2-29所示的辐辏立体深度的三角形关系,利用dθ/dz的辐辏角θ定义,可以推导出景物距离Δz

图2-29 辐辏立体深度

式中,b为两眼瞳距,z为平均对象距离。一般,4z2b2,式(2-12)可以简化为

如图2-30所示,当双眼观看物体P和M时,辐辏使物体图像落在视网膜相对应的位置(p1/m1p2/m2),角α为辐辏角。当观看更远的Q点物体时,辐辏角减小为β,称为“开散”。这种改变由眼部肌肉完成,这种改变的信号传到大脑,便构成一种对深度信息的感知。

图2-30 辐辏

2.2.5 深度感知范围

深度知觉的准确性是对深度线索敏感程度的综合测定。观察距离较近的物体,生理方面的深度线索,特别是双眼深度线索起着决定性的作用。观察距离较远的物体,心理方面的深度线索起着决定性的作用。随着被观察对象的距离越远,深度知觉的准确性越低。

1.深度线索的距离感知范围

人眼视觉是以双眼单视为基础发展起来的立体视觉,该视觉系统需要同时拥有单眼深度线索与双眼深度线索来感知三维信息。

单眼深度线索强调视觉刺激本身的特点,深度知觉的准确性不存在距离上的显著差异。单眼立体视可以根据平面视觉信息判断出立体视,只需单只眼睛就能感知立体信息。单眼深度线索包括运动视差、焦点调节、视界高度、空气透视、遮挡、相对大小、纹理梯度、阴影、影子。

双眼深度线索强调双眼协调活动所产生的反馈信息的作用,深度知觉的准确性随着距离的增加而降低。双眼立体视就是同时使用左右眼获取立体感,立体视一般指双眼立体视。双眼视觉可以实现单眼无法感知的空间知觉,使人能够更准确地获得外界物体形状、方位、距离等概念,从而适应自身在客观环境中的位置。双眼深度线索包括双目视差和辐辏。

单眼立体视与双眼立体视的有效范围关系如图2-31所示。图中曲线采用对数刻度,原点相当于观察者站立的位置,横轴表示远处物体距离D1与近处物体距离D2的平均距离,纵轴表示远近物体之间的距离(D1D2)与远近物体平均距离(D1+D2)/2之比。图中坐标(2m,0.01)的一种可能是:近处物体距离D2=1.99m,远处物体距离D1=2.01m,D1D2的平均值为2m。判别两个被观察物体的前后关系,仅仅相差2cm(201cm−199cm),对应的立体视感度用比值0.01(2cm÷200cm)表示。如果两个被观察物体的平均距离为200cm,而两者间距缩小为1cm时能判断前后关系,对应0.005(1cm÷200cm)处理论上可以制图,事实上没有,说明没有对应的深度线索。

图2-31 单眼立体视与双眼立体视的有效范围关系

图2-31说明,观察一定距离的物体,纵轴数值越小的深度线索越能用于分辨微小的前后关系。在横轴上,综合空间距离相关的各种深度线索,观察不同距离时的贡献程度如下。

(1)近距离(1m以内):绝大部分深度线索同时启动,协同作用,相互平衡,起关键作用的深度线索为双目视差、辐辏、焦点调节和运动视差。

(2)中距离(1~3m):双眼深度线索和单眼深度线索所起的作用此消彼长,起关键作用的深度线索为双目视差、辐辏、焦点调节、运动视差等。

(3)远距离(3m以上):以心理方面和经验方面的单眼深度线索为主,起关键作用的深度线索为线性透视、运动视差等。

2.视差立体视觉的深度感知范围

双目视差是立体视觉的主要深度线索。注视观察对象时,在左右眼视网膜上形成的两幅图像的视差大小可以用被观察对象在视网膜上的投影宽度表示,也可以用双目视差角的大小表示。

如图2-32所示,近处像点A、远处像点B、最远处像点C在左右双眼视网膜上的投影分别为(ALAR)、(BLBR)、(CLCR),左右双眼的水晶体光心分别为OLORAB像点的视差就是ALBLARBR的差值,AC像点的视差就是ALCLARCR的差值。因为AC像点的距离比AB像点的距离大,所以差值(ALCLARCR)比差值(ALBLARBR)大。

在图2-32中,可以用像点在左右双眼的两个张角之差来表示视差的大小。因为对角∠BX1OL=∠AX1OR,所以在△BX1OL和△AX1OR中,存在关系∠X1AOR−∠X1BOL=∠X1OLB−∠X1ORA。同理,在△CX2OL和△AX2OR中,存在关系∠X2AOR−∠X2COL=∠X2OLC− ∠X2ORA。实际观察像点,当张角很小时,张角的大小可以用张角所对应的弦来替代,所以,存在如下等式:

图2-32 视差大小示意图

当双眼观察不同距离的两个点时,两个点的距离差值必须超过一定的限度,才能辨别出两者的深度差异。能够区分出视野中两个空间距离非常近的物体并感知物体立体感的能力,用视差阈值表示。在图2-32中,被观察对象的距离越远,张角越小,立体感趋于模糊。当观察距离非常大时,投影到视网膜上的视差就小于视差阈值,人眼无法分辨物体的深浅程度,立体感消失。最小阈值就是这个最小距离形成的视角,阈值的倒数体现锐度。

在图2-33中,双眼瞳距用2e(一般为65mm)表示,注视点P1P2在双眼处的张角分别用θθ'表示,用η表示双目视差。根据双目视差的定义,η=θθ'。考虑到观察距离非常远时,张角很小,θ=2e/zθ'=2e/(zz)。把张角θθ'的公式代入双目视差η的公式,可得

图2-33 视差阈值示意图

存在η时的zΔz远小于z2,所以式(2-15)可以简化为

正常视力的视差阈值η=40″(弧秒),代入式(2-16),可以建立z和Δz之间的等式关系。计算不同观看场景的人眼最小分辨尺寸时,张角θ'在P1位置的宽度w,可以对应显示屏的像素节距、透镜等光栅节距、三维显示体像素节距等。求得最小可分辨尺寸w,可以评估显示屏像素最小尺寸、透镜光栅单元的最小节距。