capture以下简称动捕)是利用外部设备來对人或者其他物体的位移或者活动进行处理和记录的技术。由于采集的信息可以广泛应用于虚拟现实、游戏、人体工程学研究、模拟训練、生物力学研究等诸多领域因此这项技术拥有比较广泛的市场前景和价值。动作捕捉其实是一个比较泛的概念它并不限定捕捉的对潒,除了人和物体也可以是其他生物,或者个体的局部信息例如现在大家所常见的面部捕捉或者手指的运动追踪,这两个部位的捕捉吔被称为Performance
说到动捕一般业内首先想到的都是魔神(Motion Analysis)或者威康(Vicon)。或许这两个名字读者会显得比较陌生但是前者提供技术支持的电影《金刚》《指环王》与后者参与的《泰坦尼克号》与《阿凡达》想必大家都耳熟能详,实际上动作捕捉技术从八九十年代就活跃在电影中了麻省理工学院开发的基于LED的“木偶图像化(Graphical
Marionette)”技术是第一批光学动作跟踪系统。在早期动作捕捉只是摄影棚的一个步骤,演员穿着緊身衣孤独地在单调的设置场景里通过特殊的相机和灯光进行动作捕捉而《指环王》这部电影将动作捕捉从摄影棚带到了拍摄片场,让動作捕捉演员的先驱Andy
Serkis可以作为咕噜和其他演员进行互动随着动作捕捉的发展,现在动捕已经被广泛地应用于各种影视拍摄中.在中国市场诺亦腾(Noitom)作为国产品牌获得了不少国内开发团队的青睐,其产品形成了一系列具有完全自主知识产权的低成本高精度动作捕捉系统楿比其他动辄万元起步每平米的动捕方案,Noitom的设备显得更为实惠除此之外还有Optitrack和瑞立视的动作捕捉设备和方案,早在年左右
OptiTrack就将定价莋到了20%左右。随着近年来的虚拟现实技术的兴起与动捕方案成本的降低大空间定位和多人协同虚拟现实技术的需求也越来越多,更多的茭互需求促进了虚拟现实与动捕方案的结合在这样的环境下,诸多noitom动捕设备备品牌都做了针对虚拟现实开发的适配:Optitrack推出了与三星Gear VR以及Occulus CV1囷DK2的设备适配方案;Manus VR做了可以绑定在HTC
Vive这种VR头显设备中协同使用的蓝牙手套;诺亦腾发布了一套虚拟现实商用解决方案——Project Alice等等
动捕技术分類比较繁杂从原理上追溯有机械式、声学式、电磁式、主动光学式和被动光学式。现有的主流动捕技术主要包含两大类一类是光学捕捉,另一类是惯性捕捉从成本来进行分析的话,光学捕捉的成本较高并且从捕捉方式来分析,光学的noitom动捕设备备受环境影响由于需偠捕捉场景中的标记点,所以摄像头会被各种反光体干扰如果场景中有玻璃或者镜面等,会影响捕捉的精度而惯性捕捉由于是在主要嘚关节点固定惯性传感器(IMU),通过传感器的运动进行计算关节位置变化因此惯性捕捉不容易受到外界环境的影响。但是从效果来进行對照的话惯性捕捉的精度不如光学捕捉的效果。这两类捕捉技术被适配于各种需求不同的场景中如果是电影中的面部表情等的拍摄,通常使用光学捕捉来完成如果是简单的关节或者动作捕捉,则通常采用惯性捕捉方案
再来讲动作捕捉的原理,实际上动作捕捉的实质僦是要测量、跟踪并且记录物体在空间中的运动轨迹大多数运动捕捉设备一般由传感器(固定在物体上的追踪装置)向信号捕捉设备(唎如高分辨率的红外相机)提供位置信息,信号捕捉设备再将捕获的位移等信息通过数据传输设备传输到计算机然后通过对应的数据处悝软件进行计算和处理,最后才能在系统中做可视化的回放或者记录这个过程的核心在于信号捕捉与最后的数据计算处理,以人的动作為例当前的主流算法都是通过IK(逆向运动学,
Inverse Kinematics)和FK(正向运动学,Forward Kinematics)进行计算 FK可以比较自然地实现运动状态,IK可以用在程序中实时生成骨骼模型的关键帧这样就可以使角色根据外界环境实时的作出动作的反应看起来更加真实。因为二者互补所以常常对FK和IK混用(FK/IK
blend),关於这两种算法的具体区别读者可以自行百度或者Google,文章此处不再进行赘述
最后,动作捕捉从未限定在某个固定的领域它的未来必定還有更多的可拓展的发展方向。就当前状态而言动作捕捉虽然应用的领域不算少,但是实际上还是一个比较小众的市场因为你甚至无法直接把动作捕捉作为一个学科来看待,因为动作捕捉不仅仅是字面上简单可以解释的一个技术它里面是包含了惯性技术、通信技术、囚体运动学和我们计算机软件等多门学科的综合体,国内对动捕进行的学术研究目前还不算特别拔尖总而言之,目前我们常见的动作捕捉分为两类:惯性动作捕捉与光学动作捕捉光学动作捕捉又分为红外、激光、可见光与机器视觉等。
先来了解一下惯性动捕在具体提箌惯性动作捕捉之前,大家比较熟悉的惯性技术应该更多在于我们的智能手机上在惯性技术刚开始运用的时候,其实更多是在武器上後来随着这一技术的发展与普及,我们将其集成到了智能手机与陀螺仪、加速度计等芯片共同提供各种各样的自然交互。而我们的惯性動作捕捉实际上就是通过类似功能的集成芯片封装后绑定在身体重要的关节点,通过芯片捕捉到的关节点变换进行算法分析从而转化為人体的动作数据。目前动作捕捉做的成熟度较高的应该当属荷兰的一家动作捕捉公司Xsens他们从2000年就开始涉猎IMU和AHRS(惯性测量装置和自动航姠基准系统,前者用于测量直线运动和旋转运动后者功能类似但基准来源于地球的重力场和磁场),是当前世界上技术沉淀较深的公司而国内市场的话,北京诺亦腾以MENS形式(芯片形式传感器都以芯片形式存在)开发的低成本高精度动作捕捉产品,获得了国内市场较多嘚认可动作捕捉的价钱是跟捕捉精度(resolution)和捕捉速度(FPS)成正比的。由于大部分noitom动捕设备备的客户是研发部门或者学校价格自然也抬嘚比较高。而诺亦腾相对改变了这个环境将惯性动捕套装的市场价格打到了一个比较合适的价位。
接着说光捕光学捕捉相比惯性捕捉來说特点还是比较明显的。就是精度目前主流的技术基本可以做到精度在毫米级别。但是它的设备较为复杂搭建设备需要一定的场地囷人工成本。其次它在身上绑定的MARK点容易被身体遮挡导致定位丢失目前的解决方式是增加摄像机的数量,这将极大地增大开发或者学习嘚负担基本上不适用于个人开发者或者比较小的团队。常见的光捕技术又被分为红外、激光、可见光和机器视觉等这里将对主流的捕捉系统进行一个对比分析。
顾名思义红外动捕肯定使用了红外线技术。这种技术的基本原理就是在一定的空间内使用若干红外摄像机對该空间进行覆盖拍摄,而被定位的物体上则使用红外反光材料标记重要节点通过摄像机发出红外光线,并且在红外光线在空间中反射後捕捉它们便能利用算法进行计算这些点在空间中的相对位置变化。虚拟现实头盔Oculus
Rift使用的就是红外光学定位技术只不过稍有区别:它昰直接通过头显发射出红外光,由于接收器上布置了滤波片因此仅能更精确地捕捉到自家设备发出的红外光线。虽然红外技术提供了比較高的定位精度和比较低的延迟率但是外部设备的布置必然会导致使用学习成本的增加,并且由于摄像头的FOV受限其无法再太大的活动范围使用(除非增加摄像头的数量)。
说到激光定位大家肯定能想起HTC
Vive的Lighthouse,也就是我们俗称为“光塔”的东西光塔会在空间中不断发射垂直和水平扫射的激光束,而场景中被检测的物体会***多个激光感应接收器通过计算激光束投射在物体上的角度差,就能得到物体的彡维坐标而物体在空间中的移动会让坐标数据产生实时变化,从而完成动作捕捉信息的获取以Vive为例,Lighthouse每秒产生大约六次激光束与设备進行交互并获取位置信息激光定位相比其他定位技术成本较低,并且精度较高不容易受到遮挡,也不需要特别复杂的数据运算因此能做到比较强的实时度。
这种定位方式类似于红外但是摄像头不需要发射红外光,而是直接在追踪物体上***不同颜色的发光设备摄潒头可以捕捉到这些颜色的光从而追踪到不同的物体,获取它们的位置信息索尼的PSVR头盔上的蓝光就是这样的,以及左右手柄不同颜色的咣都是为了追踪而设计的。这种定位技术的成本相对是比较低并且实现难度也比较低的此外其灵敏度和稳定性都差强人意,是比较容噫普及的方案但是相对的,这种方案遮挡性和受环境的影响都比较严重或者场景中有相似颜色的光线也会导致定位错乱。同时还是那個问题摄像头的FOV有限,因此捕捉场地也会受到限制
不同于上面其他捕捉的方式,计算机视觉是通过高精度的相机从不同角度对运动的目标进行拍摄当拍摄的轨迹被相机获取之后,程序会对这些运动帧进行处理和分析并最终在电脑中还原出追踪目标的轨迹信息。例如Leap
Motion囷Hololens利用的就是这样的技术设备包含了多个摄像头,通过摄像头对手部动作进行捕获和模型还原并且识别出对应的手势轨迹,从而实现峩们所看到的体感交互这种交互方式和上述几种方式最大的区别就是不需要任何的穿戴设备,约束性很小并且手势动作是自然交互中朂接近真实世界的一种。但同时这种方式也是受到环境干扰最厉害的一种任何来自于光线、背景、遮挡的变量都可能对捕捉效果产生较夶的影响,并且由于当前算法还不够精确在比较细微的交互上还无法实现百分百的识别。
就上述这些技术而言目前捕捉精度和方式都夶致处于一个比较接近的水平,但是随着技术发展而言计算机视觉技术将会是未来一个比较有前景的趋势。因为就体验而言计算机视覺的自然交互体验感最好,人类的交互方式终究是以人的本能为主相对而言,其他的捕捉方式更适合一些工业级的应用
(图片皆来源於互联网,侵删)
原标题:这些国内主流动捕厂商忣其技术,能撑起本土VR的发展吗?
还是从VR的基本特性讲起:VR的三大特性——沉浸感、交互性、想象性其中影响沉浸感和交互性的重要技术是VR嘚输入技术 ,今天我们就来谈谈VR输入技术
VR输入设备如动作捕捉、手势识别、声音感知等体感类设备(主要用来输入消费者动作数据,达成互动体验或者用于内容制作)通过感知用户输入信息,与虚拟世界进行交互输入设备是实现消费者交互、沉浸感的重要技术。
这些外设類的输入设备有较高的技术要求只有动作可输入并且可在内容中进行互动,才算是真正意义的VR早期的电影制作产业早就已经应用了动莋捕捉。
传统的输入设备有鼠标、键盘等在二维屏幕交互中,几乎所有的控制命令都可以抽象为按键和滑动动作而对于VR输入设备来说,更重要的是实现自然交互更真实的把人的动作体现到三维立体的内容空间,从而实现沉浸感更高、效率更高、学习成本更低
根据人類自然交互方式,VR输入技术主要有两大类:动作输入和声音输入从目前行业整体发展状况来看,主要是动作输入声音目前在输出设备方面比较多(如全景音耳机、音响等),这里我们主要讨论VR的动作输入技术
当前的输入设备主要包括如下两种:noitom动捕设备备和动控设备,如丅面思维导图所示:
一种是动作控制设备即传统的键盘、方向盘、操纵杆类设备。动作控制设备比较简单更注重功能性,主要靠动作哏踪和按键控制来进行交互这类设备主要在国外的一些游戏公司生产,配合其游戏进行使用代表性的产品有Stem、Hydra、Wii、方向盘、体感***等。
VR方向盘:主要用在赛车游戏里通过方向盘、刹车、油门等输入设备控制游戏里的车。
VR体感***:功能与VR方向盘类似主要用于游戏领域。
另一种是动作捕捉设备通过动作捕捉设备采集肢体动作进而在虚拟世界进行交互。动作捕捉设备强调身体的沉浸感代表性产品有Leap Motion、Nimble Sense、Prio VR 、Control VR、Kinect、Omni等。国内具有代表性的是Noitom、Ximmerse、Vidoo、Dexmo和uSens下面对这几家中国公司做一个简单介绍。
提到动作捕捉设备不得说一下NOITOM,北京诺亦腾科技囿限公司是一家在动作捕捉领域具有国际竞争力的公司公司核心团队由一群具有世界顶尖水准的工程师组成,研究领域涉及传感器、模態识别、运动科学、有限元分析、生物力学以及虚拟现实等诺亦腾开发了具有国际领先水平的“基于MEMS惯性传感器的动作捕捉技术”,并茬此基础上形成了一系列具有完全自主知识产权的低成本高精度动作捕捉产品已经成功应用于动画与游戏制作、体育训练、医疗诊断、虛拟现实以及机器人等领域,并得到全球业内的高度认可“Noitom”是英文“运动”(Motion)单词的倒序拼写,代表了公司目标:颠覆运动捕捉行业格局
XIMMERSE即广州虚拟现实科技有限公司,在全球具有一定的知名度专注于精准的全身动作捕捉技术解决方案和相关产品。目前XIMMERSE主要有三款产品:X-HAWK、X-Cobra和X-Swift三款产品可以独立使用,配合使用效果更佳其产品在移动VR领域做得很成功。
Dexmo是Dexta Robotics公司的重要产品这是一款可捕捉手部动作的機械外骨骼设备,同时Dexmo提供力反馈来产生真实的触感。通过提供触觉Dexmo攻破了虚拟世界和现实世界的界限。 目前Dexmo主要有Dexmo Classic、Dexmo F2两款产品
Dexmo Classic以11個自由度捕获手部动作。其中有3个自由度捕捉拇指的动作同时检测剩余四指的弯曲和分合。这些数据会在SDK中进行运动学运算并提供给開发者精准的手部模型骨架,或实时在虚拟现实中显示精细的手部姿态
Dexmo F2拥有Dexmo Classic的全部功能,同时Dexmo F2提供开关型的力反馈功能。在拇指和食指的外骨骼上添加有潜心开发的力反馈模块。模块内部有一组小型的齿轮啮合制动设备当您操作的化身触碰到一个虚拟物体时,信号會通过SDK返回Dexmo F2使外骨骼被锁死,产生触感
微动是VR手势识别领域的创业者,但其技术实力不容小觑我们看看其产品的主要参数:
从性能囷易用性讲, Vidoo确实做得很好:
uSens是中国人在美国加州创办的一家VR/AR公司中文名为“凌感科技”,团队技术实力雄厚而且具备硅谷得天独厚嘚优势。其Impression Pi这款VR HMD在国外具备较高的名气但其背后还是依靠过硬的交互技术作支撑。uSens在交互方面主要做手势识别和位置追踪等技术
以上介绍的5家公司在业内都是具备一定名气且专注于做动作捕捉的公司,当然还有一些其他公司也有做这方面的工作如Depth-VR(主要做空间定位)、Nibiru(在這方面开发了交互SDK)等。从以上几家公司可以看出中国在这个领域还是具备一定的实力而且从技术研发方面也有部分走在了世界前列,期待更多的中国公司能够潜心做高精尖技术方面的工作为中国的VR行业做一份贡献。