Face ID是iPhone X的突出亮点,3D成像引起空前关注
今年,大家对iPhone X印象最深的莫过于新的身份认证方式,即Face ID ,这也是iPhone X的关键卖点。用户只需要看着手机,就能实现人脸解锁。iPhone X的Face ID不同于普通的人脸识别,在其中加入了深度信息,让身份认证更安全。
Face ID的完成靠的是iPhone X顶部一小块没被屏幕覆盖的区域,该区域整合了8个零件,包括麦克风、扬声器、前置镜头、环境光感测器、距离感应器、红外线镜头、泛光感应元件、点阵投影器等。苹果将整个系统称之为原深感镜头(True Depth Camera System),而整个系统除了能用于Face ID人脸验证.也可以扩展自拍功能和AR效果香加。
3D成像技术通过红外发射、接收模组,实现对拍摄对象位置、细节等深度数据采集,真正还原真实场景。目前主要的实现手段有三种:(1)单目结构光,代表公司有苹果(收购最大的结构光技术公司Prime Sense)、微软Kinect-1、英特尔RealSense, Google Project Tango等,目前创业公司几乎都沿用此技术路线;(2)双目可见光,代表公司Leap Motion; (3)是飞行时间法((TOF),代表公司微软 Kinect-2。
结构光是基于光学三角形测量原理,根据光照到物体上的光斑变形程度
来测量物体的远近角度,比方说光斑直射时,其大小反映了拍摄对象的远近,而当光线斜射时,椭圆光斑焦距则反映拍摄对象与镜头切面角度,摄像头收集变化后的光斑数据,通过算法来重构物体模型。
TOF是飞行时间法3D成像,是通过给目标连续发射激光脉冲,然后用传感器接收从反射光线,通过探测光脉冲的飞行往返时间来得到确切的目标物距离。双目立体视觉(Binocular Stereo Vision)是机器视觉的一种重要形式,他是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。
三种主流的方案中,比较成熟的是结构光和TOF。结构光方案作为最早发展的3D成像方案,最为成熟,已经大规模应用于工业3D视觉领域,但缺点在于易受到外界光的干扰、响应速度较慢、识别精度较低,适用于近距离场景,是目前前置3D成像的主流方案。而TOF方案在这几个方面均比结构光方案更具优势,飞行时间能够精准测算出实时距离,也就成为了目前移动端后置镜头中最为看好的方案。相比前两者,双目立体成像方案抗环境光干扰能力强,分辨率高,也是移动端可选方案之一,但是技术发展时间短,还不够成熟,目前较多应用于机器人视觉、自动驾驶测试领域。
Face ID采用结构光方案,是目前安全性最高的人脸识别方案
3D成像的方案有多种实现形式,苹果Face ID采用的是结构光方案,通过将3万多个光点的网络投射到人脸上,并随着用户转动头部以映射脸部3D形状,最终形成的是一个三维图像。同时,通过All放生芯片独立的神经引擎(Neural Engine),处理用户面部数据,将其与注册的用户面部数据进行对比。
苹果的Face ID采用结构光模式,主要是为了适应人类脸部五官复杂性以及安全性需求,使用特定的光照仪器将投射图案进行编码,以此加速确认物体表面点与其图像像素点之间的对应关系。
苹果在3D成像领域早已开始积累,为Face ID储备相关技术,如2010年收购面部识别技术公司Polar Rose , 2013年收购运动捕捉技术公司PrimeSense, 2015年收购增强现实技术公司Metaio等。除此之外,2016年年底,苹果还发布了第一份关于人工智能的学术论文《Learning from Simulatedand Unsupervised Images through Adversarial Training》。这篇论文阐述了如何通过计算机生成图像而非真实图像来训练算法的图像识别能力。
结构光3D成像包括五大核心模块
整个结构光3D成像的过程是由红外发射器发射特定图形的散斑或者点阵,经物体反射后,红外光由红外接收端接收,通过捕捉分析发射反射图像,跟原始的散斑对比,从而得到距离的信息。而可见光传感器负责2维图像的采集,通过两个传感器得到的信息汇总,进行图像处理,算法处理,得到三维的图像信息。
由成像过程可以看出结构光3D成像技术主要由5大部分组成:C1>红外线(IR)发射模组:用于发射经过特殊调制的红外光至拍摄物体。(2)红外线(IR)接收模组:接收由被拍摄物体反射回来的红外光,通过计算获取被拍摄物体的空间信息。(3)镜头模组:采用普通镜头模组,用于2D彩色图片拍摄。(4)图像处理芯片:将普通镜头模组拍摄的2D彩色图片和IR接收模组获取的3D信息集合,经算法处理得当具备3D信息的彩色图片。增量部分来自IR发射模组、IR接收模组、3D图像处理ICo (5)算法与系统集成。
3D成像核心模块之红外发射端
IR发射模组:包括红外发射源,准直透镜,DOE。由红外发射端发射红外,微型准直透镜是把混乱的红外线准直处理,达到平行、均匀光斑的作用;然后通过DOE衍射光姗让光线分散打在整个目标物体上。
核心元器件VCSEL(增量需求):作为红外光源,VCSEL相比LED,LD光源,寿命长,制作工艺成熟,指向性强,功耗低,光电转化效率高等优点,造就了VCSEL在3D成像中广泛的应用。常见的3D摄像头系统一般都采用VCSEL作为红外光源。
参考观研天下发布《2018-2023年中国手机摄像头行业市场需求现状分析与未来发展前景预测报告》
移动端设计的VCSEL生产公司大多集中在美国,Finsar, Lumentum,Princeton Optronic, Heptagon等公司。目前国内仅有光迅科技在光通信领域有VCSEL商业化产品推出。
准直镜头(增量需求):准直镜头的功能就是将激光器的光线变成轴对称圆柱形平行光线,一般由两组镜片组成,第一组镜片先把激光压缩成散角较小的光束,经过第二组凸透镜使得在象空间的光束为轴对称的圆柱形平行光束。
晶圆级镜头:WLO }WaferLevelOptics)工艺主要生产WLC(Wafer LevelCameras),是对玻璃的两个表面进行非球面复制,8英寸Wafer上面可以一次性生产6000多颗Dies,在WLC封装过程中不需要进行调焦,减少了树脂镜头调焦的工艺,直接在TSV上面进行封用半导体工艺批量复制镜头,再切割成单个镜头,相对于传统的摄像头模组,极大地减薄了摄像头模组的厚度、省去了模组的调焦工序,可直接使用SMT设备进行贴装等,将成为未来摄像模组的大趋势。其中晶圆级镜头大部分专利掌握在heptagon手中,国内晶方科技,华天科技已经掌握晶圆级镜头后段处理技术,有望迎头赶上。
DOE(衍射光姗):VCSEL射出的激光束没有特异性,经准直后,通过激光束经准直后,再经过DOE扩散片可得到所需的散斑图案。目前DOE扩散片主要专利掌握在德国的CDA公司。国内福晶科技在此有一定技术积累。
3D成像核心模块之红外接收端
红外接收端:接收由被拍摄物体反射回来的不可见红外光,通过计算获取被拍摄物体的空间信息。红外接收端包括三大部分特制红外CMOS ;窄带滤光片:镜头Lens。
红外CMOS(增量需求):用于接收发射的红外光斑,与普通的RPG传感器的区别在于需要识别的光线范围主要是红外光,这是相对小众和成熟的市场,随着下游VR, AR,辅助驾驶,人脸识别的应用增加,未来市场会逐步增大!但国内在传感器领域差距较为明显,短时间难以突破。
红外窄带滤光片(增量需求):红外CMOS接收940nm的红外光,为了去除环境光线的影响,需要窄带光片过滤大部分环境光线。只允许特定波段的近红外光通过,目前近红外窄带滤色片主要采用干涉原理,需要几十层光学镀膜构成,相比于RGB吸收型滤色片具有更高的技术难度和产品价格。
窄带滤光片主要产能主要集中在美国VIAVI和国内水晶光电手中,供应商有限,是目前国内参与3D成像产业链最为重要的突破口之一。
镜头Lens(非增量需求):采用传统2D成像的镜头Lens,产业链相对比较成熟主要标的有水晶光电,大立光(3008.T W ),玉晶光电。
3D成像核心模块之摄像头及芯片算法模块
摄像头模组(增量需求):2D成像模组技术较为成熟,主要增量来自于3D成像模组升级替代,单个模组价值量会有所提升,在模组制造方面国内有欧菲光、舜宇光学、丘铁科技等公司。
图像处理芯片(增量需求):高技术难点,高壁垒。将2D图像与红外得到的位置信息整合得到3D图像,目前该芯片主要掌握在德州仪器、意法半导体中,国内全志科技、北京君正、瑞芯微在图像处理芯片上具有一定的积累。
2、3D成像技术解决2D成像的局限,深度数据开启新应用领域
2D成像应用场景过于局限。当前科技界炙手可热的领域如人机交互、人脸识别、AR/VR、无人机导航、体感游戏、辅助驾驶、机器人视觉等等,都是2D平面成像所完成不了的。
3D摄像头可覆盖多领域应用场景,3D摄像头实现实时三维信息采集,
为消费电子终端加上了物体感知功能,从而引入多个“痛点型应用场景”,包括人机交互、人脸识别、三维建模、AR、安防和辅助驾驶等多个领域。
1)生物识别领域:主要是人脸识别技术和虹膜识别技术,对于人脸部以及瞳孔细节特征数据进行深度采集,3D成像能够完成对拍摄对象实时位置数据收集,大大提高了生物识别的可靠性。
根据前瞻产业研究院的数据,2007年至2013年六年期间,全球生物识别市场规模复合增长率达22%左右,预计2020年全球生物识别行业的市场规模将达250亿美元。
2)手势识别:手势识别将传统手势从屏幕中解放出来,目前的二维手势识别只能做到一些比较简单的操作,比如控制视频播放开始和暂停、浏览照片等。对于更加复杂的体育类游戏或者AR/VR来说,二维手势识别技术还不够完完善。未来集成3D摄像头的智能硬件将极大地促进三维手势识别的普及和应用,这也将带来比触摸屏交互更加接近人类方式的交互式体验。
3)智能驾驶领域。3D成像应用于智能驾驶,可以更全面获取路面信息实时反馈给智能驾驶系统,辅助系统完成正确的指令操作,使未来智能驾驶更安全。
4)智能安防领域,可以通过智能摄像头分析人的行为是否在有潜在危害在金融行业颇有用途,但对算法要求非常高。
5 ) AR /VR领域:AR/VR的发展迅速,硬件方面有了一定的积累,但在呈现内容方面,大部分VR内容都由电脑生成,未来可以利用深度摄像头直接获取内容,真正实现虚拟现实交互。
目前,不论是手机终端厂商、镜头制造厂商,还是互联网、计算机领域都在积极布局3D成像,3D成像领域将成为未来下一片蓝海。
3、3D成像未来市场空间大
几十年来,3D成像和传感技术已经在高端市场推动下逐渐成熟,并且已在医疗类和工业类领域取得了巨大的成功。
根据Yole近期发布的创新成像技术和市场研究报告,2016年,3D成像和传感器件开始出现明显的商业拓展,市场规模超过13亿美元。近期又呈现出加速趋势,通过首次进入智能手机市场的推动,V R/AR和可穿戴应用领域也将助推出货量的增长,预计到2022年,将出货超过10亿颗3D成像器件。未来五年,预计3D成像和传感器件市场的复合年增长率为37.7 % ,2022年将达到90亿美元。
根据智研咨询预测,2020年智能手机出货量达到19.25亿台。我们预测,考虑到iPhone X采用前置3D摄像头,2017年苹果手机中3D摄像头渗透率大约为20%, 2018年达到70%, 2019年达到90%, 2020年达到100%。其他产商起步较晚,预计2018年,2019年,2020年,前置3D成像结构光方案渗透率分别为10%, 20%, 30% 。智能手机前置3D成像结构光方案市场规模将达到49.28亿美元,未来几年将保持高速增长。
【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。