喜报 | 小米相机算法团队在CVPR 2023斩获四项冠军! 今亮点
工人日报
2023-05-10 10:28:53
(资料图片)
不负众望:获奖团队载誉归来
本次小米参加CVPR 2023-MIPI和CVPR 2023-NTIRE比赛的人员分别来自小米相机算法部AI算法团队(MiAIgo)、视频算法团队(MVideo)和多摄算法团队(MiMcAIgo)。 AI算法团队(MiAIgo)主要负责手机相机AI相关技术的研发工作,涉及高层的AI语义感知类技术和底层的AI画质增强类技术,宗旨是为用户带来智能、极致的摄影体验,研究方向包括夜景去噪、超高动态、人像/场景分割、深度估计等,研究成果包括夜枭系列拍照、夜景抓拍、智能构图等。 视频算法团队(MVideo)主要负责使用计算摄影等技术提升用户视频图像拍摄体验,研究方向包括图像画质增强、图像稳像、智能视频剪辑以及图像特效等,研究成果包括视频超分/降噪、HDR、光学防抖(OIS)、电子防抖(EIS)以及智能剪辑等。 多摄算法团队(MiMcAIgo)主要负责手机多摄相关算法的研究,致力于利用手机的多摄技术提升用户在人像和变焦等维度的用户体验,研究方向包括多目立体视觉,立体匹配,虚化渲染,空间平滑以及异构融合等,研究成果包括人像虚化(Bokeh),大师镜头,多摄平滑切换(SAT)和多摄融合等。 02MIPI:移动智能摄影与成像
移动智能摄影与成像(Mobile Intelligent Photography and Imaging,简称MIPI)是CVPR 2023的研讨会之一,以新型图像传感器和成像算法为核心,从产业界与学术界的视角讨论移动智能摄影与成像的发展。小米相机算法团队在其中多个赛道表现卓越,并以绝对优势拿下夜间耀斑去除挑战赛冠军。1夜间耀斑去除,还原真实夜景
镜头光晕是一种常见的光学现象,在监控镜头、智能手机相机、无人机和自动驾驶相机等移动平台中,日常磨损、指纹和灰尘等都会加剧镜头光晕,并且在夜间更为明显。因此,夜间的耀斑去除算法尤为重要。耀斑主要分为三种类型:散射耀斑、反射耀斑和透镜球体。本次比赛中,小米AI算法组团队(MiAIgo)主要关注最普遍的夜间图像退化类型——散射光斑。 MIPI - Nighttime Flare Removal 小米排名第一2RGB+TOF深度补全,提升虚化层次
“RGB+TOF深度补全”任务是利用RGB图像将稀疏的TOF深度补全为完整的稠密深度图。稀疏TOF测量的一个明显缺点是其深度结果的稀疏性,无法直接用于图像增强、3D重建和AR/VR等任务。利用RGB图对稀疏TOF数据进行补全,可以较好的解决稀疏TOF数据不易直接使用的问题。
本赛道要求算法能够做到实时处理RGB+TOF数据并预测深度,即要求达到30帧/秒的速度。TOF成像的深度点云不仅稀疏,同时还存在大量缺失和噪点,进一步增大了深度稠密任务的难度。为此,团队提出了基于Transformer增强多尺度非局部传播网络。该网络使用了由粗到细的预测框架,将深度补全的复杂性分解成主体结构预测和细节优化两个子问题,如图所示。 网络结构图 在细节增强过程中,团队采用非全局传播的网络结构,打破了固定卷积核的限制,通过迭代传播的方式自适应聚集非局部深度信息,进一步细化深度细节。同时还在最底层特征中引入了轻量级Transformer(LoFTR)模块和自注意机制,更好地解决了点云缺失和噪点的问题。 最后,小米多摄算法团队(MiMcAIgo)在比赛测试数据集的客观评价和主观评价两方面均取得了先进结果,获得第二名。03
NTIRE:“影像算法奥林匹克”
NTIRE(New Trends in Image Restoration and Enhancement)是由CVPR 组委会承办的关于计算机视觉和模式识别领域的研讨会,旨在提供图像恢复和增强领域的新趋势和进展的概述,并为学术和工业参与者提供互动和探索合作的机会。 作为全世界规模最大、水平最高的图像恢复与增强的研讨会,NTIRE素有“影像算法奥林匹克”之称,今年已是第八届。小米相机算法团队参与了夜间摄影渲染、图像去噪、视频上色和360°全景超分辨率等多个赛道,并包揽其中3项冠军。1夜间摄影渲染,定格细腻表达
相机拍摄和渲染图像的过程是将原始传感器图像转换为最终的成品照片图像,并在标准色彩空间(如sRGB)中进行编码。其中,夜间摄影因具备广泛的应用场景和独特的艺术美感而被越来越多的人喜爱。但相对于白天,夜间摄影渲染往往面临更大的挑战。
左:经过简单ISP处理后的图像 右:算法处理后的图像
2图像去噪,重建清晰画质
图像去噪是指从嘈杂的输入图像中恢复出干净的图像。在图像的采集和处理过程中,存在高斯噪声、泊松噪声、JPEG压缩噪声等多种噪声类型,使图像去噪成为一项极具挑战性的任务。本任务设置了噪声水平 σ = 50 的加性高斯白噪声来破坏图像,以从噪声输入图像中恢复出干净的图像。在226个参与队伍中,小米AI算法组团队(MiAIgo)取得了第三名的好成绩。3视频上色,再现鲜活效果
视频上色任务是指将黑白或灰度视频转换为彩色视频。与图像着色不同,视频着色不仅需要高保真的单帧结果,还需要保持帧之间的时间一致性。同时,视频着色还需确保实例一致性,即前一帧中出现的对象在后续的语义颜色相同。因此,视频着色是视觉增强和恢复中一个具有挑战性的任务。左:灰度视频帧
右:算法处理上色后的视频帧
本次任务设置了两个赛道,分别强调时序一致和高保真两个方向。其中,小米AI算法团队(MiAIgo)在时序一致优化赛道表现优异,以显著优势摘得冠军。此外,在高保真优化赛道中团队也取得了第三名的好成绩。 算法流程图 在时序一致优化赛道,团队提出了自适应帧间平滑策略,通过减少相机或物体运动对测试序列视觉内容的影响提高帧间稳定性,优化时序一致性。在高保真优化赛道,团队提出了一种多模型融合策略,旨在通过针对常见和不常见的场景使用不同的模型来提高方法的鲁棒性。4360°全景超分辨率,营造沉浸体验
与仅具有狭窄视野(FoV)的平面视频不同,360°全景视频可以从各个方向呈现整个场景,为用户提供身临其境的交互体验。随着AR / VR应用的普及,360°全景视频逐渐受到广泛的研究与关注。
x