|
Post by account_disabled on Dec 25, 2023 8:14:53 GMT
跨域泛化评估,与其他方法相比,所提出的 立体匹配方法可以为无纹理道路区域生成更平滑的视差图。 右图:基于 的重建 环境的可视化。 深度传感在许多计算机视觉应用中发挥着核心作用。事实上, 数据的可用性可以提高自动驾驶、 和机器人导航等任务解决方案的有效性。主动 传感器具有众所周知的缺点,可能会限制其实际可用性:例如, 价格昂贵且仅提供稀疏测量,而结构光的工作范围有限且主要适用于室内环境。相比之下,从图像推断深度的被动技术由于其成本低且易于部署,适用于更多场景。其中,双目立体 估计校正图像对之间的视差图 已成为活跃研究中的热门课题。 所提出的 的网络架构 百度 将在 上发表一篇关于立体匹配的金字塔组合和变形成本卷的口头研究论文(接受率 )。在本文中,百度研究人员提出了 ,一种基于金字塔组合和 成本量的网络,它可以在跨域泛化和各种基准上的微调精度方面取得良好的性能。特别是,所提出的 是 电话号码列表 为了两个目的而设计的。首先,研究人员在金字塔的上层构建了组合体,并开发了成本体融合模块来整合它们以进行初始视差估计。其次,研究人员在金字塔的最后一层构建了扭曲体积以进行视差细化。当对合成数据集进行训练并推广到未见过的真实数据集时,该方法表现出强大的跨域泛化能力,并且大大优于现有的最先进技术。 截至 年 月 日,该方法在 上排名第一,在 上排名第二,在 上排名第一。 数据集上的模型泛化能力与微调性能 研究论文: :基于 的 物体检测的无监法仅限于场景级或点 体素级实例辨别。场景级方法往往会丢失对于识别道路物体至关重要的局部细节,而点 体素级方法本质上受到有限的感受野的影响,无法感知大型物体或上下文环境。考虑到区域级表示更适合 对象检测,本研究设计了一种新的无监督点云预训练框架,称为 ,它通过对比区域提案来学习鲁棒的 表示。具体来说,通过从每个点云采样的一组详尽的区域提案,对每个提案内的几何点关系进行建模,以创建富有表现力的提案表示。
|
|