当前自动驾驶中的当前感知模型在很大程度上依赖于标有3D数据的大规模,这既昂贵又耗时。这项工作提出了一种解决方案,以利用蒙版自动编码器(MAE)对大规模未标记的户外激光雷达点云进行预训练,以减少对标记的3D训练数据的依赖。虽然现有的掩盖点自动编码方法主要集中于小规模的室内点云或基于支柱的大规模室外激光雷达数据,但我们的方法引入了一种新的自助式掩盖的掩盖占用预训练方法,称为占用率,专门为Voxel基于 ...
索引讲故事在视频游戏中越来越受欢迎,叙事通过零散的线索展开。这种方法促进了玩家生成的内容和讨论,因为故事口译员将这些分散元素的总体叙述融合在一起。但是,线索的零散和非线性性质使系统的分类和解释具有挑战性,有可能阻碍有效的故事重建和创造性参与 ...
重复消费(例如回购项目和重新列出歌曲)是日常生活中的常见情况。为了建模重复消耗,已经提出了重复感知的建议,以预测哪些项目将根据用户项目的交互重新互动。在本文中,我们研究了各种固有的特征,以增强重复感知的建议 ...
上下文:大型语言模型(LLM)和生成预训练的 Transformer (GPT)已改变了软件工程领域(SE)。现有的基于LLM的多代理模型已成功解决了基本对话任务。但是,在仅在现有的一些工作中,已经研究了LLMS对更具挑战性任务的潜力,例如大型和复杂项目的自动代码生成 ...
在过去的几年中,对象检测取得了巨大的成功,而目前的优秀检测器则在解决尺寸有限的实例方面努力。具体而言,先验区域和物体区域之间低重叠的众所周知的挑战导致样本池进行优化,而判别信息的匮乏进一步加剧了识别。为了减轻上述问题,我们提出了CFINET,这是一个针对基于粗到精细的管道和特征模仿学习的小物体检测而定制的两阶段框架 ...
注意:此预印本具有缺陷的理论表述。请避免它,并参考此HTTPS URL的ICLR22出版物。另外,Arxiv:2109 ...
近年来,在多模式理解模型和图像产生模型中都取得了显着的进步。尽管取得了各自的成功,但这两个领域还是独立发展的,导致了独特的建筑范式:尽管基于自动进程的架构占多模式的理解,但基于扩散的模型已成为图像生成的基石。最近,人们对开发整合这些任务的统一框架的兴趣越来越大 ...
最近的3D高斯脱落(3DG)表示在新型视图合成中表现出了显着的性能。此外,3DGS上的材料散开材料散布值得重新保证功能及其对更广泛应用的适应性。虽然对后一种操作的一般方法在于整合基于物理的渲染(PBR)技术以共同恢复BRDF材料和环境照明,但由于精确建模光运输的挑战,获得精确的脱离仍然是一项固有的艰巨任务。现有方法通常近似高斯点的正态,这构成了隐式几何约束 ...