lucian_p的文档

lucian_p

个性签名 ...

Large Language Models for Computer-Aided Design: A Survey

近年来，大型语言模型（LLMS）迅速发展，诸如Chatgpt和DeepSeek之类的模型展示了它们在不同领域的非凡功能。尽管已经对各个领域的LLM进行了大量研究，但重点是与计算机辅助设计（CAD）集成的全面审查仍然没有。 CAD是3D建模的行业标准，在不同行业的产品的设计和开发中起着至关重要的作用 ...

0 0 0 0 2025/05/15 arXiv:2505.08137v1 lucian_p

Text2CAD: Generating Sequential CAD Models from Beginner-to-Expert Level Text Prompts

现代软件中的原型计算机辅助设计（CAD）模型可能非常耗时。这是由于缺乏智能系统可以快速生成更简单的中间部分。我们提出了Text2CAD，这是第一个使用设计师友好的说明，用于所有技能水平的设计师友好的说明，用于生成文本到参数的CAD模型 ...

0 0 0 0 2025/05/15 arXiv:2409.17106v1 lucian_p

A General Optimization-based Framework for Global Pose Estimation with Multiple Sensors

准确的状态估计是自主机器人的基本问题。为了实现局部准确且全球无漂移状态的估计，具有互补特性的多个传感器通常融合在一起。本地传感器（相机，IMU，LIDAR等）在一个小区域内提供精确的姿势，而全球传感器（GPS，磁力计，晴雨表等）提供嘈杂，但在大规模环境中无环形的定位 ...

0 0 0 0 2025/04/10 arXiv:1901.03642v1 lucian_p

VL-Nav: Real-time Vision-Language Navigation with Spatial Reasoning

在未知环境中的视觉导航对于移动机器人至关重要。在家庭援助和救援等情况下，移动机器人需要了解人类的命令，例如“找到一个穿黑色的人”。我们提出了一种新颖的视觉导航（VL-NAV）系统，该系统在低功率机器人上集成了有效的空间推理 ...

0 0 0 0 2025/03/13 arXiv:2502.00931v3 lucian_p

BEHAVIOR Robot Suite: Streamlining Real-World Whole-Body Manipulation for Everyday Household Activities

现实世界中的家庭任务对移动操纵机器人面临着重大挑战。对现有机器人技术基准的分析表明，成功的任务绩效取决于三个关键的全身控制功能：双层协调，稳定且精确的导航以及广泛的最终效果可达性。实现这些功能需要仔细的硬件设计，但是由此产生的系统复杂性进一步使视觉运动策略学习变得复杂 ...

0 0 0 0 2025/03/12 arXiv:2503.05652v1 lucian_p

DeepLSD: Line Segment Detection and Refinement with Deep Image Gradients

线段在我们的人类世界中无处不在，并且越来越多地用于视觉任务。由于它们的空间范围及其提供的结构信息，它们对特征点具有补充。基于图像梯度的传统线探测器非常快速，准确，但在嘈杂的图像和具有挑战性的条件下缺乏健壮性 ...

0 0 0 0 2025/03/10 arXiv:2212.07766v3 lucian_p

Learning to Parse Wireframes in Images of Man-Made Environments

在本文中，我们提出了一种基于学习的方法，以自动提取杂乱的人造环境图像的“线框”表示。线框（见图1）包含所有显着的直线及其在有效，准确地编码大型几何形状和对象形状的场景的连接处 ...

0 0 0 0 2025/03/10 arXiv:2007.07527v1 lucian_p

Holistically-Attracted Wireframe Parsing

本文提出了一种快速和简约的解析方法，可准确稳健地检测出具有单个正向通行证的输入图像中的矢量线框。所提出的方法是端到端训练，由三个组件组成：（i）线段和交界提案生成，（ii）线段和连接匹配，以及（iii）线段和连接验证。为了计算线段建议，提出了一种新颖的双重表示，该提议利用了线段的片状几何重新聚集化，并形成了输入图像的整体4维吸引场图 ...

0 0 0 0 2025/03/10 arXiv:2003.01663v1 lucian_p

ScoreNet: Learning Non-Uniform Attention and Augmentation for Transformer-Based Histopathological Image Classification

高分辨率图像和详尽的局部注释成本的良好成本阻碍了数字病理学的进展。用于对病理图像进行分类的常用范式是基于斑块的处理，该处理通常包含多个实例学习（MIL）以汇总局部斑块级表示，从而产生图像级预测。但是，诊断相关的区域只能占整个组织的一小部分，而当前的基于MIL的方法通常会统一地处理图像，从而丢弃相互作用的相互作用 ...

0 0 0 0 2025/03/09 arXiv:2202.07570v3 lucian_p

MUSt3R: Multi-view Network for Stereo 3D Reconstruction

DUST3R提出了一个模型，该模型可以提供密集且无约束的立体3D重建任意图像集合，而没有有关摄像机校准或观点姿势的事先信息，从而引入了几何计算机视觉的新范式。但是，在引擎盖下，DUST3R处理图像对，回归需要在全球坐标系中对齐的本地3D重建。对二次生长的对数是一个固有的限制，在大型图像集合的情况下，它特别关注可靠和快速优化 ...

0 0 0 0 2025/03/07 arXiv:2503.01661v1 lucian_p