首页 /研究 /学习结构潜在点以实现机器人操作中的高效视觉表示
MANIPULATION开放获取

学习结构潜在点以实现机器人操作中的高效视觉表示

Yicheng Jiang, Jiaxu Wang, Junhao He, Zesen Gan, Junhao Li, Qiang Zhang, Jingkai Sun, Jiahang Cao, Mingyuan Sun, Xiangyu Yue, Qiming Shao

2026

摘要

本文提出一种混合表示——结构潜在点,通过点状潜在变分自编码器结合点云自编码器,在隐空间中联合正则化点特征和坐标,兼顾隐式表示的丰富性和显式表示的结构先验。该方法在多个基准和真实机器人平台上提升了任务成功率、样本效率及对视角和场景变化的鲁棒性。

关键词

3D representationpretrainingrobotic manipulationhybrid representationstructural latent points

相关论文