首页 /研究 /优质令牌搜寻:视觉几何变换器中令牌选择的搭车指南
PERCEPTION开放获取

优质令牌搜寻:视觉几何变换器中令牌选择的搭车指南

Shuhong Zheng, Michael Oechsle, Erik Sandström, Marie-Julie Rakotosaona, Federico Tombari, Igor Gilitschenski

2026

摘要

本文提出了一种两阶段令牌选择框架,通过帧间多样性选择和帧内层感知稀疏化,显著降低视觉几何变换器的计算成本。该方法在保持甚至提升基线性能的同时,将包含500张图像的场景处理速度提升超过85%。

关键词

token selectionvisual geometry transformersmulti-view 3D reconstructionglobal attentionsparsification

相关论文