首页 /研究 /PhysBrain 1.0技术报告
LEARNING开放获取

PhysBrain 1.0技术报告

Shijie Lian, Bin Yu, Xiaopeng Lin, Changti Wu, Hang Yuan, Xiaolin Hu, Zhaolong Shen, Yuzhuo Miao, Haishan Liu, Yuxuan Tian, Yukun Shi, Cong Huang, Kai Chen

2026

摘要

该论文提出PhysBrain 1.0,通过将大规模人类自我中心视频转化为结构化物理常识监督,训练视觉-语言-动作模型,并在多模态问答和具身控制基准上取得最先进结果。其核心创新在于利用人类交互视频中的物理先验知识,有效桥接了多模态理解与机器人动作执行之间的鸿沟。

关键词

vision-language-actionphysical commonsensehuman egocentric videoVLA policyout-of-domain

相关论文