OTHER开放获取
FactoryBench:评估工业机器理解
Yanis Merzouki, Coral Izquierdo, Matei Ignuta-Ciuncanu, Marcos Gomez-Bracamonte, Riccardo Maggioni, Alessandro Lombardi, Camilla Mazzoleni, Federico Martelli, Balazs Gunther, Jonas Petersen, Philipp Petersen
2026
摘要
本文提出了FactoryBench基准,用于评估时间序列模型和大型语言模型在工业机器人遥测数据上的机器理解能力。该基准包含超过7万个问答对,覆盖因果推理的四个层次和五种答案格式,测试结果显示当前最先进的模型在结构化层次上准确率不超过50%,在决策层次上不超过18%。
关键词
benchmarktime-seriescausal reasoningrobotic telemetryLLM evaluation
相关论文
OTHER
📊 1 引用
一种面向线弧增材制造的电动汽车结构可制造性拓扑优化的双环框架
Qiang Cui, Chuan Yu, Daoqian Yang 等 5 位作者
Robotics and Computer-Integrated Manufacturing · 2026
OTHER
📊 0 引用
几何数字孪生:一种用于航空发动机装配精度预测的数字智能模型
Ke Shang, Xin Jin, Teli Xu 等 7 位作者
Robotics and Computer-Integrated Manufacturing · 2026
OTHER
📊 0 引用
通过人工智能驱动的机器人技术革新产业
Aryan Chaudhary
Recent Advances in Computer Science and Communications · 2026
OTHER
📊 0 引用
新型大口径偏置馈电可展开天线设计与动态性能预测
Chuang Shi, Tianming Liu, Ning Xue 等 9 位作者
Aerospace Science and Technology · 2026