李飞飞

李飞飞

Tag

当前位置：首页 > 李飞飞 >

李飞飞吴佳俊团队的新作，推出具身智能决策能力评价基准，o1-preview登顶了吗？

大模型的具身智能决策能力，终于有系统的通用评估基准了。李飞飞吴佳俊团队新提出的评估框架，对具身智能决策的四项关键子能力来了个全面检查。这套基准已经被选为了NeurIPS数据和测试集（D&B）专栏Oral论文，同时也被收录进了PyPI，只要一行代码就能快速调用。该框架名为EmbodiedAgentInterface（简称EAI），提供了连接不同模块和基准环境的标准接口。

查看更多 2026-06-20

提交需求或反馈

Demand feedback