克雷西 发自 凹非寺量子位 | 公众号 QbitAI 大模型的具身智能决策能力,终于有系统的通用评估基准了。李飞飞吴佳俊团队新提出的评估框架,对具身智能决策的四项关键子能力来了个全面检查。这套基准已经被选为了NeurIPS数据和测试集(D&B)专栏Oral论文,同时也被收录进了PyPI,只要一行代码就能快速调用。该框架名为Embo...
在论文中,李飞飞指出在ImageNet和目标识别取得成功之后,计算机视觉领域还有许多令人兴奋的研究方向和挑战,比如具身智能、视觉推理、场景理解等。李飞飞认为具身智能是人工智能的一个重要且有挑战的方向,它要求机器人或其他智能体能够在复杂多变的环境中,结合视觉、语言、推理等能力,实现与物理世界的交互。并且,具身...
如今,李飞飞的工作重点集中在 AI 智能体上,这种智能体不仅能接收来自数据集的静态图像,还能在三维虚拟世界的模拟环境中四处移动,并与周围环境交互。这是一个被称为「具身 AI」的新领域的广泛目标。它与机器人技术有所重叠,因为机器人可以看作是现实世界中具身 AI 智能体和强化学习的物理等价物。李飞飞等人认为...
《科创板日报》消息,美国国家工程院院士、斯坦福大学教授李飞飞团队于近日发布了具身智能的最新研究成果,大模型接入机器人,可将复杂指令转化成具体行动规划,人类可以很随意地用自然语言给机器人下达指令,机器人也无需额外数据和训练。 该项目名为“VoxPoser”,相比传统方法需要进行额外的预训练,该项目用大模型指导机器人...
李飞飞认为,具身智能不单指人形机器人,任何能在空间中移动的有形智能机器都是人工智能的一种形式。正如ImageNet旨在表示广泛且多样化的现实世界图像一样,具身智能研究也需要解决复杂多样的人类任务,从叠衣服到探索新城市。遵循指令执行这些任务需要视觉,但需要的不仅仅是视觉,也需要视觉推理理解场景中的三维关系。最...
到目前为止,衡量具身 AI 进展的一种简单方法是:将具身智能体的表现与在更简单的静态图像任务上训练的算法进行比较。研究人员指出,这些比较并不完美,但早期结果确实表明,具身 AI 的学习方式不同于它们的前辈,有时候比它们的前辈学得还好。 在最近的一篇论文...
英伟达资深研究科学家、AI 智能体项目负责人 Jim Fan 说道:李飞飞对具身智能的看法极大地影响了我的博士课程和研究品味。空间智能是计算机视觉和具身智能体的下一个前沿!众多大佬看好,World Labs 的目标会成为人工智能的下一个大方向吗?我们或许还需要等待。从一个角度来看,World Labs 的承诺与此前热炒过的词汇...
▍具身智能=?《科创板日报》记者在VoxPoser官网看到,大模型接入机器人后,人类可以随意用自然语言给机器人下达指令,就像这样:大语言模型+视觉语言模型,可以在3D空间中分析出目标和需要绕过的障碍,帮助机器人做行动规划,就像这样:更重要的是,真实世界中的机器人在未经“培训”的情况下,可以直接执行任务,就像...
《科创板日报》7月11日讯(记者 张洋洋)美国国家工程院院士、斯坦福大学教授李飞飞团队于近日发布了具身智能的最新研究成果,大模型接入机器人,可将复杂指令转化成具体行动规划,人类可以很随意地用自然语言给机器人下达指令,机器人也无需额外数据和训练。 该项目名为“VoxPoser”,相比传统方法需要进行额外的预训练,该项...
作者认为其中最具潜力的领域是具身人工智能(embodied AI),即能够用于导航、操作和执行指令等任务的机器人。机器人并不是指有头、两条腿走路的人形机器人,任何在空间中移动的有形智能机器都是一种具身人工智能的形式,无论是自动驾驶汽车、机器人吸尘器,还是工厂里的机械臂。正如ImageNet旨在代表现实世界广泛而多样...