虽然许多其他基准测试已经被LLMs饱和,但我相信NetHack对于(LLM)代理人来说仍然是一个非常具有挑战性的前景。 杨立昆是人工智能领域的知名人物,转发了一条推文,纪念人工智能社区承认教授AI玩复杂游戏NetHack所面临的挑战。这条推文反映了尽管人工智能领域取得了快速进展,但AI在某些任务上仍然面临困难。提到NetHack这款以深...