Clémentine Fourrier在推特上宣布发布了Open LLM Leaderboard的新版本v2,据称比之前的版本更具挑战性。这个排行榜对于那些对大型语言模型(LLMs)的发展和基准测试感兴趣的人来说非常重要,因为它提供了一个平台来比较各种模型的性能。提到排行榜增加的难度表明该领域的进步,并为评估LLMs设定了更高的标准。对于机器学习...