AlphaDev 基于 Google DeepMind 此前的一项成果:在围棋、国际象棋和象棋等游戏中打败世界冠军的强化学习模型 AlphaZero。而 AlphaDev 展示了这个模型如何从游戏转移到科学挑战,以及从模拟到现实世界的应用。为了训练 AlphaDev 发现新的算法,团队将排序变成了一个单人的「组装游戏」。在每个回合中,AlphaDev 观察它所...
AlphaDev 是建立在 AlphaZero 之上的,AlphaZero 是 DeepMind 训练的、用来学习围棋和国际象棋等游戏的强化学习模型。DeepMind 的突破在于将寻找更快算法的问题视为一场游戏,然后让它的人工智能赢得这场游戏——与去年研究中用来加快计算速度的方法相同。在 AlphaDev 的案例中,它所做的游戏涉及选择计算机指令并将它们...
最后,DeepMind会根据AlphaDev正确排序数字的能力以及完成排序的速度和效率给予奖励,而AlphaDev则需要通过发现一个正确且更快的程序来赢得游戏。图A:汇编游戏。玩家AlphaDev以系统状态st为输入,并通过选择一条汇编指令将其添加到已经生成的算法中来进行一次移动。图B:奖励计算。在每次移动后,生成的算法会接受测试,...
最终,DeepMind会依据AlphaDev恰当排序数的能力及进行排序速度和高效率给予补贴,而AlphaDev则必须通过发现一个合理且更快地程序流程来获得手机游戏。图A:选编手机游戏。游戏玩家AlphaDev以系统性能st为键入,并通过选择一条汇编语言指令把它导入到早已产生的算法中进行一次挪动。图B:奖赏测算。在每一次挪动后,产生的...
AlphaDev:用AI创造AI AlphaDev是基于DeepMind之前开发的AlphaZero系统的一个新版本。AlphaZero是一个能够自主学习并掌握各种棋类游戏(如围棋、国际象棋、西洋跳棋等)的人工智能系统,它不需要任何人类指导或先验知识,只需要知道游戏规则和目标。通过不断地与自己对弈并优化自己的策略,AlphaZero能够超越人类和其他人工...
AlphaDev可以采取的行动一共有四种,包括比较不同值、移动数值到另一个位置、或者跳转到程序的不同部分。 在执行完每一步之后,再试图对一组列表进行排序,并根据正确排序的列表中的数值数量获得奖励。 如此这般,这般如此,一直到排完整个列表,或者达到程序长度限制,从头开始一个新的程序。
AlphaDev 发现了新的排序算法,这些算法导致 LLVM libc++ 排序库得到改进:对于较短的序列,排序库的速度提高了 70%,对于超过 25 万个元素的序列,速度提高了约 1.7%。 其中,Google DeepMind 团队更专注于改进三到五个元素的短序列排序算法。这些算法是使用最广泛的算法之一,因为它们通常作为更大排序函数的一部分被多...
这一次,Google DeepMind 的全新强化学习系统 AlphaDev 发现了一种比以往更快的哈希算法,这是计算机科学领域中的一种基本算法,AI 的成果现已被纳入 LLVM 标准 C++ 库 Abseil 并开源。 这个成果有多重要?AlphaDev 的主要作者之一,Google ...
目前,Google DeepMind 正在探索 AlphaDev 在 C++ 等高级语言中直接优化算法的能力,这对于开发人员来说将更加有用。Google DeepMind 在官方博客中写道,“通过优化和推出全球开发人员使用的改进排序和哈希算法,AlphaDev 展示了其具有真实世界影响的泛化和发现新算法的能力。我们将 AlphaDev 视为发展通用人工智能工具的...
目前,Google DeepMind 正在探索 AlphaDev 在 C++ 等高级语言中直接优化算法的能力,这对于开发人员来说将更加有用。 Google DeepMind 在官方博客中写道,“通过优化和推出全球开发人员使用的改进排序和哈希算法,AlphaDev 展示了其具有真实世界影响的泛化和发现新算法的能力。我们将 AlphaDev 视为发展通用人工智能工具的一...