在此之前,Enzyme等AD工具无法生成GPU内核的梯度。我们的论文提出了一种新技术的组合,使Enzyme成为第一个全自动反向模式AD工具,以生成GPU内核的梯度。由于不同于其他工具,Enzyme在通用编译器中执行自动区分,我们能够引入几个新颖的GPU和特定于ad的优化。为了展示我们方法的通用性和效率,我们计算了5个基于gpu的HPC应用程...