Safe-RLHF 不仅提供高质量代码库,还额外公开了 RLHF 所需的多轮数据,旨在帮助高校和企业充分研究 RLHF 技术。此外,Safe-RLHF 将安全强化学习(Safe RL)技术引入 RLHF 训练中,为大型模型的训练和对齐提供了新的研究范式。 Safe RLHF vs. RLAIF...