判断题 RLHF的全称是Reinforcement Learning from Historical Feedback。答案: 错误 点击查看答案解析 在线练习 手机看题 你可能感兴趣的试题 判断题 在大模型预训练过程中,书籍、论文等数据的数据质量较高,领域相关性强,知识覆盖率大。 答案: 正确 点击查看答案解析 手机看题 判断题 BERT模型的输入可以是单一...