IBM 等提出 SELF-ALIGN(自对齐),结合原则驱动式推理和 LLM 生成能力,大大降低人类监督工作量,并将 SELF-ALIGN 过程应用于基础语言模型 LLaMA-65b 训练得到 Dromedary(单峰骆驼),在 TruthfulQA 数据集上甚至取得超越 GPT-4 的成绩。当前项目发布模型权重和使用的人工注释,并提供了聊天机器人 demo 以及完整的训练过...