翁荔在2018年加入OpenAI,后来在GPT-4项目中主要参与预训练、强化学习&对齐、模型安全等方面的工作。她曾提出最著名的Agent公式——Agent=大模型+记忆+主动规划+工具使用。翁荔在演讲中表示,人类需要教会AI安全基本原则和道德准则,使其成为人类的伙伴。同时,通过思维链(CoT)推理和扩展性研究来提升AI的可靠性和监...
OpenAI研究副总裁(安全)翁荔(Lilian Weng),现身国内!还首次在国内大型活动场合公开发表AI主题演讲。先简单介绍一下,翁荔是OpenAI华人科学家、ChatGPT的贡献者之一。北大毕业后,翁荔在2018年加入OpenAI,后来在GPT-4项目中主要参与预训练、强化学习&对齐、模型安全等方面的工作。最著名的Agent公式也由她提出,即...
就在刚刚,那个掌管OpenAI安全的北大校友,OpenAI研究副总裁(安全)翁荔,离职了。翁荔是OpenAI华人科学家、ChatGPT的贡献者之一。北大毕业后,翁荔在2018年加入OpenAI,后来在GPT-4项目中主要参与预训练、强化学习和对齐、模型安全等方面的工作。最著名的Agent公式也由她提出,即:Agent=大模型+记忆+主动规划+工具使...
外界印象深刻的是上个月,翁荔回国现身今年Bilibili超级科学晚活动,发表了《AI安全与“培养”之道》演讲,深入浅出地介绍了AI安全问题,在圈内引发轰动。随后没多久,翁荔结束了她在OpenAI长达近7年的职业生涯,宣布离职。她表示,“OpenAI正沿着火箭般的轨迹前进,这是我成长为科学家和领导者的地方,我将永远珍惜...
翁荔在OpenAI工作了近7年,从研究科学家、应用AI研究主管、安全系统主管一路做到研究安全副总裁,她曾经建立和领导OpenAI的应用AI研究团队。加入Thinking Machines Lab后,翁荔也成为少有的在美国明星AI创企中担任联合创始人的。另一位华人Stephen Chen曾在Meta、谷歌任职,专注于数据中心、硬件支持和AI基础设施领域。...
大约一个月前,OpenAI 安全系统团队负责人翁荔(Lilian Weng)在 X 上宣布了从已经工作了近 7 年的 OpenAI 离职的消息。当时,她就曾表示,之后可能有更多时间来写博客。刚刚,翁荔更新了一篇博客,迅速引起了大家的围观学习。这篇博客的主题是关于强化学习中 reward hacking 的。翁荔认为,「当强化学习智能体...
之前领导OpenAI安全团队的北大校友翁荔(Lilian Weng),离职后第一个动作来了。当然是发~博~客。前脚刚发出来,后脚就被大伙儿齐刷刷码住,评论区一堆人排队加待读清单。还有不少OpenAI前同事转发推荐。这次的博客一如既往万字干货,妥妥一篇研究综述,翁荔本人直言写起来不容易。主题围绕强化学习中奖励黑客(...
翁荔,掌管OpenAI安全,北大才女,刚刚宣布离职 她离职后的第一个大动作,引发了全网的热议!瓮荔发了一篇万字博客,分析了强化学习中奖励黑客(Reward Hacking)的问题,即智能体(Agent)利用奖励函数或环境中的漏洞来获取高奖励,而并未真正学习到预期行为。瓮荔在博客中强调了黑客行为在大语言模型的RLHF训练中的...
近日,OpenAI 的华人副总裁翁荔宣布将于11月15日正式离职。翁荔毕业于北京大学,曾是 OpenAI 安全系统团队的负责人,也是 ChatGPT 的重要贡献者之一。她在2018年加入 OpenAI,参与了包括 GPT-4在内的多个重要项目,特别是在模型安全、预训练及强化学习等方面。在她的职业生涯中,翁荔提出了 “Agent = 大模型 +...