1. 为什么预训练-微调框架会成为18年以后AI系统的标准范式? 2. BERT和GPT系列分别采用了怎样的预训练逻辑,各有何等优劣? 3. 商科研究中我们如何根据自己的需求进行微调? 这周讨论的论文作者(俩MIT Econ PhD学生)敏锐捕捉到了这一轮generative AI hype对知识生产力的影响并高质量的完成execution,发了一篇Science(...