openai由此得到了real通用的embedding模型,可以同时做sentence embedding任务(相似度、可视化、分类等)+text search任务,且效果大多好过当时的SOTA。 几点感想: 1. 通用模型是scale出来的,scale意味着海量的算力和数据; 2. 足够scale时,算法的设计可以很简单,即所谓“大力出奇迹”,但简单的背后是大量的实验支撑(超大的...