1.1 在NLP日常工作中,我们需要按几个步骤进行数据处理和模型训练。 1. 先收集数据: 通过爬虫或者其它工具,将数据结构化保存到数据库中。 2. 数据预处理: 其中大部分都是无标签数据,对于无标签数据的可以用无监督做预训练模型,也可以用经过整理后进行标注变成有标签数据。 3. 数据标注: 对于NLP的标注,我们常用的...