BERT(Bidirectional Encoder Representations from Transformers)是一种基于Transformer架构的自然语言处理(NLP)模型。它的输入形式是一组文本序列,其中包含一个特殊的[CLS]标记作为序列的开头,以及一个[SEP]标记作为序列的分隔符。对于每个文本序列,BERT还会在序列的开头添加一个特殊的标记,用于表示该序列是一个句子的第一...