Pooling(池化法):截断法最大的问题在于需要丢掉一部分文本信息,如果我们能够保留文本中的所有信息,想办法让模型能够接收文本中的全部信息,这样就能避免文本丢失带来的影响。本文也将重点针对这种方法的实现进行介绍。 RNN(循环法):BERT之所以会有最大长度的限制,是因为其在进行MLM预训练的时候就规定了最大的输入长度,...