快搜汉语词典

首页 > bert模型attention_mask

bert模型attention_mask

2025-01-12 21:31:56

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

...bert基于attention建立了双向语言模型,gpt倒是觉得双向不重要...

transformer是基于attention的seq2seq模型,打的是基于rnn的seq2seq,没考虑太多输入词和输出词的扩展性、也就是多任务适配能力; 结果受到bilstm和elmo启发,bert基于attention建立了双向语言模型,gpt倒是觉得双向不重要直接用了单向; bert是mask了输出词,gpt是受到m ...

缩写

今日热搜

上海网友集中晒蘑菇

近反义词

相关词语

相关搜索

© 快搜词典

网上黑客追款大户黑客追款正规黑客业务