单项选择题
特征提取器Transformer为什么使用多头机制()
A.增加模型的复杂度
B.增加模型的运行时间
C.保证了Transformer可以注意到不同的子空间,捕捉更丰富的信息
D.无实际性的意义
点击查看答案
<上一题
目录
下一题>
热门
试题
判断题
BERT和ELMO使用的都是是单向的Transformer。
点击查看答案
判断题
在迭代次数够多的情况下Glove会比Word2Vec效果好。
点击查看答案
相关试题
NLP中做多分类任务可以使用()激活函数。
相比机器学习,深度学习在处理数据的时,在...
自然语言处理(NLP)中为什么要进行文本表...
NLP中常用的语言模型是为了求得什么()
深度学习模型在训练的时候需要达到哪些基本...