多项选择题

Transformer如何体现出的参数共享()

A.Encoder和Decoder间的Embedding层
B.Decoder中Embedding层和FC层权重共享
C.没有任何层参数进行了共享
D.以上都正确

<上一题 目录 下一题>
热门 试题

单项选择题
以下哪个模型使用了双向的Transformer作为特征提取()

A.BERT
B.Word2Vec
C.ELMO
D.GPT

单项选择题
Transformer中的Q,K,V为什么用不同的权重矩阵生成()

A.无实际的意义
B.减小表达能力
C.降低了泛华能力
D.这样可以在不同的空间上进行投影,增加表达能力

相关试题
  • NLP中做多分类任务可以使用()激活函数。
  • 相比机器学习,深度学习在处理数据的时,在...
  • 自然语言处理(NLP)中为什么要进行文本表...
  • NLP中常用的语言模型是为了求得什么()
  • 深度学习模型在训练的时候需要达到哪些基本...