单项选择题

每个Transformer编码器中的第一层是()

A.前馈神经网络
B.Attention
C.Self-Attention

<上一题 目录 下一题>
热门 试题

多项选择题
编解码模型有哪些弊端()

A.对于编码器来说无法完全的表示整个序列信息
B.对于编码器来说,长序列问题,先输入的有可能被覆盖掉
C.对于解码器来说,对于输入的每个单词权重是不一样的
D.对于解码器来说,对于输入的每个单词权重是相同的

多项选择题
Transformer如何体现出的参数共享()

A.Encoder和Decoder间的Embedding层
B.Decoder中Embedding层和FC层权重共享
C.没有任何层参数进行了共享
D.以上都正确

相关试题
  • NLP中做多分类任务可以使用()激活函数。
  • 相比机器学习,深度学习在处理数据的时,在...
  • 自然语言处理(NLP)中为什么要进行文本表...
  • NLP中常用的语言模型是为了求得什么()
  • 深度学习模型在训练的时候需要达到哪些基本...