单项选择题
A.前馈神经网络B.AttentionC.Self-Attention
A.对于编码器来说无法完全的表示整个序列信息B.对于编码器来说,长序列问题,先输入的有可能被覆盖掉C.对于解码器来说,对于输入的每个单词权重是不一样的D.对于解码器来说,对于输入的每个单词权重是相同的
A.Encoder和Decoder间的Embedding层B.Decoder中Embedding层和FC层权重共享C.没有任何层参数进行了共享D.以上都正确