单项选择题
A.随机失活单元,防止过拟合B.代价函数C.动态优化器D.交叉熵函数
A.前馈神经网络B.AttentionC.Self-Attention
A.对于编码器来说无法完全的表示整个序列信息B.对于编码器来说,长序列问题,先输入的有可能被覆盖掉C.对于解码器来说,对于输入的每个单词权重是不一样的D.对于解码器来说,对于输入的每个单词权重是相同的