单项选择题
A.没有任何问题B.造成梯度消失和梯度爆炸C.特征提取效果好
A.将Attention机制发挥到了机制,完全摒弃了CNN/RNNB.更加深层的使用了RNN系列的模型C.使用了LSTM作为了特征提取D.模型中的encoder层和decoder层的结构完全一样
A.将decoder端的信息压缩到了一个固定向量中B.将encoder端的信息压缩到了一个固定的向量中C.没有用到神经网络D.没有任何缺点