判断题
A.BERT中使用了Transformer加入了Attention机制B.在语义层面上提取到了更好的信息C.不会出现梯度消失的情况D.以上都正确
A.GloveB.word2vecC.LDAD.词袋