多项选择题
A.可以进行有监督学习,也可以无监督学习B.引入了分层的softmaxC.结构与CBOW类似D.缺点是没有引入N-Gram
A.可以大大降低计算量B.可以加快模型的训练时间C.保证模型的训练效果D.通过部分词,来更新权重
A.GPT是单向的模型B.BERT和ELMO是双向的模型C.BERT会将输入遮蔽D.都无法解决一词多意问题