多项选择题
A.Encoder和Decoder间的Embedding层B.Decoder中Embedding层和FC层权重共享C.没有任何层参数进行了共享D.以上都正确
A.BERTB.Word2VecC.ELMOD.GPT
A.无实际的意义B.减小表达能力C.降低了泛华能力D.这样可以在不同的空间上进行投影,增加表达能力