单项选择题

Transformer中的Q,K,V为什么用不同的权重矩阵生成()

A.无实际的意义
B.减小表达能力
C.降低了泛华能力
D.这样可以在不同的空间上进行投影,增加表达能力