单项选择题

在Transformer模型中,前馈神经网络的主要作用是什么?()

A.捕捉序列的位置信息
B.学习非线性关系
C.进行序列的降维
D.进行序列的上采样

<上一题 目录 下一题>
热门 试题

单项选择题
在自注意力机制中,为什么要对相似度进行缩放?()

A.减少计算复杂度
B.避免梯度消失或梯度爆炸
C.增加模型的深度
D.减少模型的参数

单项选择题
自注意力机制在处理输入序列时,主要通过什么来衡量各位置之间的相关性?()

A.卷积操作
B.点积操作
C.池化操作
D.激活函数

相关试题
  • 发展新质生产力的改革重点包括()
  • 在加快现代化产业体系建设的过程中,发展的...
  • 黄河干流河道全长约()。
  • 关于内蒙古面临的产业结构问题,下列表述错...
  • 下列选项中,关于黄河流域区域高质量发展的...