多项选择题
A.反向传播算法用于计算梯度,梯度下降算法用于更新参数B.反向传播算法用于更新参数,梯度下降算法用于计算梯度C.两者都用于计算梯度,但梯度下降算法用于更新参数D.两者可以独立运行,互不影响
A.序列到序列模型B.注意力机制C.引入预训练模型D.数据增强
A.名称B.位置C.属性D.内容