多项选择题
A.设备要求低B.选择性好C.成本低廉D.易实现自动化连续作业E.可循环利用
A.反向传播算法用于计算梯度,梯度下降算法用于更新参数B.反向传播算法用于更新参数,梯度下降算法用于计算梯度C.两者都用于计算梯度,但梯度下降算法用于更新参数D.两者可以独立运行,互不影响
A.序列到序列模型B.注意力机制C.引入预训练模型D.数据增强