多项选择题
A.一种用于优化网络训练过程的技术B.从大型神经网络模型中提取知识,用于构建小型模型C.通过在教师模型和学生模型之间进行权重蒸馏来提高网络性能D.通过在模型中添加额外的知识层来提高网络泛化能力
A.Encoder用于将输入序列转换成隐藏表示的模块B.Decoder的输入是Encoder的输出和前面生成的部分输出序列C.Encoder和Decoder的结构和功能完全相同D.Decoder的输出是生成的下一个位置的词
A.卷积层主要负责特征提取,池化层主要负责特征压缩B.卷积层的输出深度会增加,池化层的输出深度会减少C.卷积层通过滑动窗口进行卷积运算,池化层通过下采样操作选择特征D.卷积层用于分类任务,池化层用于检测任务