多项选择题
A.删除包含缺失值的样本B.用均值、中位数或众数填充缺失值C.使用插值方法估计缺失值D.用特定值标记缺失值
A.一种用于优化网络训练过程的技术B.从大型神经网络模型中提取知识,用于构建小型模型C.通过在教师模型和学生模型之间进行权重蒸馏来提高网络性能D.通过在模型中添加额外的知识层来提高网络泛化能力
A.Encoder用于将输入序列转换成隐藏表示的模块B.Decoder的输入是Encoder的输出和前面生成的部分输出序列C.Encoder和Decoder的结构和功能完全相同D.Decoder的输出是生成的下一个位置的词