多项选择题
A.冻结部分层B.使用更大的学习率C.增加训练轮数D.使用更复杂的优化器
A.目标任务的数据量B.原始模型的训练数据C.数据的质量D.数据的多样性
A.交叉熵损失B.均方误差损失C.铰链损失D.对数损失