多项选择题
A.删除缺失值B.用均值填充C.用众数填充D.数据标准化
A.过学习是指训练误差比较小,而测试误差大得多的情况B.模型过于复杂,参数过多;数据集相对于模型复杂度太小C.搜集大量的训练样本;用一部分样本构造验证集;可以降低过学习D.引入正则项惩罚模型复杂度,可以降低过学习
A.对所有所有样本进行中心化B.计算样本的协方差矩阵C.对协方差矩阵做特征值分解D.选出最大的d个特征值所对应的特征向量