单项选择题

某互联网金融企业希望建立一套小额借贷违约风险识别模型,即识别出哪些贷款可能违约,目前其拥有的历史贷款数据70万条,变量分别为年龄(数值)、职业(分类)、月收入(数值)、是否有房(分类)、贷款利率(数值)、月还款(数值)、历史累计贷款(数值)、历史累计违约次数(数值)、是否违约(分类),其中变量“是否违约”表示这笔贷款最终是否发生违约,是分类变量。那么下列说法错误的是()。

A.“建模之前应该先用描述性统计的方法刻画数据特征”
B.“建模的之前需要考虑正负样本比例”
C.“由于需要对贷款违约的影响因素进行归因,应该使用多元线性回归分析”
D.“这个问题可以用逻辑回归进行分析”