模型的评估与选择
一、训练误差与测试误差
1.1训练误差
1.2测试误差
1.3误差率和准确率
二、过拟合与模型选择
多项式拟合
M=9是过拟合的情况。
2.1过拟合
过拟合(Over-Fitting):学习所得模型包含参数过多,出现对已知数据预测很好,但对未知数据预测很差的现象。
2.2模型选择
2.2.1正则化
其中J(f)为模型复杂度,模型参数越多,复杂度越高。
L1范数选择的是绝对值参数(更适合特征筛选),L2范数选择的是平方求和项(更适合防止过拟合,无法特征筛选)
2.2.2交叉验证
当数据不足的情况下:如何进行模型选择?-----------------交叉验证