4.3 本章小结

本章讲述了机器学习项目各流程节点:数据分析、数据清洗、特征工程、模型训练、模型验证,并在此基础上,从项目角度将流程进行了横向和纵向的延伸。同时,强调了机器学习工程实践的属性。

4.1节介绍了机器学习的项目流程11小项和相关实现,如取样的脚本等。

4.2节介绍了机器学习算法的8个核心概念,并做了概念的对比讲解,如损失函数和正则化、欠拟合和过拟合和偏差和方差,提到了交叉验证是模型公平评估的统计方法。数据泄露防不胜防,初学者可能一直在错误地建模,甚至一直未发现,我们需要保持审慎和谦卑之心。

总之,在实践中,成功的机器学习项目需要大量的“黑色艺术”和软件工程方法。