3.4.4 集成树

集成树(Ensemble Tree)是树类模型集成算法的统称,例如Random Forest、AdaBoost、GBDT以及大名鼎鼎的XGBoost都属于集成树的范畴。顾名思义,集成树将决策树作为基学习器,利用集成学习的思想,以不同的方式叠加而形成。集成树既具有决策树本身解释性好的优点,又具有集成学习带来的准确性和区分度的提升,一些特殊的框架例如XGBoost,由于加入了正则化项,还保证了模型的稳定性。集成树算法相比于神经网络算法,对于数据量和数据维度的要求并不算高,通常数据量满足5万、数据维度大于100,就可以尝试建模,因此被各大互联网机构应用于申请评分模型、行为评分模型、催收评分模型、价值模型的搭建工作中,是目前建模人员首选的机器学习算法。