随机森林模型中是不是树越多越好小蛋子2019-10-17Random Forest次随机森林中树越多越好?关于头图随机森林中树越多越好?面试时被问到在随机森林的树是否数量越多越好?开始只考虑构建更多的树一来浪费资源,二来数量一定后模型的性能基本保持稳定,随着树的增加提升非常小。回来后又想了想,随机森林中通过引入随机抽样和随机抽列,使模型对异常点有更好的鲁棒性,模型的泛化能力更强。如果是无限颗树,那其实会抵消随机性的引入,最后的模型会是一个过拟合的模型,其泛化性能也会降低。此外,噪音较大时,模型也会学习到更多噪音相关的信息,发生过拟合,降低泛化性能。关于头图摄于玉渊潭公园Bagging为什么能降低过拟合Glove模型