微信号 ZZDataAnalyst
功能介绍 别急,时间和数据会给你答案。
综上所述,对于小样本数据集,一般先用朴素贝叶斯提供一个基准,如果效果已经达到满足程度即可,不满足建议直接使用SVM,因为它性能超棒,计算资源也允许;随着样本量增加,可使用逻辑回归作为基准,效果不满意时,顺序尝试决策树,SVM和基于树的集成方法;对于大样本,需要执行并行任务或者在线更新模型时,建议以逻辑回归作为基准,然后这时基于树的集成模型(例如随机森林)可发挥更好的效果。
微信扫一扫关注该公众号