如何在比赛中取得好成绩成为开心的蜡烛:会基本知识掌握学习方法与更多人交流参加天池比赛所需的会基础知识xgb、lgb、catboost、numpy、matplotlib、seaborn、sklearn、keras
参考比赛流程报名参赛((PS )报名提醒、实名认证) )下载数据集并本地或远程培训数据,测试结果。 比赛的基本知识是首先在比赛中创建基本的baseline,然后一步一步地改变模型。
比赛的基本内容如下
问题理解:探索性数据分析:特征工程模型的参与模型融合
探索性数据分析:目的:
EDA的基本方法:绘制方法、量化方法:
绘制方法:(原始图像、统计图、特征模块化相同) ) ) ) ) ) )。
基本图形:
折线图:随时间变化
直方图:数据分布
密集箱型图:概率密度函数
箱型图:容易看到异常值
小提琴图:知道某个值分布的频率(升级版箱型图) )
量化方法:(统计表达:偏方差峰值、取值范围、近似分布) ) )。
相关分析方法:
类变量:名义变量(男女) )。
顺序变量:不仅分类,而且特性的排序(消耗能力1-5 ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) ) )。
定距变量:可比较大小,差有意义
这里提供了mvtest的独立相关性判断方法,可以在github连接上学习和使用,包括: 原则作者将其创建为可以在使用包时调用。
特征工程:
建模参考
模型融合前期不太相似,需要相似评分,差异导致前期不太通用,增强鲁棒性。 模型融合在单模型的基础上,通过融合多个模型来提高结果