因为随机数种子42最近在研究决策树的时候遇到了很多疑问,所以今天是随机数种子42
简述决策树练习基于sklearn库的决策树实战训练。
1、选择了sklearn库附带的乳腺癌数据集
2、train_test_split )来划分数据集,分为训练集和测试集;
3、对测试集标签进行格式处理;
4、标准化处理数据
5、构建决策树
6、将训练好的决策树模型应用于测试集中,并比较结果。
random_state=42分割数据集时,train_test_split ()函数有一个名为random_state的参数。
random_state(随机状态) :随机数种子——其实是该随机数组的号码,如果需要重复该实验,可以确保获得相同的随机数组。 例如每次为1,其他参数相同的情况下,得到的随机序列相同。 如果为None,则生成的随机数组也是随机的。
为什么很多人在使用random_state时习惯将其设置为42呢?
random_state=42感到疑惑,有什么别的意思吗?
theanswertouniverseandeverything“42”查阅了随机树种子的资料,得知“42”并不像想象的那么简单,而是充满了传说。 “42”不仅仅是程序,42竟然与宇宙万物的答案相关联。
42是乐观的哆啦A梦写的小说《银河系漫游指南》的“生命、宇宙,以及一切事情的终极答案”的答案。 在故事中,具有高度智能的跨界生物种族为了找到能够回答终极问题的简单答案,专门制作了超级计算机——“深思”(Deep Thought )进行计算。 “深思”花了750万年进行计算和验证,得到了“42”的答案。 当被要求提供所谓的终极问题时,他说没办法“深思熟虑”,但可以设计更强大的计算机,也就是地球这个生物计算机来做这项工作。 于是,问这些问题的人种为了让这台超级生物计算机运行程序以找到终极问题,等了很久。 历经800万年,在结果出来前5分钟,地球被挡在了拟建的星际高速公路的路线上,被渥罡人毁灭,电脑没有给出最后的结果。
42因此,在科学家、程序员、极客之间成为“梗塞”传播开来。