目录一、线性回归练习1.Excel对亲子数据集进行线性回归2 .对母女数据集进行线性回归3 .多元线性方程二、四重奏数据集的线性回归
一、线性回归练习1. excel对亲子数据集进行线性回归
1 )导入数据集后,删除重复值(父子数据集的重复值),同时删除女儿的数据
2 )“数据”“数据分析”
3 )选择“回归”
4 )选择x、y值域,勾选线性匹配图
5 )右键单击“添加趋势线”
6 )选中要显示的数据线格式和数据
7 )分析数据
Multiple=0.36是相关系数。 P-value为p值,为0.01P0.005,因此回归公式成立。 从图中可以看出,父亲身高75英寸时,孩子的身高为68.09英寸。
2 .对母女数据集进行线性回归1 )删除母女数据重复值,也删除儿子数据,得到线性回归图。
Multiple=0.309是相关系数。 P-value为p值,为0.01P0.005,因此回归公式成立。 从以上数据来看,“父亲mldzxc高,父亲低子女低”和“母亲高一个”的表达是不正确的。 3 .多元线性方程利用多元线性回归计算父亲、母亲和孩子身高的回归方程。
基本步骤相同,但与进行数据分析时选择x值区域不同,选择母亲和父亲的数据集。
回归直线图:
根据数据,该多元线性方程由y=22.68108 0.36787x1 0.295934x2 )、四叉数据集线性回归1. 第一组数据做线性回归分析
如图所示,线性不能表示原始数据的一个变化趋势,因此该线性回归方程不成立。 用其他回归曲线测试表明,六次多项式的回归方程比线性回归方程更好地体现出数据的变化趋势。
2. 第二组数据做线性回归
如图所示,线性无法表达原始数据的变化趋势,因此该线性回归方程不成立。 用其他回归曲线测试表明,二阶多项式的回归方程比线性回归方程更能体现数据的变化趋势。3. 第三组数据做线性回归
可见,线性基本能表达原始数据的一个变化趋势,只存在一个极端数据,线性回归方程基本成立。4. 第四组数据做线性回归方程
如图所示,线性不能表示原始数据的变化趋势,因此该线性回归方程不成立。 数据基本上不能用线性描述,但分析了数据的自变量和变量交换位置,发现可以用二次多项式的回归方程表示原始数据。
5. 小结
四组数据线性回归的分析结果表明,r值、p值并不能充分说明回归方程能否很好地表征原始数据的变化趋势。 对于四组不同的数据集,可以获得相同的r值和p值,但并不是每个都可以用此回归方程来解释。