首页 > 编程知识 正文

excel回归函数(广东省文学会青果奖)

时间:2023-05-06 00:59:35 阅读:105529 作者:888

一、什么是回归分析?

回归分析是一种分析“注意变量”和“因变量”并阐明它们之间关系的统计方法。这时,我们把因素变量称为“解释变量”,把注意变量称为“目标变量地址(解释变量)”。

在了解了回归分析的目的之后,让我们通过回归分析预测方法的步骤来解释什么是回归分析:

1.根据预测目标,确定自变量和因变量的具体目标,再确定因变量。如果预测目标是下一年的销量,那么销量Y就是因变量。通过市场调研和查阅数据,找出与预测目标相关的相关影响因素,即自变量,并从中选取主要影响因素。

2.建立回归预测模型根据自变量和因变量的历史统计数据进行计算,然后建立回归分析方程,即回归分析预测模型。

3.进行相关分析什么是回归分析?回归分析是对具有因果关系的影响因素(自变量)和预测对象(因变量)的数理统计分析。只有当变量和因变量之间存在一定的关系时,建立的回归方程才有意义。因此,作为自变量的因素是否与作为因变量的预测对象相关,相关程度,判断相关程度的确定性成为回归分析必须解决的问题。对于相关性分析,一般要求相关性,通过相关系数的大小来判断自变量和因变量的相关程度。

4.检验回归预测模型并计算预测误差回归预测模型能否用于实际预测取决于回归预测模型的检验和预测误差的计算。只有回归方程通过各种检验,预测误差小,才能作为预测模型进行预测。

5.计算并确定预测值。利用回归预测模型计算预测值,综合分析预测值确定最终预测值。

二、回归分析的目的

回归分析的目的大致可以分为两种:

第一,“预测”。

预测目标变量,求解目标变量Y与解释变量(x1,x2,).

Y=a0 b1x1 b2x2 … bkxk误差(公式A)

方程A称为(多元)回归方程或(多元)回归模型。是a0 y截距,b1,b2,…,bk是回归系数。当k=l时,只有一个解释变量,称为单变量回归方程。根据最小二乘法,求解最小误差的平方和,而不是Y截距和回归系数。如果求解回归方程,分别代入x1、x2、…xk的值,预测y的值。

第二,“因素分析”。

因子分析是根据回归分析的结果,得到各个自变量对目标变量的影响。因此,有必要找出各个自变量的影响程度。

希望初学者在阅读下一篇文章之前,先学习一元回归分析、相关分析、多元回归分析和数量理论I的知识。

根据最小二乘法,用Excel求解y=a bx中的A和B。那么什么是最小二乘法呢?

从散点图的每个数据标记点画一条平行于Y轴的平行线,并与图中的直线相交(如下所示)

平行线的长度在统计学上称为“误差”或“残差”。误差(残差)是指分析结果的计算值与实际值之间的差值。

然后,求平行线长度的平方值。平方值可视为边长等于平行线长度的平方面积(如下图所示)。

最后求所有平方面积的和。确定使面积之和最小的A(截距)和B(回归系数)的值(如下图所示)。

用Excel求解回归方程;“工具”“数据分析”“回归”,具体操作步骤将在后面的文章中说明。

三.回归分析案例

F

这14个因素(解释变量)中,对价格影响最大的因素(客观变量)是什么?什么对价格影响最大?定量计算影响程度,再根据多因素(解释变量)预测二手车价格(目标变量)。

可以用公式2表示。二手车价格是目标变量数据,即(AC WC)、电视导航与否、行驶距离等。车辆检验的剩余有效月数(“分数”)。

混合模型

混合阶段模型是指因子毛巾包含定性数据和定量数据的模型。在混合频道模型中,“空调”和“电视导航”等定性因素称为项目,数据组(“空调的AC”和“WAC”以及电视导航的“是”和“否”)称为类别。

接下来,根据表1进行回归分析

在这一节,我们主要告诉大家,回归分析之前,需要根据自己的思维去理解分析,先分析这些需要注意的事情,这样才能帮助我们接下来回归。

分析有很大的帮助。

四、Excel回归分析需要注意的事项

经过上节,我们了解了回归分析前,我们要先通过思维分析出来需要注意的事项,那么今天接着上一节的课来了解下Excel回归分析需要注意的事项。包含的定性数据,不能直接使用Excel分析,需要将其转换成虚拟变量(也叫O,1数据)。例如, “空调(AC、WAC)”的数据,“AC”用“1”,“WAC"用“O”表示。同样地,“导航(有导航、无导航)”的数据, “有导航”用“1”, “无导航”用“O”表示。表1是根据这种方法转换的(0,1)数据表。

直接使用Excel的对表1进行回归分析时,运算结果不理想。理由如下;

表1

以“导航”为例,各行

“有导航”+“无导航”=1

此式成立。把公式变形,

“有导航”=1-“无导航”

所以“有导航”是“0”或是“1”,由“无导航。自动决定。

线性代数中发生秩(矩阵秩)亏时,不能正确求出必要的逆矩阵。因此也不能求出回归系数。

由于上述原因,进行回归分析时,需要从各个项目中删除—列因子(表2)。

表2

根据表2的数据进行回归分析,操作步骤如下:

1、“工具”一“数据分析”

2、在弹出的“数据分析”对话框中选择“回归”,单击“确定”(图1)。

图13、点击“回归”对话框的“Y值输入区域”,选择“二手车价格”的列数据,包括项目名称;接着点击“X值输入区域”,选择从“AC”到“中国、四国、九州”的区域,包括项目名称;选中。标志”,单击“确定”。(图2)

图2系统弹出错误信息,不能进行回归分析(图3)。这是因为Excel回归自由度的最大上限是16(P62小知识)。这里的回归自由度是22,因此不能进行回归分析。

图3

统计学中经常出现“自由度”,即有效信息的数量。

前面已经提到,在Excel的回归分析中,回归自由度的最大上限是16。回归自由度在(多重)回归分析、数量化理论|、混合模型中具有不同意义。表3是对回归自由度的不同意义的总结。

表3

五、分两次进行回归分析

我们在前面提到过,当回归自由度在17以上时,Excel无法进行回归分析,那么就需要分两次进行回归分析。第一次,把“空调”、“TV导航”、“导航”、“SR”、“天窗”、“空气囊”、“LD”、“TV”、“AW”作为说明变量(表1),第二次,把“颜色”、“拍卖会地点”、“行驶距离”、“车检剩余有效月数”、“评分”作为说明变量(表2),目标变量都是“二手车价格”。

表1

表2对表1、表2进行回归分析。回归分析的结果分别如表3、表4所示(具体操作步骤将在下一节详细说明)。

表3

表4

内容来源:Excel学习网

【灯塔大数据】微信公众号介绍:中国电信北京研究院通过大数据技术创新,自主研发了业内领先的“灯塔”大数据行业应用创新平台,灯塔面向市场研究、广告营销、商业地理、金融征信、人力资源等诸多行业领域,提供零售研究、消费者研究、店铺选址、精准营销、泛义征信,背景调查等服务,助力企业在大数据时代扬帆远航。

微信公众号【灯塔大数据】关键字回复信息:

回复【云计算产业趋势分析】 下载分析报告PPT

回复【高峰论坛】 根据编号下载高峰论坛PPT资料

回复【主论坛】 查看《中国电信灯塔大数据高峰论坛》视频回放

回复【技术论坛】 收看技术分论坛视频回放

回复【推荐系统】 下载程序代码

回复【 灯塔 】 查看更多关键字回复下载

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。