APP推广合作
联系“鸟哥笔记小乔”
用Excel做回归分析
2021-07-28

Excel数据分析工具库是个很强大的工具,可以满足基本的统计分析,这里介绍用Excel数据分析工具库中的回归做回归分析。


本节知识点:


Excel数据分析工具库—回归


线性回归和非线性回归


简单线性回归和多重线性回归


逻辑斯蒂回归

一、什么是回归分析(Regression)

1、定义

确定两种或两种以上变量间相关关系的一种统计分析方法。通过数据间相关性分析的研究,进一步建立自变量(i=1,2,3,…)与因变量Y之间的回归函数关系,即回归分析模型,从而预测数据的发展趋势。

2、分类

按照涉及的变量的多少,分为一元回归和多元回归分析;


按照因变量的多少,可分为简单回归分析和多重回归分析;


按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。

二、线性回归

1、简单线性回归

简单线性回归又叫一元线性回归,即回归模型中只有一个自变量和一个因变量,其回归方程可以表示为:

Y=a+bx+鸟哥笔记,数据运营,虾壳可乐,策略,Excel,数据分析,线性回归,策略,数据分析


其中,Y表示因变量,x表示自变量,a是 常数,b是斜率,鸟哥笔记,数据运营,虾壳可乐,策略,Excel,数据分析,线性回归,策略,数据分析是随机误差。

2、最小二乘法:

如何确定参数a和b,则要用最小二乘法来实现。通过最小化误差的平方和寻找数据的最佳函数匹配,即使得观测点和估计点的距离的平方和最小。

 

3、线性回归分析的步骤:


确定自变量和因变量


绘制散点图,确定回归模型类型


估计模型参数,建立回归模型:最小二乘法进行模型参数估计


对回归模型进行检验


利用回归模型进行预测

4、多重线性回归

定义:一个因变量与多个自变量的线性回归问题,是一元线性回归的推广。其回归方程可以写为:


鸟哥笔记,数据运营,虾壳可乐,策略,Excel,数据分析,线性回归,策略,数据分析

 

多重线性回归方程中回归系数的估计也是用到最小二乘法

三、用Excel做回归分析

我们研究销售额Y和推广费用X1之间的关系,数据如下:


鸟哥笔记,数据运营,虾壳可乐,策略,Excel,数据分析,线性回归,策略,数据分析


首先我们用数据分析—相关系数分析计算一下自变量和因变量之间的相关系数为0.95157,为强相关。


鸟哥笔记,数据运营,虾壳可乐,策略,Excel,数据分析,线性回归,策略,数据分析


绘制散点图如下:


鸟哥笔记,数据运营,虾壳可乐,策略,Excel,数据分析,线性回归,策略,数据分析


然后,我们用数据分析库里的回归来做分析


鸟哥笔记,数据运营,虾壳可乐,策略,Excel,数据分析,线性回归,策略,数据分析


注意Y值和X值输入区域,X值是自变量,Y是因变量。


鸟哥笔记,数据运营,虾壳可乐,策略,Excel,数据分析,线性回归,策略,数据分析

四、线性回归方程的检验

评价回归拟合程度好坏(重要):


鸟哥笔记,数据运营,虾壳可乐,策略,Excel,数据分析,线性回归,策略,数据分析


1、先看回归统计表,Multiple R即相关系数R的值,和我们之前做相关分析得到的值一样,大于0.8表示强正相关。


2、回归统计表中的R Square是R平方值,R平方即R的平方,又可以叫判定系数、拟合优度,取值范围是[0,1],R平方值越大,表示模型拟合的越好。一般大于70%就算拟合的不错,60%以下的就需要修正模型了。这个案例里R平方0.9054,相当不错。


3、Adjusted R是调整后的R方,这个值是用来修正因自变量个数增加而导致模型拟合效果过高的情况,多用于衡量多重线性回归。


4、第二张表,方差分析表,df是自由度,SS是平方和,MS是均方,F是F统计量,Significance F是回归方程总体的显著性检验,其中我们主要关注F检验的结果,即Significance F值,F检验主要是检验因变量与自变量之间的线性关系是否显著,用线性模型来描述他们之间的关系是否恰当,越小越显著。这个案例里F值很小,说明因变量与自变量之间显著。


5、残差是实际值与预测值之间的差,残差图用于回归诊断,回归模型在理想条件下的残差图是服从正态分布的。


6、第三张表我们重点关注P-value,也就是P值,用来检验回归方程系数的显著性,又叫T检验,T检验看P值,是在显著性水平α(常用取值0.01或0.05)下F的临界值,一般以此来衡量检验结果是否具有显著性,如果P值>0.05,则结果不具有显著的统计学意义,如果0.01<P值<0.05,则结果具有显著的统计学意义,如果P<=0.01,则结果具有极其显著的统计学意义。T检验是看某一个自变量对于因变量的线性显著性,如果该自变量不显著,则可以从模型中剔除。


7、从第三张表的第一列我们可以得到这个回归模型的方程:y=4361.486+1.198017x,此后对于每一个输入的自变量x,都可以根据这个回归方程来预测出因变量Y。

 

这里简单总结了一下什么是回归分析,如何用excel做线性回归分析,以及如何评价回归方程拟合程度的好坏。入门很简单,精通还很遥远,我们都在学习中。

-END-

虾壳可乐
分享到朋友圈
收藏
收藏
评分
评论

综合评分:

我的评分

参与评论(0)

评论规则

暂无评论,快来抢沙发吧~
登录后参与评论
发布评论

鸟哥笔记限定畅饮吸管杯600ml
超大容量,让你爱上喝水
2000羽毛
立即兑换
鸟哥笔记灵感酷黑笔记本
既是笔记本,又是营销知识手册。
1500羽毛
立即兑换
【新品】办公/外出两用静音充电小电扇
办公桌必备小电扇!
2000羽毛
立即兑换
虾壳可乐
虾壳可乐
分享数据分析的干货。
确认要消耗 0羽毛购买
用Excel做回归分析吗?
考虑一下
很遗憾,羽毛不足
我知道了

为了促进广大用户对鸟哥笔记网站的干货文章做出更加客观、真实、优质的评论,为其他读者在学习干货时提供参考,特地制定本评论规则。

一、什么样的评论内容会被通过

15字以上的、基于文章内容的优质评论。

二、什么样的评论内容不会被通过

1、15字以下的评论;
2、“已阅”,“1”,“11”,”666”,“学习”,“学习了”等明显划水的内容;
3、重复评论,即在多篇文章下面发布同样的内容;
4、带广告性质的内容(含网址、电话、微信等);
5、评论内容与本文无关的;
6、带诋毁,辱骂,色情,赌博、暴力等不符合社会主义核心价值观的内容,及一切法律法规不允许的内容。

最后,你的评论在审核通过的同时,还可以获得5羽毛的奖励,羽毛可在 "羽毛精选" 兑换各类小礼品哦~

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接