excel数据分析案例 excel做正态分布分析( 二 )


既然是预测,肯定会与真实数据有误差 。我们也可以观察到在模型的散点图上,并非所有真实数据全部都在这条模型线上,因为它是根据数据“拟合”的,并不是完全符合 。
所以我们还需要对模型进行检验 。一般来说,检验模型的准确率需要考察这几个数字:
Multiple R(相关系数)相关系数R的值出于-1~1之间,在-1~0的区间中,说明自变量越大,因变量就越小,而在0~1的区间中,则相反 。
当相关系数R小于-0.8或大于0.8的时候,说明自变量与因变量有很强的相关性 。这里的相关系数高达0.983,说明成本与销售额有非常强的相关性 。
R Square(拟合系数)拟合系数=相关系数的平方,它的数值范围为0~1,数值越大,拟合的效果就越好 。一般大于0.7时,可以认为拟合的效果符合预期 。
这里的拟合系数为0.96,非常接近1,说明模型的拟合效果很不错 。
Significance F(显著性检验)显著性检验是指检验自变量和因变量的线性关系是否明显,它的数值越小,说明真实数据离这条线越近,也就是模型越准确 。
这里的1.25E-08的意思是1.25× 10的-8次方(即0.00000001),几乎接近于0,也就是说这个模型是比较准确的 。
P-value(P值)P值是用来检测系数(即aX中的a)的显著程度 。P值同样也是越小越好,一般来说,P值小于0.05时,这个模型才有统计学意义 。
这里的P值为2.4E-09,也是无限接近于0,说明这个模型的可信度比较高 。
6.预测
检验完回归模型后,如果各数值都比较正常,那么就可以根据最终确定的模型进行预测了 。
在上面的案例中,最终确定的模型为:Y=0.852X+5690.875(这里取小数点后3位) 。
按照老板的收入预期,也就是15,000=0.852X+5690.875,最后可以算出X为8320.569,也就是说,如果要达到老板的预期收入,推广渠道的成本最少应该为8320.569元 。


以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: