R语言与多元线性回归 R语言与多元线性回归分析计算案例
一天_pika 人气:2计算实例
例 6.9 某大型牙膏制造企业为了更好地拓展产品市场,有效地管理库存,公司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量与销售价格,广告投入等之间的关系,从而预测出在不同价格和广告费用下销售量。为此,销售部门的研究人员收集了过去30个销售周期(每个销售周期为4周)公司生产的牙膏的销售量、销售价格、投入的广告费用,以及周期其他厂家生产同类牙膏的市场平均销售价格,如表6.4所示。
试根据这些数据建立一个数学模型,分析牙膏销售量与其他因素的关系,为制订价格策略和广告投入策略提供数量依据。
分析
由于牙膏是生活的必需品,对于大多数顾客来说,在购买同类牙膏时,更多的会关心不同品牌之间的价格差,而不是它们的价格本身。因此,在研究各个因素对销售量的影响时,用价格差代替公司销售价格和其他厂家平均价格更为合适。
模型的建立与求解
记牙膏销售量为Y,价格差为X1,公司的广告费为X2,假设基本模型为线性模型:
输入数据,调用R软件中的lm()函数求解,并用summary()显示计算结果(程序名:exam0609.R)
计算结果通过线性回归系数检验和回归方程检验,由此得到销售量与价格差与广告费之间的关系为:
模型的进一步分析
为进一步分析回归模型,我们画出y与x1和y与x2散点图。从散点图上可以看出,对于y与x1,用直线拟合较好。而对于y与x2,则用二次曲线拟合较好,如下图:
绘制x1与y的散点图和回归直线
绘制x2与y的散点图和回归曲线
其中 I(X2^2),表示模型中X2的平方项,及X22,从上图中,将销售量模型改为:
似乎更合理,我们做相应的回归分析:
此时,我们发现,模型残差的标准差Residual standard error有所下降,相关系数的平方Multiple R-squared有所上升,这说明模型修正的是合理的。但同时也出现了一个问题,就是对于β2的P-值>0.05。为进一步分析,做β的区间估计。
如上错误出现????!!!!直接引用结果如下:
β2的区间估计为[ –7.49886317, 0.1076898 ],它包含了0,也就是说,β2的值可能为0. 因此,去掉X2的一次项,在进行分析:
此模型虽然通过了F检验和T检验,但与上一模型对比来看,Residual standard error上升,Multiple R-squared下降。这又是此模型的不足之处。
在做进一步的修正,考虑X1和X2交互作用,及模型为:
模型通过T检验和F检验,并且Residual standard error减少,Multiple R-squared增加。因此,最终模型选为:
到此这篇关于R语言与多元线性回归分析计算案例的文章就介绍到这了,更多相关R语言与多元线性回归内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!
加载全部内容