基于Stata的国内旅游业影响因素分析 摘 要:本文通过Stata软件建立多元线性模型,选取旅行社个数、城镇居民可支配收入、国内生产总值三个指标为自变量,国内旅游业收入作为因变量,然后再对模型进行多重共线性检验和异方差性检验,得出拟合程度最高的模回归型,并提出相关的建议。 关键词:Stata软件;国内旅游业收入;多元线性模型;异方差性 一、理论模型 出于数据的易获得性考虑,我们选取国内旅游收入作为衡量我国国内旅游业发展的指标,作为被解释变量。国内旅游业的发展受人民生活水平的限制,其中城镇居民在旅游出游人数中占大多数,因此用城镇居民可支配收入作为解释变量;国内生产总值(GDP)是衡量社会经济发展水平的重要指标,它能衡量我国的发展及建设完善程度,这里将国内生产总值作为另一个解释变量,反映大体经济环境的变化;最后,旅行社的多少也对人们出游有重要影响,因此将它作为最后一个解释变量。 二、计量模型设定和样本数据说明 (一)计量模型: 1、为了方便研究,回归模型设为线性的:Y=b0+b1X1+b2X2+b3X3。 2、剔除多重共线性的影响,回归模型为: Y=b0+b1X1+b2X2。 (二)数据说明: X1―旅行社个数;X2―城镇居民可支配收入;X3―国内生产总值;Y―国内旅游收入 数据来源:中国统计年鉴 三、计量分析过程 将数据导Stata中得到Y=405.6516-1.227756X1+2.313784X2-0.005083X3,这里面的解释变量中,旅行社个数、国内生产总值与国内旅游收入呈负相关关系,这与我们的预期是相矛盾的,因此,我们对这些解释变量之间是否存在多重共线性、异方差性进行检验。 (一)检验多重共线 Variable | VIF 1/VIF -------------+---------------------- 国内生产总值 | 618.33 0.001617 城镇居民~入 | 614.18 0.001628 旅行社个数 | 11.62 0.086046 -------------+---------------------- Mean VIF | 414.71 国内生产总值、城镇居民人均可支配收入、旅行社个数的VIF值远远大于10,存在极其严重的多重共线性。 (二)检验异方差性 ------------------------------------------ Source | chi2 df p ---------------------+-------------------- Heteroskedasticity | 7.43 5 0.1908 Skewness | 8.35 2 0.0554 Kurtosis | 0.42 1 0.5184 ---------------------+-------------------- Total | 16.19 8 0.0397 ------------------------------------------ 通过怀特检验,其不存在异方差。 (三)逐步回归,消除多重共线性 [国内旅游收入 Coef. Std. Err. t P>t [95% Conf. Interval] 旅行社个数 -1.230098 .1547525 -7.95 0.000 -1.556598 -.9035989 城镇居~收入 2.191746 .1021161 21.46 0.000 1.9763 2.407192 ] R-squared和调整后的R-squared均达到98%以上,可知其拟合程度是良好的,过程中易得在剔除了城镇居民可支配收入这一解释变量后,国内生产总值与国内旅游收入之间呈现了正相关关系,符合我们的预期,可见当初我们的猜想是正确的。在采用逐步回归时将国内生产总值这一解释变量剔除也是合乎情理的,也可得出城镇居民人均可支配收入对国内旅游收入的影响比国内生产总值大。 最终模型:Y=726.3805-1.230098X1+ 2.191746X2 五、计量结果的经济分析 本文来源:https://www.wddqw.com/doc/dc1640961cb91a37f111f18583d049649a660e1f.html