基于主成分聚类分析的河北省经济发展水平分析
王智红 河北大学研究生学院
摘要:本文以河北省11个市为研究对象,选取人均GDP、固定资产投资,财政收入等9个经济指标,运用主成分和聚类方法对河北省各市的经济发展水平进行研究,提取影响经济发展的几大因素,并对11个城市进行聚类分析,寻找区域差异。针对研究结果,提出相应建议。
关键词:主成分;聚类;差异
一、引言
河北省位于渤海地区的中心地带,形成了独特的环京津、环渤海经济圈,在十一五计划中河北省9 个城市划入京津冀都市圈,并且环渤海地区正在成为中国改革开放程度最高、经济发展最快的地区之一。随着市场经济体系的逐步建立,京津冀地区的经济融合程度和相互开放程度有了较大的提高。本文采用一些经济指标对河北省的十一个城市进行聚类分析,对比各城市之间发展的相似性和差异性。常用的分类方法主要为判别分析和聚类分析,聚类分析主要分为K-means 聚类和分层聚类,分层聚类中以系统聚类最为常见。本文采用系统聚类分析方法,对河北省11 个城市进行聚类分析,寻找发展差异,为河北省经济发展提供建议。
二、实证分析
1.指标选取
通过查阅资料,基于不同的视角,考虑到指标的全面性,代表性和可操作性,选取了河北省人均GDP,固定资产投资额,就业人员工资总额,财政收入,粮食生产量,社会零售总额,农林牧副渔生产值,单位GDP 能耗,外商投资总额九个指标。数据来源于河北经济统计年鉴——2012。
2.理论基础
主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。通常把转化生成的综合指标称为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分间互不相关,这就使得主成分比原始变量具有某些更优越的性能。聚类分析是根据多个观测指标,具体找出一些能够度量这些指标的统计量,以这些统计量为依据,把相似度较大的指标聚成一类。主成分聚类分析是运用多指标进行综合评价时,如果第一主成分方差贡献率不够大,即第一主成分表达的原始数据信息不够全面,仅按第一主成分排序有点片面,这时把主成分和聚类分析结合起来,采用“主成分聚类”。
3.分析过程
从九个指标中看,单位GDP 能耗属于逆向指标,因此在分析中取倒数,此外九个指标的计量单位不同,为了取消量纲影响,对九个指标进行标准化,应用SPSS18.0 进行分析,提取了3 个主成分。三个主成分累计方差贡献率达到了89.21%,提取主成分效果较好。利用特征值对11 个城市进行得分计算,其中F 为综合得分(见表1)。从表中看出唐山市得分最高,衡水市得分最低。为了更详细表明各市经济发展水平,对11 个城市进行聚类分析。本文采用Q 型聚类。唐山市资源丰富,蕴含丰富的煤炭,石油资源,并地处连接华北,东北两大地区的咽喉重地,交通便利,与北京,天津两大城市构成经济圈,拥有京唐港和曹妃甸两个港区,贸易发展突出,单独归为一类,归为第一类;石家庄市为河北省省会,凝聚了各方面的资源,在政策方面也有巨大优势,经济发展较快,单独归为一类,归为第二类;保定市,邯郸市和沧州市固定资产投资总额和财政收入相差不大,具有一定的相似性,统一归为第三类;秦皇岛市,廊坊市,张家口市,邢台市,衡水市,承德市综合指标值相差不大,统一归为第四类。
三、结论与建议
从分析结果中可以看出,河北省经济发展机遇与挑战并存。唐山市资源丰富,发展较快,人均GDP 较高;衡水市发展潜力巨大,它地处北京、天津、济南、郑州、石家庄五大华北城市群空间地理中心,在2009 年的中国品牌节,被评为“中国最具投资潜力城市”。因此,虽然各个城市的综合得分不同,但是每个城市都有自己独特的发展优势。
河北省经济发展潜力巨大,要充分发挥潜力须从以下几方面入手:一是要把握机遇,抓住国家提出的环京津冀经济圈和环首都经济圈的建设的政策,“加快优势区域聚集发展,要在‘打京津牌、吃沿海饭’上下功夫。”“打京津牌”就是要着眼发挥环首都、邻天津的区位优势,打造绿色低碳示范区,建设“三带”:绿色产业带、绿色生态带和绿色城市带。“吃沿海饭”就是着眼发挥沿渤海优势,打造引领河北经济发展的增长极。二是加强区域的带动作用。各个地区的区位优势和资源优势不同,在发展自己的同时,能给其他地区带来发展机遇,促进地区间的协调发展。三是各个城市要利用自己独有的优势,制定适合自己独特发展的
政策,发展自己的特色经济。
参考文献:
[1]何晓群.多元统计分析(第二版).中国人民大学出版社.
[2]杜强,贾丽艳.SPSS 统计分析从入门到精通.人民邮电出版社.
[3]王春芝.内蒙古12个主要盟市经济发展能力聚类分析[J].经济论坛,2012,(9).__