区域经济发展水平指标从哪些方面分析

摘要: 本文首先对聚类分析进行简要概述,然后针对省会城市和计划单列市主要经济指标来研究我国城市的经济状况,通过SPSS软件聚类分析的K-均值算法将36个城市分成三类,通过分类结果讨论城市之间的经济发展差距,为进一步研究经济发展做好分析工作。
  Abstract: At first, this paper simply expounds the cluster analysis. Then, aimed at the major economic indicators of the capital cities and the cities specifically designated in the state plan, the paper studies the economy situation of the cities in China. The 36 cities are divided into three categories by K-means algorithm of the cluster analysis of SPSS software. The economic development gap among the cities is discussed by the classification results to do a good job for the further study of economic development.   关键词: 区域经济;发展水平;聚类分析   Key words: regional economy;developmental level;cluster analysis   中图分类号:F127 文献标识码:A 文章编号:(2-02   0 引言   在理论研究和实际工作中经常要进行分类。当只有一个指标时, 按大小单排序即可;当有多个指标时, 就不能进行单排序了,需要用聚类分析方法进行综合评估。聚类分析是一种来源于数值分类学且运用多元统计分析技术对数据样本或者变量进行分类的方法。本文主要是针对省会城市和计划单列市主要经济指标来研究我国城市的经济状况,将城市指标数据通过SPSS软件进行聚类分析,对我国不同城市的经济发展做一个比较和分类,其处理方式是使用SPSS中的K-均值算法,将36个城市分成三类, 得出区域经济发展水平的分类情况。   1 聚类分析概述   1.1 聚类分析基本思想   聚类分析是研究对样品或指标进行分类问题的一种多元统计分析方法。其基本思想是通过一个大的对称矩阵把需要研究分类的对象看作多维空间的一些向量,按照各类聚类算法的各自准则定性或者定量的求出这些数据(或者变量)间的相似程度值,同时又按照这些样本(或者变量)的内在联系等因素合理的逐步将它们分类到不同的类或者簇,形成一个亲疏关系谱系图,用以更直观地显示分类对象的差异和联系,进而能够更加客观的反映样本(或者变量)间的相关关系,便于对实际问题进行具体分析。   1.2 聚类分析方法   传统的聚类分析算法有五类:划分方法、层次方法、基于密度方法、基于网格方法和基于模型方法。本文使用的是基于划分方法的K-均值算法,介绍如下。   给定一个n个对象或元组的数据库,一个划分方法构建数据的k个划分,每一个划分表示一个聚簇,而且有k≤n。也就是说,它将数据划分为k个组,同时满足要求:每一个组最少包含一个对象;每个对象必须属于且只属于一个组。典型的此类算法如k-均值算法,k-中心点算法等。   K-均值算法是以k为输入参数,将n个对象的集合分为k个类,使得类内相似度高,类间相似度低,类的相似度是类中对象的均值度量,可以看做类心(簇心)。   其中,E是数据集中全部对象的平方误差和,p是空间中的点,mi是类Ci的均值,也就是对于每个类种的每一个对象,求对象到其类心距离的平方再求和。   K-均值算法步骤:   ①人为主观选取k个对象作为初始的类中心;   ②按照与每个中心的距离,根据就近原则,将每个对象赋给最近的类;   ③重新计算每一个簇的平均值;   ④重复执行②、③,如此反复,直到E的值改变很小或收敛(中心的改变量为0)为止。   2 聚类分析的过程   2.1 数据来源及标准化   《中国统计年鉴》是国家统计局出版发行的全面反应中华人民共和国经济和社会发展情形的资料性年刊,收录上一年全国和各省、自治区、直辖市每年经济和社会各方面大批的统计数据,和历史重要年份以及近二十年的全国主要统计数据,是最全面、最具权威性的综合统计年鉴。   本文采用2014年中国统计年鉴中的25-2:省会城市和计划单列城市的总人口人数、国内生产总值、公共财政收入、货物进出口总额、固定资产投资总额、社会消费品零售总额指标,使用SPSS聚类分析中的K-均值算法进行分析,将36个城市经济发展水平分成三类,最后通过分类结果讨论城市之间的经济发展差距(见表1)。   城市有36个:包括23个省会城市,5个自治区省会城市,4个直辖市,还有青岛,宁波,深圳,厦门四个单列城市,总共36个城市。这些城市可以代表我国的大部分地区,所以这些数据能代表中国大部分地区的经济情况。   为消除各个经济指标变量所用量纲不同造成的影响,先将原始数据进行标准化。本文利用SPSS软件计算各个变量的Z得分,标准化公式如下:   2.2 聚类分析结果   本文采用K-均值聚类方法将36个城市分成3类,得到表2,分析如下:   从表2中可以看出,将36个城市分成了三类。第一类城市包括:北京,上海,广州,深圳;第二类城市包括:天津,重庆;剩下的30个城市被归属到第三类城市。这一结果基本符合我国区域间经济现状。   3 结论及建议   综上可知,本文聚类分析的结果基本符合我国的实际情况。第一类城市发展最快,北京是我国政治文化中心,地处要塞经济发达;广州、深圳是我国最早对外开放的城市,企业富含活力和生机,经济实力非常雄厚。第二类城市天津和重庆发展也比较快,它们的各项经济指标均位于全国前列,属于我国经济发展水平较高的城市。第三类城市经济发展水平相对较低,这些区域的国内生产总值、财政收入、货物进出口总额和社会消费品零售总额等与第一类和第二类城市数额相比,差距较大。   结合上述分析结果本文给出以下建议:在深化改革的基础上政府应加大政策扶持力度,充分调动各方面发展经济的积极因素;激励和引导发挥区域比较优势、区域资源优势,各个城市扬长避短,相互补充,避免资源重复和浪费;形成特色经济,促进经济、社会、环境、制度等多个方面相互协调发展,缩小不同地区之间人民生活水平差距;政府加强与高校之间的合作,带动企业的发展与创新充分加强分工与合作;制定有利于企业发展的产业政策,培育有竞争优势的企业集群,规范市场运作体系,建立公平透明的市场竞争规则。   参考文献:   [1]姜扬.聚类和主成分回归在经济指标数据中的应用研究[D].吉林大学,2010.   [2]王翠云,胡学平.聚类分析及其在我国各省经济发展水平分类研究中的应用[J].安庆师范学院学报,):36-40.   [3]李斌.基于正常简档聚类的自适应异常检测技术研究[D].中南大学,2009.   [4]中国统计年鉴[J/OJ].http://www./tjsj/ndsj/2014/indexch.htm.
欢迎转载:
推荐:    (window.slotbydup=window.slotbydup || []).push({
id: '2014386',
container: s,
size: '234,60',
display: 'inlay-fix'
&&|&&0次下载&&|&&总5页&&|
您的计算机尚未***Flash,点击***&
阅读已结束,如需下载到电脑,请使用积分()
下载:2积分
0人评价4页
0人评价6页
0人评价4页
0人评价6页
0人评价2页
所需积分:(友情提示:大部分文档均可免费预览!下载之前请务必先预览阅读,以免误下载造成积分浪费!)
(多个标签用逗号分隔)
文不对题,内容与标题介绍不符
广告内容或内容过于简单
文档乱码或无法正常显示
若此文档涉嫌侵害了您的权利,请参照说明。
评价文档:
下载:2积分

参考资料

 

随机推荐