因子聚类分析在区域农村物流能力评价中的应用
——以江苏省为例
倪涛 滕喜华 成都信息工程大学物流学院 四川成都 610225
摘 要:本文应用多元统计分析中的因子分析和聚类分析法,结合统计数据,以江苏省13市的统计数据为样本数据,通过SPSS19.0 软件客观评价江苏省区域农村物流能力,获得了各市的农村物流能力得分排名。在因子分析的基础上进行了聚类分析,提出了江苏省区域农村物流中心的规划建议。结果表明,因子聚类法能够基于数据本身,对多指标进行降维处理,也对指标间的多重相关性有一定的削弱作用,从而降低评价的复杂程度,使评价结果与实际更加符合。
关键词:区域农村物流;因子分析;聚类分析;农村物流能力
随着经济的快速发展以及电子商务的广泛利用,现代物流业以其“第三方利润源泉”的强大生命力蓬勃兴起。区域农村物流是区域经济核心竞争力的体现,也是经济发展水平的重要标志之一。科学的评价区域农村物流的发展水平,有助于政府相关部门制定相关科学决策、改善经济发展环境、促进农村物流的健康发展。提升区域农村物流的竞争力和推动区域农村经济的发展具有重要的意义。本文采用多元统计分析中的因子分析法以及聚类分析法,根据统计数据,选取江苏省的13个市作为样本,运用SPSS 19.0 软件进行处理,通过计算各市的农产品物流能力得分,对区域农村物流能力进行客观评价,以期为江苏省区域农村物流规划提供实证参考。
因子分析的概念最初起源于关于智力测验的探讨,其作出突出贡献的是20世纪初的心理学家Charles Spearman 等。因子分析的基本思想是肯定变量之间具有相关性,可以根据这种相关性进行不同的分组组合,这样,同一组的变量之间的相关性就比较高,不同组的变量相关性就较低,每一组的变量都代表不同的基本结构。因子分析是这样一种多元统计分析方法,它将少数几个因子变量来共同解释众多的原始变量,而且这少数的几个因子变量几乎能够囊括绝大多数的信息,并且可以进行一定的命名解释。
聚类分析(cluster analysis)是多元统计分析中研究“物以类聚”的一种方法,它包括多种方法,如系统聚类法(又称层次聚类法)、K-Means 聚类等。聚类分析的基本思想是将一批样本(或者变量)数据根据其诸多特征,按照在性质上的亲属程度在没有先验知识的情况下进行自动分类,产生多个分类结果。类内部个体特征具有相似性,不同类间个体特征的差异性较大。
指标的选取是非常重要的环节。本文在查阅了大量的国内外的研究文献的基础上,最终选出了7个指标,来代表区域农产品物流能力的评价指标。它们是X1为地区GDP、X2为人均GDP、X3为社会消费品售总额、X4农林牧渔业总产值、X5为公路里程、X6为货运总量、X7为国际互联网用户数、X8为民用汽车拥有量。样本选取江苏省13个市为代表地区,数据来自2015年《江苏省统计年鉴》。
将数据进行标准化,以保证不受量级的影响。通过SPSS 19.0 进行信度分析,Cronbach α系数值均大于0.7(见表1),说明本数据具有很高的信度(按照Nannally建议,Cronbach α系数只要大于0.7,问卷就具有很高的信度)。
表1 信度分析表 | |
---|---|
Cronbach's Alpha | 项数 |
0.827 | 8 |
首先用 KMO 测度值检验选取的指标数据是否适合进行因子分析,若KMO>0.5适合;KMO<0.5 不适合。对数据运用SPSS 19.0 统计分析软件算得 KMO =0.564,故可以进行因子分析。
因子分析的关键是根据样本数据求解因子载荷矩阵。根据原有变量的相关系数矩阵,采用占主要地位且使用最为广泛的主成分分析法进行分析。按照特征根大于1的原则,选入了2个公共因子,其累计方差率达到了88.033%。各主因子对应的特征根及方差贡献率见表1,碎石图见图1采用方差最大法对因子载荷矩阵实行正交旋转以使因子具有命名解释性。输出旋转后的因子载荷矩阵,如表2所示。
表2 各主因子对应的特征根及其方差贡献率
因子 | F1 | F2 |
特征值 | 4.951 | |
方差贡献率 | 61.886 | 26.147 |
累计方差贡献率/% | 61.886 | 88.033 |
从表2可以看出第一主因子和第二主因子的累计贡献率为88.033%,说明这两个主因子基本包含了原始指标的信息,其中第一个主因子的方差贡献率为61.886%起主要作用,它在X1、X2、X3、X7、X8有较大的载荷,主要反映了区域农产品物流发展的经济环境发展状况,因此可解释为区域经济环境因;第二个因子在X4、X5有较大载荷,在某种程度上体现了农产品物流的供给状况,可以把第2个因子解释为区域物流供给因子。
图1 碎石图
表3 主因子载荷矩阵
指标 | F1 | F2 |
X1 | 0.960 | 0.159 |
X2 | 0.858 | -0.365 |
X3 | 0.962 | 0.240 |
X4 | -0.328 | 0.925 |
X5 | -0.162 | 0.970 |
X6 | 0.610 | 0.017 |
X7 | 0.962 | 0.214 |
X8 | 0.968 | 0.180 |
因子得分是因子分析的最终体现。在因子分析的实际应用中,当因子确定以后,便可以计算各个因子在每个样本上的具体数值,这些数值称为因子得分,形成的变量称为因子变量。通过SPSS 19.0软件计算,可以输出因子成分得分系数矩阵(见表4),得到(1)-(2)。
表4 主因子得分系数矩阵
指标 | F1 | F2 |
X1 | 0.194 | 0.076 |
X2 | 0.173 | -0.175 |
X3 | 0.194 | 0.115 |
X4 | -0.066 | 0.442 |
X5 | -0.033 | 0.464 |
X6 | 0.123 | 0.008 |
X7 | 0.194 | 0.102 |
X8 | 0.195 | 0.086 |
………………(1)
……………(2)
根据总方差解释表中2个公因子F1、F2方差的贡献率,可以尝试性的构建江苏省各市的农产品物流能力评价模型,如式(3)。
……………………………………………………………………………… (3)
上式中Fi(i=1,2)是各个因子得分,F代表各市农产品物流能力的总得分。数据分析样本来自江苏省的13个市,把13个市的相关统计数据带入到上述构造的能力评价模型中,利用Excel可以计算出各个市的各因子的得分,形成江苏省的各市农产品物流能力的得分排名,如表5。
表5 江苏省各市农产品物流能力因子得分排名
样本 | F1 | 排名 | F2 | 排名 | F | 排名 |
南 京 | 1.735502 | 2 | 0.180943 | 5 | 1.121344 | 2 |
无 锡 | 0.979041 | 3 | -0.97257 | 11 | 0.351591 | 3 |
徐 州 | -0.33314 | 6 | 1.456417 | 2 | 0.174641 | 5 |
常 州 | 0.196543 | 4 | -0.99615 | 12 | -0.13883 | 7 |
苏 州 | 2.079182 | 1 | 0.501201 | 4 | 1.417771 | 1 |
南 通 | 0.038735 | 5 | 1.182132 | 3 | 0.333064 | 4 |
连云港 | -0.89376 | 12 | -0.11513 | 7 | -0.58321 | 11 |
淮 安 | -0.85595 | 11 | 0.051261 | 6 | -0.51631 | 10 |
盐 城 | -0.71229 | 10 | 1.776442 | 1 | 0.023681 | 6 |
扬 州 | -0.40096 | 8 | -0.52678 | 9 | -0.38587 | 8 |
镇 江 | -0.35167 | 7 | -1.47256 | 13 | -0.60267 | 12 |
泰 州 | -0.51427 | 9 | -0.72827 | 10 | -0.50868 | 9 |
宿 迁 | -0.96697 | 13 | -0.33695 | 8 | -0.68652 | 13 |
经过因子分析,可以得到2个主成分指标数据,将其组成聚类分析的样本矩阵,运用SPSS 19.0进行聚类分析,用来分析江苏省各市的农产品物流发展状况(图2)。
图2 聚类图
聚类结果可以分为2类。即将江苏省13个城市分为2类:(1)南京、无锡、苏州;(2)连云港、宿迁、淮安、扬州、泰州、镇江、常州、徐州、盐城、南通;结合各城市所处的地理位置以及因子聚类分析结果,将江苏省的区域农产品物流中心划分为2个区域地区重点发展。
因子分析最终得出了江苏省各市的区域农产品物流能力得分综合排名。从表5可以看出,按照F1排名,排在前3名的是苏州、南京和无锡;按照F总排名,排在前3名的是苏州、南京和无锡。从排序结果来看,F1和F的排名基本吻合,说明提取的第1公因子作为第一主成分涵盖了绝大部分的变量信息。因此可以证明,运用因子分析法中的主成分分析法,得出的得分排名具有一定的科学性和可行性。聚类分析作为区流规划的重要参考依据,是在因子分析的基础上进行的,使用以主成分指标组成新的矩阵作为聚类分析的样本矩阵,可以大幅度的减少计算量,从而做到原理清晰、计算简便。对区域农产品物流能力进行评价,往往面临着复杂程度高、指标间存在多重相关性等难以解决的问题,而因子聚类法能够基于数据本身,对多指标进行降维处理,也对指标间的多重相关性有一定的削弱作用,从而降低了评价的复杂程度,使评价结果与实际更加符合。因此,利用因子聚类法来综合评价区域农产品物流能力是一种值得尝试的方法。同时,也可以为地区区域物流规划起到良好的参考和借鉴作用。
[1]周泰,王亚玲. 提高我国区域物流能力的策略研究[J]. 科技管理研究,2012,03:18-22.
[2]郭艳,于兆宇. 江西区域物流能力与经济系统协同发展[J]. 企业经济,2012,11:124-127.
[3]杨会来,杨蕾. 因子聚类分析在区域农产品物流能力评价中的应用——以河北省为例[J]. 中国农学通报,2011,24:128-132.
[4]王岳峰,刘伟. 区域物流能力柔性规划的内涵、特点与概念模型[J]. 武汉理工大学学报(信息与管理工程版),2009,01:165-168.
[5]冯华,胡娟. 基于主成分分析的区域物流能力研究[J]. 商业时代,2009,10:16-17.
[6]闫秀霞,孙林岩. 物流能力对区域经济发展的影响分析[J]. 科技进步与对策,2006,10:160-163.
[7]王岳峰,刘伟. 对区域物流能力规划与区域经济发展若干问题的思考[J]. 物流科技,2006,11:77-79.