用R阐明局限以上家产企业主要指标(分地域)-2010年
实际意义
通过阐明各地局限以上家产企业指标,我们可以给投资者一些发起。好比通过对差异地域分类,我们可以汇报投资者们,哪些地域已经高度发家,缺乏成长空间,哪些地域发家中等,有很大的成长空间,而哪些处所过于落伍,没有成长前途。与此同时,我们还可以从中看出各地的贫富差别,对当局今后应该更注重哪些处所的成长提供微小的参考代价。
下面我们把数据揭示给各人
局限以上家产企业主要指标(分地域) | ||||||||||||||
指标 | 企业单元个数(个) | 资产总计(亿元) | 活动资产合计(亿元) | 牢靠资产原价(亿元) | 牢靠资产净值(亿元) | 欠债合计(亿元) | 活动欠债合计(亿元) | 所有者权益(亿元) | 主营业务收入(亿元) | 主营业务本钱(亿元) | 主营业务税金及附加(亿元) | 利润总额(亿元) | 今年应交增值税(亿元) | 年平均从业人员(万人) |
总计 | 452872 | 592881.89 | 279227.32 | 334839.41 | 211217.89 | 340396.39 | 257995.57 | 251160.35 | 697744 | 585256.8 | 11183.11 | 53049.66 | 22472.72 | 9544.71 |
北京市 | 6884 | 22750.58 | 9012.95 | 7936.06 | 4804.12 | 11548.07 | 7159.39 | 11202.5 | 14807.11 | 12611.21 | 193.09 | 1028.34 | 409.79 | 124.15 |
天津市 | 7947 | 14584.31 | 7471.09 | 8211.22 | 5086.92 | 8825.23 | 7213.66 | 5759.04 | 17319.62 | 14774.72 | 212.36 | 1552.05 | 656.54 | 148.91 |
河北省 | 13927 | 24943.75 | 10422.94 | 14956.23 | 9952.97 | 15136.72 | 11190.61 | 9687.76 | 31628.93 | 27049.79 | 360.07 | 2141.47 | 872.28 | 344.67 |
山西省 | 4240 | 18505.94 | 8129.61 | 10192.93 | 6432.46 | 12142.27 | 8550.71 | 6330.97 | 12712.5 | 10235.84 | 145.26 | 958.25 | 714.39 | 219.88 |
内蒙古自治区 | 4611 | 14691.38 | 5078.79 | 10065.31 | 6592.84 | 8642.76 | 5225.41 | 5982.08 | 13387.83 | 10247.67 | 210.45 | 1688.44 | 586.32 | 125.19 |
辽宁省 | 23832 | 29076.78 | 13283.41 | 18742.09 | 10904.31 | 16896.14 | 12600.82 | 12082.43 | 36049.59 | 30578.87 | 702.1 | 2371.35 | 968.69 | 401.74 |
吉林省 | 6181 | 10196.15 | 4165.21 | 7917.96 | 4358.14 | 5474.03 | 3896.7 | 4678.85 | 12647.34 | 10447.58 | 367.44 | 843.21 | 355 | 139.81 |
黑龙江省 | 4596 | 10471.17 | 4441.13 | 8201.97 | 4721.94 | 5776.59 | 4383.84 | 4668.4 | 9899.14 | 7412.2 | 478.7 | 1248.82 | 509.51 | 147.6 |
上海市 | 16684 | 27555.88 | 15728.25 | 15034.65 | 8070.95 | 14500.46 | 12514.5 | 13055.42 | 32084.08 | 26937.73 | 578.04 | 2299.66 | 816.97 | 291.62 |
江苏省 | 64136 | 66134.06 | 36028.85 | 34509.27 | 21781.92 | 37878.51 | 32067.93 | 28255.55 | 91077.41 | 78460.64 | 652.76 | 5970.56 | 2692.69 | 1153.88 |
浙江省 | 64364 | 47282.79 | 27345.07 | 19636.32 | 12904.97 | 28681.36 | 25038.39 | 18601.43 | 50536.31 | 43300.73 | 512.49 | 3174.75 | 1412.68 | 857.58 |
安徽省 | 16277 | 15930.28 | 6899.1 | 8552.64 | 5814.35 | 9565.86 | 6996.4 | 6308.09 | 18164.6 | 15208.67 | 283.21 | 1445.57 | 672.57 | 264.87 |
福建省 | 19227 | 16058.7 | 8420.83 | 7967.5 | 5324.49 | 8469.33 | 6657.15 | 7567 | 21479.37 | 18223.27 | 268.42 | 1754.18 | 555.85 | 411.75 |
江西省 | 7908 | 8637.45 | 3702.81 | 5092.14 | 3453.49 | 4840 | 3839.5 | 3752.06 | 14250.47 | 12145.77 | 172.58 | 909.77 | 439.07 | 199.16 |
山东省 | 44037 | 53761.28 | 23830.46 | 33768.97 | 20369.72 | 28969.89 | 22134.71 | 24552.79 | 83663 | 71239.28 | 1083.7 | 6107.99 | 2545.93 | 931.5 |
河南省 | 19548 | 23467.42 | 9798.26 | 14572.83 | 9910.33 | 12960.96 | 9078.75 | 10362.25 | 36163.12 | 30316.67 | 478.6 | 3302.22 | 1147.72 | 479.27 |
湖北省 | 16106 | 20894.32 | 8962.92 | 13171.65 | 8251.93 | 12259.18 | 9159.72 | 8577.11 | 21151.56 | 17730.34 | 642.46 | 1668.55 | 639.08 | 294.97 |
湖南省 | 13844 | 13038.95 | 5122.91 | 8007.22 | 5627.66 | 7504.26 | 4804.51 | 5534.59 | 18669.79 | 14925.93 | 553.39 | 1451.45 | 830.66 | 272.44 |
广东省 | 53389 | 62626.9 | 34339.97 | 33489.49 | 20935.92 | 35073.74 | 29137.08 | 27461.84 | 84114.85 | 71251.44 | 898.22 | 6239.64 | 2280.56 | 1568 |
广西壮族自治区 | 6583 | 8667.45 | 3700.55 | 5140.8 | 3666.47 | 5413.29 | 3755 | 3211.63 | 9235.85 | 7707.42 | 232.18 | 771.59 | 320.65 | 150.51 |
海南省 | 497 | 1621.38 | 622.32 | 882.1 | 603.51 | 861.92 | 627.71 | 757.79 | 1322.83 | 1008.13 | 78.6 | 140.04 | 60.46 | 12.44 |
重庆市 | 7130 | 8099.01 | 3608.48 | 4463.42 | 2963.96 | 4879.66 | 3552.39 | 3205.78 | 9039.03 | 7593.51 | 151.54 | 518.59 | 341.75 | 146.56 |
四川省 | 13706 | 22564.76 | 9321.7 | 13695.1 | 8279.99 | 13889.83 | 9502.58 | 8571.93 | 23062.82 | 19003.96 | 385.73 | 1661.85 | 945.28 | 351.67 |
贵州省 | 2963 | 5960.13 | 2241.09 | 3771.94 | 2653.16 | 3865.34 | 2163.87 | 2081.15 | 3926.01 | 3042.8 | 158.11 | 317.63 | 195.65 | 80.3 |
云南省 | 3599 | 9611.09 | 3818.98 | 5218.33 | 3567.69 | 5735.24 | 3603.98 | 3857.72 | 6356.24 | 4853.23 | 507.41 | 599.34 | 337.57 | 92.6 |
西藏自治区 | 97 | 315.24 | 90.76 | 189.85 | 137.94 | 91.89 | 58.38 | 223.22 | 59.71 | 48.31 | 0.84 | 10.82 | 5.01 | 1.91 |
陕西省 | 4564 | 14688.7 | 6503.08 | 7236.99 | 4483.11 | 8348.75 | 5711.2 | 6311.19 | 10888.8 | 7982.21 | 348.16 | 1469.57 | 584.23 | 151.08 |
甘肃省 | 2000 | 6487.35 | 2507.14 | 4305.51 | 2971.32 | 4060.57 | 2587.64 | 2393.97 | 5148.4 | 4196.71 | 195.88 | 231.51 | 162.53 | 71.34 |
青海省 | 555 | 3053.61 | 932.42 | 2026.1 | 1448.67 | 1946.26 | 1065.86 | 1084.12 | 1525.08 | 1182.27 | 40.07 | 182.02 | 80.66 | 20.09 |
宁夏回族自治区 | 975 | 3293.16 | 1155.6 | 1771.53 | 1230.67 | 2139.47 | 1233.49 | 1153.29 | 1879.99 | 1590.95 | 34.34 | 138 | 71.12 | 29.04 |
新疆维吾尔自治区 | 2465 | 7911.97 | 2540.64 | 6111.28 | 3911.98 | 4018.78 | 2483.68 | 3888.4 | 5492.61 | 3948.96 | 256.92 | 852.43 | 261.52 | 60.18 |
阐明 | ||||||||||||||
主身分阐明(by朱珊) 把总计那一行删去,而且用x1是企业单元个数,x2是资产总计,x3是活动资产合计,x4是牢靠资产原价,x5是牢靠资产净值,x6是欠债合计,x7是活动欠债合计,x8是所有者权益,x9是主营业务收入,x10是主营业务本钱,x11是主营业务税金及附加,x12是利润总额,x13是今年应交增值税,x14是年平均从业人员 由上面可以看出,comp1的特征值比一大,comp2的特征值也不算小,小我私家以为选两个主身分,今后的研究会较量利便,并且累积孝敬率已经到达97.7%,所以选取comp1,comp2作为主身分。Comp1可以看为是总资产,comp2可以看为企业可以更换的资金。由这两个指标可以看出企业的局限和应付危机的本领。 下面举办分类 biplot(X.pr,choices=1:2,scale=1) 从上图大抵可以看出浙江省,江苏省,广东省,山东省别离自成一类,黑龙江省,辽宁省,云南省,湖南省,湖北省为一类,新疆,陕西,吉林,河南,上海为一类,山西,北京,青海,天津,海南,贵州,河北等为一类。小我私家认为这个分类很奇怪,山东怎么会自成一类,是因为沿海吗?尚有上海怎么会和新疆等地一类,北京和河北也很难领略,是因为隔得较量近?所以用Kmeans再分一下 之所以选择k=5,是因为我试了其他的值之后就得这个相对来说还较量公道,但功效照旧不尽人意,好比北京和云南、蒙古分为了一类,会不会是因为北京地区较小,所以固然密度很大,总数却不足,云南等地固然密度较小,但地区很大,所以总数照旧可观的呢? 最后做一下x2与comp1,comp2的线性回归 拟合的很是好,说明选择线性模子是一个较量好的选择
最后把x2,关于x3到x14的干系写出来如下,可以看出这些变量中谁人对总资产的影响较量大 x2=1974.78+0,2265*x3+0.1324*x4+0.2365*x5+0.1996*x6+0.2538*x7+0.2247*x8+0.0630*x9+0.0753*x10-3.3325*x11+0.7404*x12+2.0099*x13+5.1447*x14 决定树分类(by邹淑娴) library(zoo) library(party) da_ctree=ctree(资产总计.亿元.~.,data=da) print(da_ctree) Conditional inference tree with3 terminal nodes Response: 资产总计.亿元. Inputs: 企业单元个数.个., 活动资产合计.亿元., 牢靠资产原价.亿元., 牢靠资产净值.亿元., 欠债合计.亿元., 活动欠债合计.亿元., 所有者权益.亿元., 主营业务收入.亿元., 主营业务本钱.亿元., 主营业务税金及附加.亿元., 利润总额.亿元., 今年应交增值税.亿元., 年平均从业人员.万人. Number of observations: 31 1) 欠债合计.亿元. <=13889.83; criterion = 1, statistic = 29.824 2) 欠债合计.亿元. <= 5776.59; criterion = 1, statistic =22.488 3)* weights = 13 2) 欠债合计.亿元. > 5776.59 4)* weights = 11 1) 欠债合计.亿元. > 13889.83 5)* weights = 7 plot(da_ctree,terminal_panel=node_boxplot(da_ctree,col=”blue”),fill=hsv(2/3,0.5,1))
plot(da_ctree,terminal_panel=node_density(da_ctree,col=”red”),fill=hsv(2/3,0.5,1)) 以资产总计作为响应变量,其余指标作为自变量,由于各指标间存在高度的相关性,回收 ctree来构建决定树,对进修集举办预计和分类。 分类法例: (1) 假如欠债合计<=5776.59亿元,则为第一类; (2) 假如5776.59<欠债合计<=13889.83,则为第二类; (3) 假如欠债合计>13889.83,则为第三类。 which(da$欠债合计.亿元.<5776.59|da$欠债合计.亿元.==5776.59) [1] 7 8 14 20 21 22 24 25 26 28 29 3031 which(da$欠债合计.亿元.>5776.59&(da$欠债合计.亿元.<13889.83|da$欠债合计.亿元.==13889.83)) [1] 1 2 4 5 1213 16 17 18 23 27 which(da$欠债合计.亿元.>13889.83) [1] 3 6 9 10 11 15 19 从上面两图以及上面分类,可知,第一类有13个省,第二类有11个省,第三类有7个省,详细如下: 第一类: 吉林省、黑龙江省、江西省、广西壮族自治区、海南省、重庆市、贵州省、云南省、西藏自治区、甘肃省、青海省、宁夏回族自治区、新疆维吾尔自治区 第二类: 北京市 、天津市、山西省、内蒙古自治区、安徽省、福建省、四川省、河南省、湖北省、湖南省、陕西省 第三类: 河北省、辽宁省、广东省、山东省、上海市、江苏省、浙江省 这样分类是公道的,因为第一类为局限以上家产企业不发家的地域,第二类为局限以上家产企业较发家的地域,第三类为局限以上家产企业很发家的地域。个中北京市和天津市被归为第二类主要是因为两者都是一个市,面积较小,也意味着能采取的局限以上的家产企业较少。 > library(maptools) > x=readShapePoly(‘bou2_4p.shp’) > plot(x); > plot(x,col=gray(924:0/924)); >getColor=function(mapdata,provname,provcol,othercol) + { + f=function(x,y) ifelse(x %in%y,which(y==x),0); +colIndex=sapply([email protected]$NAME,f,provname); + fg=c(othercol,provcol)[colIndex+1]; + return(fg); } > provname=c(“北京市”,”天津市”,”山西省”,”内蒙古自治区”,”安徽省”,”福建省”,”四川省”,”河南省”,”湖北省”,”湖南省”,”陕西省” + ,”河北省”,”辽宁省”,”广东省”,”山东省”,”上海市”,”江苏省”,”浙江省”) >provcol=rep(c(“lightblue”,”blue”),c(11,7)) >plot(x,col=getColor(x,provname,provcol,”white”)) 图中蓝色区域为第三类,浅蓝色区域为第二类,白色区域(港澳台除外)为第一类,即各个地域局限以上家产企业的发家水平通过颜色深浅反应出来。从舆图上可看出,局限以上家产企业发家的地域都在东部沿海一带,而较发家地域则在多处于中部地域,不发家地域主要是西南部和、西部和东北部地域。 投资发起:江西省处于第二类和第三类的困绕圈中,地理位置不错,却属于第一类,即其局限以上家产企业并不发家,实在令人匪夷所思,由于本人对江西省知之甚少,假如不思量其成长中存在的非凡坚苦,江西省很有成长潜力,可作为局限以上财富企业进军的工具。福建省也可以进一步成长,究竟处于沿海地域,又邻接台湾。尚有就是海南省,作为一个成长资历很浅的省份,其局限以上财富企业并不发家,但由于紧邻广东,三面环海,地理位置绝佳,国度连年来重点成长海南省,长短常高瞻远瞩的,小我私家以为海南省是最富有投资潜力的 关联阐明(by陈文忆) |