用R阐明局限以上家产企业主要指标(分地域)-2010年
当前位置:以往代写 > 其他教程 >用R阐明局限以上家产企业主要指标(分地域)-2010年
2019-06-14

用R阐明局限以上家产企业主要指标(分地域)-2010年

用R阐明局限以上家产企业主要指标(分地域)-2010年

实际意义
通过阐明各地局限以上家产企业指标,我们可以给投资者一些发起。好比通过对差异地域分类,我们可以汇报投资者们,哪些地域已经高度发家,缺乏成长空间,哪些地域发家中等,有很大的成长空间,而哪些处所过于落伍,没有成长前途。与此同时,我们还可以从中看出各地的贫富差别,对当局今后应该更注重哪些处所的成长提供微小的参考代价。
下面我们把数据揭示给各人

局限以上家产企业主要指标(分地域)                    
指标 企业单元个数(个) 资产总计(亿元) 活动资产合计(亿元) 牢靠资产原价(亿元) 牢靠资产净值(亿元) 欠债合计(亿元) 活动欠债合计(亿元) 所有者权益(亿元) 主营业务收入(亿元) 主营业务本钱(亿元) 主营业务税金及附加(亿元) 利润总额(亿元) 今年应交增值税(亿元) 年平均从业人员(万人)
总计 452872 592881.89 279227.32 334839.41 211217.89 340396.39 257995.57 251160.35 697744 585256.8 11183.11 53049.66 22472.72 9544.71
北京市 6884 22750.58 9012.95 7936.06 4804.12 11548.07 7159.39 11202.5 14807.11 12611.21 193.09 1028.34 409.79 124.15
天津市 7947 14584.31 7471.09 8211.22 5086.92 8825.23 7213.66 5759.04 17319.62 14774.72 212.36 1552.05 656.54 148.91
河北省 13927 24943.75 10422.94 14956.23 9952.97 15136.72 11190.61 9687.76 31628.93 27049.79 360.07 2141.47 872.28 344.67
山西省 4240 18505.94 8129.61 10192.93 6432.46 12142.27 8550.71 6330.97 12712.5 10235.84 145.26 958.25 714.39 219.88
内蒙古自治区 4611 14691.38 5078.79 10065.31 6592.84 8642.76 5225.41 5982.08 13387.83 10247.67 210.45 1688.44 586.32 125.19
辽宁省 23832 29076.78 13283.41 18742.09 10904.31 16896.14 12600.82 12082.43 36049.59 30578.87 702.1 2371.35 968.69 401.74
吉林省 6181 10196.15 4165.21 7917.96 4358.14 5474.03 3896.7 4678.85 12647.34 10447.58 367.44 843.21 355 139.81
黑龙江省 4596 10471.17 4441.13 8201.97 4721.94 5776.59 4383.84 4668.4 9899.14 7412.2 478.7 1248.82 509.51 147.6
上海市 16684 27555.88 15728.25 15034.65 8070.95 14500.46 12514.5 13055.42 32084.08 26937.73 578.04 2299.66 816.97 291.62
江苏省 64136 66134.06 36028.85 34509.27 21781.92 37878.51 32067.93 28255.55 91077.41 78460.64 652.76 5970.56 2692.69 1153.88
浙江省 64364 47282.79 27345.07 19636.32 12904.97 28681.36 25038.39 18601.43 50536.31 43300.73 512.49 3174.75 1412.68 857.58
安徽省 16277 15930.28 6899.1 8552.64 5814.35 9565.86 6996.4 6308.09 18164.6 15208.67 283.21 1445.57 672.57 264.87
福建省 19227 16058.7 8420.83 7967.5 5324.49 8469.33 6657.15 7567 21479.37 18223.27 268.42 1754.18 555.85 411.75
江西省 7908 8637.45 3702.81 5092.14 3453.49 4840 3839.5 3752.06 14250.47 12145.77 172.58 909.77 439.07 199.16
山东省 44037 53761.28 23830.46 33768.97 20369.72 28969.89 22134.71 24552.79 83663 71239.28 1083.7 6107.99 2545.93 931.5
河南省 19548 23467.42 9798.26 14572.83 9910.33 12960.96 9078.75 10362.25 36163.12 30316.67 478.6 3302.22 1147.72 479.27
湖北省 16106 20894.32 8962.92 13171.65 8251.93 12259.18 9159.72 8577.11 21151.56 17730.34 642.46 1668.55 639.08 294.97
湖南省 13844 13038.95 5122.91 8007.22 5627.66 7504.26 4804.51 5534.59 18669.79 14925.93 553.39 1451.45 830.66 272.44
广东省 53389 62626.9 34339.97 33489.49 20935.92 35073.74 29137.08 27461.84 84114.85 71251.44 898.22 6239.64 2280.56 1568
广西壮族自治区 6583 8667.45 3700.55 5140.8 3666.47 5413.29 3755 3211.63 9235.85 7707.42 232.18 771.59 320.65 150.51
海南省 497 1621.38 622.32 882.1 603.51 861.92 627.71 757.79 1322.83 1008.13 78.6 140.04 60.46 12.44
重庆市 7130 8099.01 3608.48 4463.42 2963.96 4879.66 3552.39 3205.78 9039.03 7593.51 151.54 518.59 341.75 146.56
四川省 13706 22564.76 9321.7 13695.1 8279.99 13889.83 9502.58 8571.93 23062.82 19003.96 385.73 1661.85 945.28 351.67
贵州省 2963 5960.13 2241.09 3771.94 2653.16 3865.34 2163.87 2081.15 3926.01 3042.8 158.11 317.63 195.65 80.3
云南省 3599 9611.09 3818.98 5218.33 3567.69 5735.24 3603.98 3857.72 6356.24 4853.23 507.41 599.34 337.57 92.6
西藏自治区 97 315.24 90.76 189.85 137.94 91.89 58.38 223.22 59.71 48.31 0.84 10.82 5.01 1.91
陕西省 4564 14688.7 6503.08 7236.99 4483.11 8348.75 5711.2 6311.19 10888.8 7982.21 348.16 1469.57 584.23 151.08
甘肃省 2000 6487.35 2507.14 4305.51 2971.32 4060.57 2587.64 2393.97 5148.4 4196.71 195.88 231.51 162.53 71.34
青海省 555 3053.61 932.42 2026.1 1448.67 1946.26 1065.86 1084.12 1525.08 1182.27 40.07 182.02 80.66 20.09
宁夏回族自治区 975 3293.16 1155.6 1771.53 1230.67 2139.47 1233.49 1153.29 1879.99 1590.95 34.34 138 71.12 29.04
新疆维吾尔自治区 2465 7911.97 2540.64 6111.28 3911.98 4018.78 2483.68 3888.4 5492.61 3948.96 256.92 852.43 261.52 60.18
阐明 
主身分阐明(by朱珊)
把总计那一行删去,而且用x1是企业单元个数,x2是资产总计,x3是活动资产合计,x4是牢靠资产原价,x5是牢靠资产净值,x6是欠债合计,x7是活动欠债合计,x8是所有者权益,x9是主营业务收入,x10是主营业务本钱,x11是主营业务税金及附加,x12是利润总额,x13是今年应交增值税,x14是年平均从业人员
360截图20120416115259617.jpg
360截图20120416115358255.jpg

由上面可以看出,comp1的特征值比一大,comp2的特征值也不算小,小我私家以为选两个主身分,今后的研究会较量利便,并且累积孝敬率已经到达97.7%,所以选取comp1,comp2作为主身分。Comp1可以看为是总资产,comp2可以看为企业可以更换的资金。由这两个指标可以看出企业的局限和应付危机的本领。

下面举办分类

biplot(X.pr,choices=1:2,scale=1)

360截图20120416124641114.jpg

从上图大抵可以看出浙江省,江苏省,广东省,山东省别离自成一类,黑龙江省,辽宁省,云南省,湖南省,湖北省为一类,新疆,陕西,吉林,河南,上海为一类,山西,北京,青海,天津,海南,贵州,河北等为一类。小我私家认为这个分类很奇怪,山东怎么会自成一类,是因为沿海吗?尚有上海怎么会和新疆等地一类,北京和河北也很难领略,是因为隔得较量近?所以用Kmeans再分一下

360截图20120416131021884.jpg

之所以选择k=5,是因为我试了其他的值之后就得这个相对来说还较量公道,但功效照旧不尽人意,好比北京和云南、蒙古分为了一类,会不会是因为北京地区较小,所以固然密度很大,总数却不足,云南等地固然密度较小,但地区很大,所以总数照旧可观的呢? 最后做一下x2与comp1,comp2的线性回归

360截图20120416133154965.jpg

拟合的很是好,说明选择线性模子是一个较量好的选择

360截图20120416133831970.jpg

最后把x2,关于x3到x14的干系写出来如下,可以看出这些变量中谁人对总资产的影响较量大

x2=1974.78+0,2265*x3+0.1324*x4+0.2365*x5+0.1996*x6+0.2538*x7+0.2247*x8+0.0630*x9+0.0753*x10-3.3325*x11+0.7404*x12+2.0099*x13+5.1447*x14

决定树分类(by邹淑娴)

library(zoo)

library(party)

da_ctree=ctree(资产总计.亿元.~.,data=da)

print(da_ctree)

Conditional inference tree with3 terminal nodes

Response:  资产总计.亿元.

Inputs:  企业单元个数.个., 活动资产合计.亿元., 牢靠资产原价.亿元., 牢靠资产净值.亿元., 欠债合计.亿元., 活动欠债合计.亿元., 所有者权益.亿元., 主营业务收入.亿元., 主营业务本钱.亿元., 主营业务税金及附加.亿元., 利润总额.亿元., 今年应交增值税.亿元., 年平均从业人员.万人.

Number of observations:  31

1) 欠债合计.亿元. <=13889.83; criterion = 1, statistic = 29.824

2) 欠债合计.亿元. <= 5776.59; criterion = 1, statistic =22.488

3)*  weights = 13

2) 欠债合计.亿元. > 5776.59

4)*  weights = 11

1) 欠债合计.亿元. > 13889.83

5)*  weights = 7

plot(da_ctree,terminal_panel=node_boxplot(da_ctree,col=”blue”),fill=hsv(2/3,0.5,1))

360截图20120419002832460.jpg

                              plot(da_ctree,terminal_panel=node_density(da_ctree,col=”red”),fill=hsv(2/3,0.5,1))

360截图20120419002850139.jpg

以资产总计作为响应变量,其余指标作为自变量,由于各指标间存在高度的相关性,回收 ctree来构建决定树,对进修集举办预计和分类。

分类法例:

(1)     假如欠债合计<=5776.59亿元,则为第一类;

(2)     假如5776.59<欠债合计<=13889.83,则为第二类;

(3)     假如欠债合计>13889.83,则为第三类。

which(da$欠债合计.亿元.<5776.59|da$欠债合计.亿元.==5776.59)

[1] 7  8 14 20 21 22 24 25 26 28 29 3031

which(da$欠债合计.亿元.>5776.59&(da$欠债合计.亿元.<13889.83|da$欠债合计.亿元.==13889.83))

[1] 1  2  4  5 1213 16 17 18 23 27

which(da$欠债合计.亿元.>13889.83)

[1] 3  6  9 10 11 15 19

从上面两图以及上面分类,可知,第一类有13个省,第二类有11个省,第三类有7个省,详细如下:

第一类:

吉林省、黑龙江省、江西省、广西壮族自治区、海南省、重庆市、贵州省、云南省、西藏自治区、甘肃省、青海省、宁夏回族自治区、新疆维吾尔自治区

第二类:

北京市 、天津市、山西省、内蒙古自治区、安徽省、福建省、四川省、河南省、湖北省、湖南省、陕西省

第三类:

河北省、辽宁省、广东省、山东省、上海市、江苏省、浙江省

这样分类是公道的,因为第一类为局限以上家产企业不发家的地域,第二类为局限以上家产企业较发家的地域,第三类为局限以上家产企业很发家的地域。个中北京市和天津市被归为第二类主要是因为两者都是一个市,面积较小,也意味着能采取的局限以上的家产企业较少。

> library(maptools)

> x=readShapePoly(‘bou2_4p.shp’)

> plot(x);

> plot(x,col=gray(924:0/924));

>getColor=function(mapdata,provname,provcol,othercol)

+ {

+ f=function(x,y) ifelse(x %in%y,which(y==x),0);

+colIndex=sapply([email protected]$NAME,f,provname);

+ fg=c(othercol,provcol)[colIndex+1];

+ return(fg); }

> provname=c(“北京市”,”天津市”,”山西省”,”内蒙古自治区”,”安徽省”,”福建省”,”四川省”,”河南省”,”湖北省”,”湖南省”,”陕西省”

+ ,”河北省”,”辽宁省”,”广东省”,”山东省”,”上海市”,”江苏省”,”浙江省”)

>provcol=rep(c(“lightblue”,”blue”),c(11,7))

>plot(x,col=getColor(x,provname,provcol,”white”))

未定名.jpg

图中蓝色区域为第三类,浅蓝色区域为第二类,白色区域(港澳台除外)为第一类,即各个地域局限以上家产企业的发家水平通过颜色深浅反应出来。从舆图上可看出,局限以上家产企业发家的地域都在东部沿海一带,而较发家地域则在多处于中部地域,不发家地域主要是西南部和、西部和东北部地域。

投资发起:江西省处于第二类和第三类的困绕圈中,地理位置不错,却属于第一类,即其局限以上家产企业并不发家,实在令人匪夷所思,由于本人对江西省知之甚少,假如不思量其成长中存在的非凡坚苦,江西省很有成长潜力,可作为局限以上财富企业进军的工具。福建省也可以进一步成长,究竟处于沿海地域,又邻接台湾。尚有就是海南省,作为一个成长资历很浅的省份,其局限以上财富企业并不发家,但由于紧邻广东,三面环海,地理位置绝佳,国度连年来重点成长海南省,长短常高瞻远瞩的,小我私家以为海南省是最富有投资潜力的

关联阐明(by陈文忆)

    关键字:

在线提交作业