R语言:办理“大数据”时代统计需求
北京时间9月2日动静,据海外媒体报道,数字数据大爆炸催生了存储、处事并阐明千兆位数据的技能,因而也为统计规模的专业人才制造了大量时机。当前越来越多统计人才都接管过R语言(一种开源的统计编程语言)培训。
R语言在20世纪90年月成长起来,并且已经成为事实上的计较统计学(Computational Statistics)和预测阐明的尺度,它今朝拥有高出200万用户。R语言之所以被遍及回收,部门原因在于不懂其他编程语言的统计人员也可以操作它举办巨大的阐明。另外,作为开源项目,R语言勉励用户添加代码,今朝有2000多人常常编写R语言软件包,而其他人可以操作这些软件包来举办特定的数据阐明。
SPSS(Statistical Package for the Social Sciences,社会科学统计软件包)的发现者诺曼·奈伊(Norman Nie)说: “没有什么统计观念是R不能表示的。” 诺曼·奈伊此刻是阐明力革命公司(Revolution Analytics)公司的首席执行官,这家公司为企业和学术客户提供R语言的开放焦点变体。
阐明力革命公司将R语言带入“大数据”时代
8月初,阐明力革命公司宣布了“革命R语言企业软件包”(Revolution R Enterprise package)的新版本。新版本包括一个名为RevoScaleR的附加软件包,它是为用户处理惩罚千兆级数据集而专门设计和优化的,可办理尺度R语言软件包常碰着的内存屏障问题。并且它还针对“大数据”(big data)将遍及利用的统计较法举办了优化。
今朝,用户可以用R语言举办呼吁行编程。但阐明力革命公司打算在2011年头宣布一个加强的图形用户界面,以便让这些统计东西更洪流平地开源。
企业统计软件东西曾经仅仅在金融和制药行业内利用。可是对许多其他行业(好比零售、游戏、信息处事和娱乐业)而言,数据挖掘、贸易智能和统计阐明也正在变为较为常见的业务勾当。
固然SAS公司声称它仍然是贸易智能规模的领头羊,奈伊说,当前得到高级学位的统计专业结业生都接管过R语言培训,这导致了环绕R语言的很是强大的生态系统的形成。阐明力革命公司但愿能在统计规模中的学术界和企业界之间架设起桥梁。