其他教程
其他教程包括金融和计算机...
-
R画图基本(五)文氏图vennDiagram 文氏图是一种非经常用的图示手段,主要用于显示组与组之间重叠的水平。 R傍边可以画文氏图的包有好几个,利用起来各有特点。最原始的东西,来自于2004年的《Venn Diagrams in R》–Duncan J.Murdoch, Journal of Statistical Software. 可是,此刻已经无法找到venn包了。 之后利用得较为遍及... 继续阅读R画图基本(五)文氏图vennDiagram
:2017-12-04
-
用 OpenBLAS 加快 R 的矩阵运算 话说 2010 年我和鸟兄去豆瓣做一个技能交换,阿稳现场展示了并行化计较的 R 情况,矩阵运算瞬间跑满了所有的 CPU,其时让我羡慕不已。多年之后在 第六届 R 语言集会会议 上,张先轶为各人展示了他们认真跟进研发的开源线性代数计较库 OpenBLAS,这个库成立在已经遏制开拓的 GotoBLAS2 上,对 Intel Sandy Bridge 有很... 继续阅读用 OpenBLAS 加快 R 的矩阵运算
:2017-12-04
-
Advanced Graphs(高级图形)二 3.组合绘制R 通过par( ) 可能layout( )函数让多个画图组合成一个总的图表事情变得很简朴.通过 the par( ) 函数, 你可以包罗选项 mfrow=c(nrows, ncols) 来建设一个通过行填充nrows x ncols 矩阵平面图. mfcol=c(nrows, ncols) 通过列来填充矩阵. # 4个2行2列布置的图... 继续阅读Advanced Graphs(高级图形)二
:2017-12-04
-
操作R的glm函数举办卵白质“热点”氨基酸的模子预测 生物信息学是一门较量新兴学科,并且保罗万象。主要的事情会合于对DNA序列的数据,卵白质氨基酸序列信息举办阐明事情(包罗软件开拓,算法创新等)而对卵白质三维布局的信息的阐明也是个中之一。 由于卵白质的三维布局简直定需要比DNA序列测序,卵白质序列测序更为巨大的尝试完成,因此有关数据会越发稀少,而且各人也都在摸索如何通过测定... 继续阅读操作R的glm函数举办卵白质“热点”氨基酸的模子预测
:2017-12-04
-
用R阐明王宝强微博事件 针对微博上的热点事件,你是否想本身动手做个数据阐明?为了简化阐明进程,数据化阐明建造了一个免费开源的R包【https://github.com/sjhfx/rwda】,名字叫rwda,即R Weibo Data Analysis的首字母缩写。本文通过一个案例,先容微博数据阐明的功效和实现要领。1、案例阐明以王宝强2016年8月14日发的仳离声明微博为例,选取最近的评论内... 继续阅读用R阐明王宝强微博事件
:2017-12-04
-
手把手教你利用R语言的主身分阐明对城管事件数据阐明 观念性的对象就不说那么多了,这次利用主身分阐明主要目标并不是降维,而是阐明城管数据中的事件种别之间是否存在干系,虽然,城管事件范例有好几百,这里就只选取从去年九月到今朝产生量前十的事件种别;如下图,排名前十的事件种别依次为,车辆乱停放,乱堆物料堆,犯科张贴小告白,店肆出店策划,自备容器外放,违规口号宣传品,灵活车乱停放,袒露垃圾,地面不洁,阶... 继续阅读手把手教你利用R语言的主身分阐明对城管事件数据阐明
:2017-12-04
-
做数据阐明必需学R的4个来由 R 是一种机动的编程语言,专为促进摸索性数据阐明、经典统计学测试和高级图形学而设计。R 拥有富厚的、仍在不绝扩大的数据包库,处于统计学、数据阐明和数据挖掘成长的前沿。R 已证明本身是不绝生长的大数据规模的一个有用东西,而且已集成到多个商用包中,好比 IBM SPSS® 和 InfoSphere®,以及 Mathematica。本文提供了一位统计学家Catherin... 继续阅读做数据阐明必需学R的4个来由
:2017-12-04
-
R画图基本(二)点柱图(dot histogram) 在之前的一节傍边,图型名称有些杂乱,从这一节开始将做如下统一(不全面): 英文名称 中文名称 bar 条形图 line 线图 area 面积图 pie 饼图 high-low 坎坷图 pareto 帕累托图 control 节制图 boxplot 箱线图 error bar 误差条图 scatte... 继续阅读R画图基本(二)点柱图(dot histogram)
:2017-12-04
-
R中的极大似然预计 1. 数据与模子 我们要利用的数据来自于“MASS”包中的geyser数据。先把数据调出来,看看它长什么样子。 > geyser waiting duration 1 80 4.0166667 2 71 2.1500000 3 57 4.0000000 4 80 4.0000000 5 ... 继续阅读R中的极大似然预计
:2017-12-04
-
R语言利器之ddply ddply()函数位于plyr包,用于对data.frame举办分组统计,与tapply有些雷同 # 利用stringsAsFactors=F来防备data.frame把向量转为factor apache = data.frame(httpCode=c(200,200,200,404,404,500), time=c(100,... 继续阅读R语言利器之ddply
:2017-12-04