R语言教程
R是用于统计分析、绘图的语言和操作环境
-
R语言教程之聚类分析Cluster Analysis 聚类分析 R具有用于聚类分析的多种功能。在本节中,我将介绍三种方法:层次聚合,分区和基于模型。尽管对于确定要提取的聚类数量的问题没有最佳解决方案,但下面给出了几种方法。 数据准备 在对数据进行聚类之前,您可能需要删除或估计缺失的数据并重新调整变量的可比性。 # Prepare Datamydata <- na.omit(mydata)... 继续阅读R语言教程之聚类分析Cluster Analysis
:2018-05-09
-
R语言教程之基于树的模型Tree-Based Models 递归分区是数据挖掘中的一个基本工具。它帮助我们探索一组数据的结构,同时开发易于可视化的预测分类(分类树)或连续(回归树)结果的决策规则。本节简要介绍CART建模,条件推理树和随机森林。 通过rpart进行CART建模 可以通过rpart包生成分类和回归树(如Brieman,Freidman,Olshen和Stone所述) 。有关rpa... 继续阅读R语言教程之基于树的模型Tree-Based Models
:2018-05-09
-
R语言教程之多维度缩放Multidimensional Scaling R提供了经典和非度量多维缩放的功能。假设我们有N个在p数字变量上测量的对象。我们想要用简洁(和可视化)的方式来表示物体之间的距离(即较低的k维空间)。 古典MDS 您可以使用cmdscale()函数执行经典的MDS 。 # Classical MDS# N rows (objects) x p columns (vari... 继续阅读R语言教程之多维度缩放Multidimensional Scaling
:2018-05-09
-
R语言教程之矩阵代数Matrix Algebra 本网站上的大多数方法实际上都描述了矩阵的编程。它深深植入R语言。本节将简单介绍特别适用于线性代数的运算符和函数。在继续之前,您需要查看数据类型和操作符上的部分。 矩阵facilites 在下面的例子中,A和B是矩阵,x和b是矢量。 操作员或功能 描述 A * B 元素明智的乘法 A%*%B 矩阵乘法 A%o%B 外部产品。A... 继续阅读R语言教程之矩阵代数Matrix Algebra
:2018-05-09
-
R语言教程之如何导入数据 将数据导入R非常简单。对于Stata和Systat,请使用外部软件包。对于SPSS和SAS,我会推荐使用Hmisc软件包来简化和实现功能。有关获取和安装这些软件包的信息,请参阅软件包上的Quick-R部分。下面提供了导入数据的示例。 从逗号分隔的文本文件 # first row contains variable names, comma is separator #... 继续阅读R语言教程之如何导入数据
:2018-05-10
-
R语言教程之序列处理 Biostrings最后一节,介绍模式匹配和序列比对的相关函数和操作。下面我们使用拟南芥基因转录起始点上游1kb的序列进行分析。序列文件可以从TAIR网站(http://www.arabidopsis.org)下载。先用readDNAStringSet函数从FASTA文件中读取序列并查看头2个序列的信息: library(Biostrings) upstream.1k ... 继续阅读R语言教程之序列处理
:2018-05-24
-
R语言教程之调色板的使用 1 R预设的调色板 这一系列函数有5个,即: rainbow heat.colors terrain.colors topo.colors cm.colors 在R环境外面输出问号(?)和下面任一函数名就可以取得这5个函数的用法阐明。这些函数最少需求一个参数,n,表示要失掉颜色的数量。n在零碎允许范围内没无限制。上面用彩虹色彩色板函数rainb... 继续阅读R语言教程之调色板的使用
:2018-05-24
-
R语言教程之各种金融数学公式及表达式汇总 在R语言的绘图函数中,如果文本参数是合法的R语言表达式,那么这个表达式就被用Tex类似的规则进行文本格式化。 y <- function(x) log(x) + sqrt(x) + x^(1/3)plot(y, 1, 1000, main = expression(y == log(x) + sqrt(x) + sqrt(x, 3)), lwd ... 继续阅读R语言教程之各种金融数学公式及表达式汇总
:2018-05-24
-
R语言教程之序列处理 Biostrings最后一节,介绍模式匹配和序列比对的相关函数和操作。下面我们使用拟南芥基因转录起始点上游1kb的序列进行分析。序列文件可以从TAIR网站(http://www.arabidopsis.org)下载。先用readDNAStringSet函数从FASTA文件中读取序列并查看头2个序列的信息: library(Biostrings) upstream.1k ... 继续阅读R语言教程之序列处理
:2018-05-24
-
R语言教程之实现地图 方法简介 我们以加拿大的13个省级行政单位的GDP增长率为例,绘制GDP的空间分布填色图。大致思路如下:我们先把省份 – 地理坐标对应关系找到。接着,准备好2015-16年的各省GDP年增长率,随后将其与地图中的每个省一一匹配,做成GDP – 省份的对应关系。这样GDP就可以经由省份对应到地理位置上。最后根据增速快慢赋予每个省不同的颜色。 准备工作 我们需要先下载加拿... 继续阅读R语言教程之实现地图
:2018-05-25