R语言教程
当前位置| > 博客

R语言教程

R是用于统计分析、绘图的语言和操作环境
  • R语言教程之聚类分析Cluster Analysis 聚类分析 R具有用于聚类分析的多种功能。在本节中,我将介绍三种方法:层次聚合,分区和基于模型。尽管对于确定要提取的聚类数量的问题没有最佳解决方案,但下面给出了几种方法。 数据准备 在对数据进行聚类之前,您可能需要删除或估计缺失的数据并重新调整变量的可比性。 # Prepare Datamydata <- na.omit(mydata)... 继续阅读R语言教程之聚类分析Cluster Analysis

    :
    2018-05-09
  • R语言教程之基于树的模型Tree-Based Models 递归分区是数据挖掘中的一个基本工具。它帮助我们探索一组数据的结构,同时开发易于可视化的预测分类(分类树)或连续(回归树)结果的决策规则。本节简要介绍CART建模,条件推理树和随机森林。 通过rpart进行CART建模 可以通过rpart包生成分类和回归树(如Brieman,Freidman,Olshen和Stone所述) 。有关rpa... 继续阅读R语言教程之基于树的模型Tree-Based Models

    :
    2018-05-09
  • R语言教程之矩阵代数Matrix Algebra 本网站上的大多数方法实际上都描述了矩阵的编程。它深深植入R语言。本节将简单介绍特别适用于线性代数的运算符和函数。在继续之前,您需要查看数据类型和操作符上的部分。 矩阵facilites 在下面的例子中,A和B是矩阵,x和b是矢量。 操作员或功能 描述 A * B 元素明智的乘法 A%*%B 矩阵乘法 A%o%B 外部产品。A... 继续阅读R语言教程之矩阵代数Matrix Algebra

    :
    2018-05-09
  • R语言教程之如何导入数据 将数据导入R非常简单。对于Stata和Systat,请使用外部软件包。对于SPSS和SAS,我会推荐使用Hmisc软件包来简化和实现功能。有关获取和安装这些软件包的信息,请参阅软件包上的Quick-R部分。下面提供了导入数据的示例。 从逗号分隔的文本文件 # first row contains variable names, comma is separator #... 继续阅读R语言教程之如何导入数据

    :
    2018-05-10
  • R语言教程之序列处理 Biostrings最后一节,介绍模式匹配和序列比对的相关函数和操作。下面我们使用拟南芥基因转录起始点上游1kb的序列进行分析。序列文件可以从TAIR网站(http://www.arabidopsis.org)下载。先用readDNAStringSet函数从FASTA文件中读取序列并查看头2个序列的信息: library(Biostrings) upstream.1k ... 继续阅读R语言教程之序列处理

    :
    2018-05-24
  • R语言教程之调色板的使用 1 R预设的调色板 这一系列函数有5个,即: rainbow heat.colors terrain.colors topo.colors cm.colors 在R环境外面输出问号(?)和下面任一函数名就可以取得这5个函数的用法阐明。这些函数最少需求一个参数,n,表示要失掉颜色的数量。n在零碎允许范围内没无限制。上面用彩虹色彩色板函数rainb... 继续阅读R语言教程之调色板的使用

    :
    2018-05-24
  • R语言教程之序列处理 Biostrings最后一节,介绍模式匹配和序列比对的相关函数和操作。下面我们使用拟南芥基因转录起始点上游1kb的序列进行分析。序列文件可以从TAIR网站(http://www.arabidopsis.org)下载。先用readDNAStringSet函数从FASTA文件中读取序列并查看头2个序列的信息: library(Biostrings) upstream.1k ... 继续阅读R语言教程之序列处理

    :
    2018-05-24
  • R语言教程之实现地图 方法简介 我们以加拿大的13个省级行政单位的GDP增长率为例,绘制GDP的空间分布填色图。大致思路如下:我们先把省份 – 地理坐标对应关系找到。接着,准备好2015-16年的各省GDP年增长率,随后将其与地图中的每个省一一匹配,做成GDP – 省份的对应关系。这样GDP就可以经由省份对应到地理位置上。最后根据增速快慢赋予每个省不同的颜色。 准备工作 我们需要先下载加拿... 继续阅读R语言教程之实现地图

    :
    2018-05-25