R语言玩数据抽样教程
![](http://img.shujuren.org/pictures/61/59e9f71eed3e8.png)
最简朴和常用的要领就是利用sample函数,它可以对一个向量做随机抽样。
函数形态:
“`
sample(x, size, replace = FALSE, prob = NULL)
“`
参数描写:
x-方针工具
size-抽样的数量
replace-是否放回抽样,默认值是FALSE,暗示不放回抽样
prob-抽样的概率向量配置
举例说明:
“`
x <- 1:10
## 不放回抽样
set.seed(100)
sample(x, 8)
## 有放回抽样
set.seed(100)
sample(x, 8, replace = TRUE)
“`
功效
4 3 5 1 9 6 10 2
4 3 6 1 5 5 9 4
配置随机种子,保重尝试的可反复性。
若是需要针对矩阵框,随机抽取一些样本,如何实现呢?
可以先随机获取这些样本行号,然后操作这些行号获取对应的样本。
举例说明
“`
data(iris)
set.seed(100)
sample.row <- sample(1:nrow(iris), 10)
sample.row
sample.iris <- iris[sample.row, ]
View(sample.iris)
“`
功效
![](http://img.shujuren.org/pictures/9A/59be7899be604.png)
至于更巨大的抽样,例如说分层抽样,整群抽样,最大熵抽样,可以在**sampling包**中找到相应要领实现。
您在阅读中,有什么发起可能想法,请参加评论。
想插手圈子,请加微信。