R语言编程入门之输入与输出
如同ATM机一样,你首先得输入银行卡,才气输出获得钞票。数据阐明也是如此,输入输出数据在阐明事情中有重要的职位。下面临R语言中一些重要的输入输出函数举办小结,而其它的函数请参考官方指南。
1 读取键盘输入
假如只有很少的数据量,你可以直接用变量赋值输入数据。若要用交互方法则可以利用readline()函数输入单个数据,但要留意其默认输入格为字符型。scan()函数中假如不加参数则也可以用来手动输入数据。假如加上文件名则是从文件中读取数据。
2 读取表格文件
读取当地表格文件的主要函数是read.table(),个中的file参数设定了文件路径,留意路径中斜杠的正确用法(如”C:/data/sample.txt”),header参数设定是否带有表头。sep参数设定了列之间的隔断方法。该函数读取数据后将存为data.frame名目,并且所有的字符将被转为因子名目,假如你不想这么做需要记得将参数stringsAsFactors设为FALSE。与之雷同的函数是read.csv()专门用来读取csv名目。
假如是想抓去网页上的某个表格,那么可以利用XML包中的readHTMLTable()函数。譬喻我们想得到google统计的会见最多的1000名网站数据,则可以象下面这样做。关于这个函数可以参考这篇博文。
url <- ‘http://www.google.com/adplanner/static/top1000/’3 读取文本文件
data <- readHTMLTable(url)
names(data)
head(data[[2]])
有时候需要读取的数据存放在非布局化的文本文件中,譬喻电子邮件数据或微博数据。这种环境下只能依靠readLines()函数,将文档转为以行为单元存放的list名目。譬喻我们但愿读取wikipedia的主页html文件的前十行。
data <- readLines(‘http://en.wikipedia.org/wiki/Main_Page’,n=10)
别的,scan()也有富厚的参数用来读取非布局化文档。
4 批量读取当地文件
在批量读取文档时一般先将其存放在某一个目次下。先用dir()函数获取目次中的文件名,然后用paste()将路径合成,最后用轮回或向量化要领处理惩罚文档。譬喻:
doc.names <- dir(“path”)
doc.path <- sapply(doc.names,function(names) paste(path,names,sep=’/’))
doc <- sapply(doc.path, function(doc) readLines(doc))
5 写入文件
write.table()与write.csv()函数可以很利便的写入表格型数据文档,而cat()函数除了可以在屏幕上输出之外,也可以或许输出成文件。
别的若要与MySQL数据库互换数据,则可以利用RMySLQ包。