R语言逐行读取并处理惩罚大文件
用R语言作阐明时,有时候需要逐行处理惩罚很是大文件,各类课本中推荐的read.table 和scan都是一次性读入内存,假如文件有好几个Gb巨细,一般电脑必定吃不用。其实R中可以逐行读取的行数,这里示例一个函数,作为备忘:
con <- file(“e:/data.txt”, “r”)
line=readLines(con,n=1)
while( length(line) != 0 ) {
}
close(con)
假如需要将一行的文字劈成多段,再举办处理惩罚,可以用strsplit函数,除此之外,尚有一些常用的字符串处理惩罚函数,记录如下:
substr(),nchar(), grep(), regexpr(), sub(), gsub()