R语言中的数据分析
当前位置:以往代写 > R语言教程 >R语言中的数据分析
2019-06-13

R语言中的数据分析

2006年Jim Portzak在关于 R 会议  介绍了带 R 的数据分析.他展示了如何使用网格和基础图形的组合来绘制数据的摘要面板。

data_profiling_porzak.png

不幸的是,代码尚未发布为软件包,因此当我最近需要在分析方案开始时快速查看几个数据集,我就开始寻找替代品。快速搜索显示了收购建议类似功能的两种选项:r2lUniv包装和描述 ()函数在杂项包装。


R2LGBIC

R2LGBIC包装通过计算每个变量的几个统计量(频率、中心度、离散度、图表),对单个变量或数据文件进行快速分析,并将结果以乳胶格式输出。输出根据变量类型而变化。

> library(r2lUniv)

可以指定要插入每个节前面的文本。

> textBefore <- paste("\\subsection{", names(mtcars),
+     "}", sep = "")
> rtlu(mtcars, "fileOut.tex", textBefore = textBefore)

The functionRTLUMainFile生成乳胶主文档设计,并允许进一步定制报告。

> text <- "\\input{fileOut.tex}"
> rtluMainFile("r2lUniv_report.tex", text = text)

然后可以将生成的 Tex 文件转换为 PDF。

> library(tools)
> texi2dvi("r2lUniv_report.tex", pdf = TRUE, clean = TRUE)

MPG-变量的示例输出:

data_profiling_r2lUniv.png

在此可以看到最终的 PDF 输出:r2lUniv_report.pdf.


杂项

所述的描述函数在HMISC 程序包确定变量是否为字符、因子、类别、二进制、离散数字和连续数字,并根据每个变量打印简明统计摘要。胶乳报告还包括显示频率计数的尖峰直方图。

> library(Hmisc)
> db <- describe(mtcars, size = "normalsize")

最简单和最快的方法是将结果打印到控制台。

> db$mpg
mpg
      n missing  unique    Mean     .05     .10     .25     .50
     32       0      25   20.09   12.00   14.34   15.43   19.20
    .75     .90     .95
  22.80   30.09   31.30

lowest : 10.4 13.3 14.3 14.7 15.0
highest: 26.0 27.3 30.4 32.4 33.9

可替换地,一个可以转换描述将对象插入到一个LateX文件中。

> x <- latex(db, file = "describe.tex")

猫用于生成 Tex-Report。

> text2 <- "\\documentclass{article}\n\\usepackage{relsize,setspace}\n\\begin{document}\n\\input{describe.tex} \n\\end{document}"
> cat(text2, file = "Hmisc_describe_report.tex")
> library(tools)
> texi2dvi("Hmisc_describe_report.tex", pdf = TRUE)

MPG-变量的示例输出:

data_profiling_describe.png

在此可以看到最终的 PDF-报告:Hmisc_describe_report.pdf.


结论

这两种功能都提供了类似的数据快照,但我更喜欢描述功能可用于更简洁的输出,也可用于期权将分析打印到控制台。同时我喜欢生成的摘要图r2lUniv由于标签的字体大小较小,我发现它们很难在 PDF-Report 中阅读

    关键字:

在线提交作业