炼数成金 门户 商业智能 R语言 查看内容

如何在RStudio中预览数据

2017-9-22 14:17| 发布者: 炼数成金_小数| 查看: 17407| 评论: 0|原作者: 师爷|来自: 知乎
摘要: RStudio有数据预览功能,能够一目了然的查看数据和数据结构,并且能够做简单的数据分析,更容易理解如何在R中整理数的过程。正如需求,你可以对数据的列进行排序,只需要点击数据的对应列,然后点击字段名,自由切换 ...
工具 数据分析 商业智能 ETL plyr 脚本
简介
RStudio有数据预览功能,能够一目了然的查看数据和数据结构,并且能够做简单的数据分析,更容易理解如何在R中整理数的过程。

开始预览
可以在控制台调用View函数来请求数据预览,例如:
>data(iris)
>view(iris)
你也可以在右侧的environment框中点击数据标志:

排序
正如需求,你可以对数据的列进行排序,只需要点击数据的对应列,然后点击字段名,自由切换排序方式。
想删除排序,点击右上角空白单元格。

筛选
为了过滤,点击过滤的标志,只要显示all都可以筛选,点击box,然后选点你需要的数据范围,例如下图sepal大于3.6
注意下面的文字提示,显示的是筛选后的数据,以上实例中数据集有150个数据记录,经过筛选剩下135个数据集,只1-9个显示。

不是所有的数据字段都可以筛选,一下数据类型支持筛选:
数字型
字符型
因子型(最多256个水平)
布尔型
不同列进行筛选,得到的结果是符合双重条件的交集。

删除一个筛选器点击筛选器旁边的x,如果想清除所有的筛选器,点击工具栏的筛选器。

查询
你可以通过全局查询来对所有的数据进行查询。
此功能支持模糊查询,不仅仅支持字符查询,而且可以对数字型和布尔型的模糊查询。
查询和筛选可以叠加的,结果是查询和筛选的交集。

深入了解
自动刷新
在大多数情况下,viewer会自动保存更新,例如:
> data(Orange) > View(Orange) > Orange[1, "age"] <- 120你可以看到数据由118变成120
如下情况下不能自动保存更新:
数据只是copy,但是没有更新
变量必须在全局环境能够找到

标签
支持为列增加标签的功能,正如Hmisc包的功能:
> library(Hmisc) > data(women) > label(women[[1]]) <- "Woman's Height" > label(women[[2]]) <- "Woman's Weight" > View(women)
有如上效果。

限制与性能
展现数据的数量是无限的,展现速度也不会因为数据量大而减缓速度,例如datatables的Java脚本规则,在当下只有一小部分数据被上载。
若行无限制,那么列最多有100列,行展示的规则在列方向是无效的,如果列多了,那么会导致加载数据能力大大下降。
最终,当追求速度极致遭遇大量数据,那么会导致延缓的局限性,为了满足R的浏览功能,我们作用大量数据,尽量采取筛选器来提高整体性能。

保存筛选结果
在当下,不能抽取当下数据作为R的对象,或者保存当下的脚本操作,viewer的作用是可视化的提高预览功能,而不是作为数据操作。
如果想做数据操作,请参考dplyr脚本。

欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754

鲜花

握手

雷人

路过

鸡蛋

相关阅读

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

  GMT+8, 2017-12-15 08:46 , Processed in 0.145051 second(s), 25 queries .