data(heights)# 将数据转换为data.table对象heights<-setDT(heights) 在data.table中,我们可以使用.()函数来直接访问相应的变量。因此我们可以在原来dplyr中简化代码如下 s<-heights[,.(average=mean(height),standard_deviation=sd(height))]s A data.table: 1 × 2 下面假设我们要查询女性的平均身高和标准差 ...
1、首先下载安装data.table包 install.packages(data.table) > library(data.table) 利用fread函数导入数据,在data.table包支持使用fread函数从本地或者web上导入数据,功能相当于base包的read.csv。 > train<-fread("~/Desktop/train2.csv") Read 125497040 rows and 6 (of 6) columns from 4.654 GB file in...
进行统计分析时,`data.table`支持数据列重命名、排序、添加新列、数据统计与整合、对部分数据计算以及分组计算等操作。虽然dplyr也提供了类似功能,但`data.table`的计算速度更快,语句也更简洁。🔍 数据合并 `data.table`的合并操作与`data.frame`相似,支持四种合并方式,操作简便。🔍 DT包:更直观的展示 R包DT...
data.table的语法形式是: DT[i, j, by] 1. 指定参数i: * 类似于data.frame,我们可以subset行,除非不需要重复地使用 DT$,既然我们能将列当做变量来引用。 * 我们可以使用order()排序。为了得到更快速的效果,order()函数内部使用了data.table的快速排序。 我们可以通过参数i做更多的事,得到更快速的选取和连结。
Keys在data.table中是一个重要的概念,在一个data.table中只能设置一个key,但是这一个key可以包含多个列。当我们设置好key后,data.table会将数据按照key来排序。 # 选取第二行 dt[2,] # 选取speed=4 的行 dt[speed==4] # 更快,更简单的表达
as.data.table(x, keep.rownames=FALSE, ...) 将一个R对象转化为data.table,R可以时矢量,列表,data.frame等,keep.rownames决定是否保留行名或者列表名,默认FALSE,如果TRUE,将行名存在"rn"行中,keep.rownames="id",行名保存在"id"行中。
DT=data.table(x=rep(c("b","a","c"),each=3),y=c(1,3,6),v=1:9)DT[2]#取第二行 DT[2:3]#取第二到第三行 DT[order(x)]#将DT按照X列排序,简化操作,另外排序也可以setkey(DT,x),出来的DT就已经是按照x列排序的了。用haskey(DT)判断DT是否已经设置了key,可以设置多个列作为key ...
之前和鲸社区的作者创作了有关R语言数据分析相关的项目 R语言数据处理120题,有小伙伴表示data.frame不如data.table给力,行了行了,这就安排!我们邀请了和鲸社区创作者@黄凯 老师,对照着国外某网站的教程 101 R…
第二部分练习题:使用data.table完成下列操作 rm(list=ls())library(data.table)head(airquality)air<-data.table(airquality)class(airquality)setkey(air,Wind)#排序Wind,其实设置key就是排序head(air)air[!is.na(Ozone),]#太饿了,没时间琢磨了air[,list(Ozone,Wind,Temp,Month,Day,Value=Ozone/Wind)]setke...