x具有相同长度的列表,比如data.frame和data.table等;file输出文件名,""意味着直接输出到操作台;append如果TRUE,在原文件的后面添加;quote如果"auto",因子和列名只有在他们需要的时候才会被加上双引号,例如该部分包括分隔符,或者以"\n"结尾的一行,或者双引号它自己,如果FALSE,那么区域不会加上双引号,如果TRUE,就像...
由于业务中接触的数据量很大,于是不得不转战开始寻求数据操作的效率。于是,data.table这个包就可以很好的满足对大数据量的数据操作的需求。
data.table: meltKristian D. Olsen
melt:数据集的融合是将它重构为这样一种格式:每个测量变量独占一行,行中带有要唯一确定这个测量所需的标识符变量。 str(mydata) ## Classes 'data.table' and 'data.frame': 4 obs. of 4 variables: ## $ ID : num NA 1 2 2 ## $ Time: num 1 2 NA 1 ## $ X1 : num 5 3 NA 2 ## $ ...
melt函数可以将宽数据转化为长数据 dcast函数可以将长数据转化为宽数据 >DT=fread("melt_default.csv")>DTfamily_idage_motherdob_child1dob_child2dob_child31:1301998-11-262000-01-29NA2:2271996-06-22NANA3:3262002-07-112004-04-052007-09-024:4322004-10-102009-08-272012-07-215:5292000-12-052005-02...
结果一致,但data.table用的时间要少得多。 重塑data.table data.table扩展包为data.table对象提供了更强更快得dcast()和melt()函数。 例如将toy_tests的每个产品质量得分按照年和月进行对齐 代码语言:javascript 代码运行次数:0 运行 AI代码解释 toy_tests[, ym := substr(date, 1, 6)] toy_quality = dc...
melt()函数,可以用于宽表变长表,将变量(列名)变成分类变量的若干水平值。 melt()函数用法如下:melt(data, id.vars,measure.vars,variable.name= "variable",value.name= "value",na.rm=T) 案例数据集如下: set.seed(45) library(data.table) DT <- data.table(n_1=rep(c(1:4,NA),each=4), ...
melt函数可以将宽数据转化为长数据 dcast函数可以将长数据转化为宽数据 >DT=fread("melt_default.csv")>DTfamily_idage_motherdob_child1dob_child2dob_child31:1301998-11-262000-01-29NA2:2271996-06-22NANA3:3262002-07-112004-04-052007-09-024:4322004-10-102009-08-272012-07-215:5292000-12-052005-02...
data.table 一个R语言高性能数据处理包,一个包可以涵盖以上所说的数据处理的大部分内容,而且操作高度抽象化话(抽象化就意味着代码量少的可怕)。 其实很早就接触过data.table,之所以一直没有深入应用,因为它的理念与其他数据处理包偏离太远,可以说迁移成本很高,几乎就是技能重构而非迁移。
data.table 一个R语言高性能数据处理包,一个包可以涵盖以上所说的数据处理的大部分内容,而且操作高度抽象化话(抽象化就意味着代码量少的可怕)。 其实很早就接触过data.table,之所以一直没有深入应用,因为它的理念与其他数据处理包偏离太远,可以说迁移成本很高,几乎就是技能重构而非迁移。