plyr包是Hadley Wickham大神为解决split – apply – combine问题而写的一个包,其动机在与提供超越for循环和内置的apply函数族的一个一揽子解决方案。使用plyr包可以针对不同的数据类型,在一个函数内同时完成split – apply – combine三个步骤。plyr 的功能已经远远超出数据整容的范围,Hadley在plyr中应用了split-apply...
plyr提供了灵活的合并方式,使用户可以根据需要将结果合并为数据框、列表或其他形式。 plyr包的强大之处在于它的高性能和可扩展性。通过内部使用C++代码和并行计算技术,plyr能够高效地处理大规模数据集和复杂的操作任务。它还支持用户自定义的函数,使用户能够根据自己的需求进行灵活的数据处理。 要使用plyr包,可以在R中...
plyr包是apply家族函数的升级版本,使用plyr包可以实现:在一个函数内同时完成“Split - Apply - Combine”,并且,plyr包实现R类型(vector, list, data.frame)之间的分组变换,基本上可以取代Base包中的apply家族函数。 plyr包对核心函数的命名采用统一的格式:**ply,所有的函数名都由5个字符组成,且最后三个字符是ply...
plyr包 plyr是一个解决共同问题的工具;将一个大的数据结构分为若干个均等的小数据集,每个数据集使用同样的函数处理,组合并返回所有小数据集的结果。 R的基础包也提供一些分裂和组合的函数组,但使用plyr会更简单快速。但也有局限性 数据拆分成不重复的小数据集,但数据需要重复使用时就不能使用 主函数介绍 输入有...
plyr包核心函数 plyr包16个核心函数的命名都有相应的规律,函数具体形式如XXply,第一个X表示输入的R数据类型,第二个X表示需要输出的R数据类型,具体X的取值主要有: a:array d:data.frame l:list m:multiple inputs _:nothing 比如说adply就表示输入为数组结构输出为数据框形式,dlply就表示输入为数据框形式输出为...
ddply()函数是plyr包中用于对data.frame结构的数据做处理的函数,其结果也是data.frame。ddply的参数列表如下: ddply(.data, .variables, .fun = NULL, ..., .progress = "none", .inform = FALSE, .drop = TRUE, .parallel = FALSE, .paropts = NULL) 各部分...
plyr包是Hadley Wickham为解决split – apply – combine问题而写的一个包,其动机在与提供超越for循环和内置的apply函数族的一个一揽子解决方案。使用plyr包可以针对不同的数据类型,在一个函数内同时完成split – apply – combine三个步骤,以实现最大限度的高效和简洁。
使用plyr包进行数据处理 本文将着重介绍一下同一个作者开发的plyr包,该包与dplyr包既有相似的地方,也有不同的地方。plyr包最让我兴奋的地方是可以方便的实现数据结构之间的转换,具体见下文的详细说明。 首先看一张表格: 这张表格的蓝色三行为输入的数据结构,蓝色四列为输出的数据结构,红色为R函数,均已ply结尾,...
plyr包的使用 apply lapply和sapply,lapply和llply mapply Plyr软件包集中体现了“分离-操作-结合”的数据操作理念。 它的核心函数有ddply, llply和lapply函数构成,函数名的第一个字母代表输入值的类型,第二个字母代表输出值的类型。 install.packages('plyr')...
ddply()函数是plyr包中用于对data.frame结构的数据做处理的函数,其结果也是data.frame。ddply的参数列表如下: ddply(.data, .variables, .fun = NULL, ..., .progress = "none", .inform = FALSE, .drop = TRUE, .parallel = FALSE, .paropts = NULL) 各部分...