对于R语言初学者来说,tidyverse系列是学习使用R的最佳起点,而data.table包则对中高级用户大有助益。另外,本书对重要的“工具”函数,例如循环和迭代,做了较为详尽的解释和代码演示,来帮助读者理解其运行机制。最后,书中提供了5个实战案例,结合书中介绍的各种“工具”,强化使用R语言进行数据分析的路线图。
对于R语言初学者来说,tidyverse系列是学习使用R的最佳起点,而data.table包则对中高级用户大有助益。另外,本书对重要的“工具”函数,例如循环和迭代,做了较为详尽的解释和代码演示,来帮助读者理解其运行机制。最后,书中提供了5个实战案例,结合书中介绍的各种“工具”,强化使用R语言进行数据分析的路线图。
书名:R数据科学实战:工具详解与案例分析 作者:刘健,邬书豪 出版社:机械工业出版社 出版时间:2019-06 ISBN:9787111629948 刘健 邬书豪 作家的话 去QQ阅读支持我 还可在评论区与我互动 打开QQ阅读 上QQ阅读看本书,第一时间看更新 推荐语 本书不是晦涩难懂的学术教材,而是具备极高实践价值的R语言工具书,每章都...
第七列中的数据在指定将空白替换成“NA”之后,原有的空白位置被写入了“NA”,也就是说第七列的空白属于数据的一部分。根据实际情况,也可以将多余的数据部分或全部替换成“NA”(如表1-11所示),以方便后续的处理及分析,代码如下: > flights_uneven <- read.table("flights_uneven.csv",sep = "\t", string...
R数据科学实战:工具详解与案例分析 刘健 邬书豪 著 第1章 数据导入工具 无论数据分析的目的是什么,将数据导入R中的过程都是不可或缺的。毕竟巧妇难为无米之炊。所以本章主要介绍如何选择合适的包,将不同类型的数据文件导入R中。学习完本章的内容之后,读者将会获得以下技能。
1.1.3 read.table—任意分隔符数据读取 read.table函数会将文件读成数据框的格式,将分隔符作为区分变量的依据,把不同的变量放置在不同的列中,每一行的数据都会对应相应的变量名称进行排放。表1-1简要列出了read.table函数中主要参数的中英文对照。 表1-1 函数read.table实用参数及功能对照 ...
在datasets.xlsx中一共存在四个工作表,其中包含了四个最经典的R语言练习数据集。在此,希望读者可以自行浏览这几个数据集,对数据集的格式、变量名称等情况有一定程度的了解,在后续的章节中,笔者还会引用这几个数据集。 增加参数sheet或range可以读取指定工作表中的数据。这里需要注意的是,表1-14中提到了参数优先级...
【摘要】 本节书摘来自华章计算机《R数据科学实战:工具详解与案例分析》 一书中第二章,第2.4.1节,作者刘 健 邬书豪 。 2.4 lubridate日期时间处理 2.4.1 为什么使用lubridate 通常传感器记录的数据,是为了避免闰年导致的种种稀奇古怪的错误,纯数字形式的日期格式很常见(例如19710101或儒略日)。这些纯数字形式日期的...
【摘要】 本节书摘来自华章计算机《R数据科学实战:工具详解与案例分析》 一书中第一章,第1.2节,作者刘 健 邬书豪 。 1.2 readr—进阶数据读取 'readr'包是R语言世界级大神之一Hadley Wickham 主导开发的一个数据读取包。相较于'utils' 包里的读取函数,'readr'包主要拥有3点优势,具体如下。
tibble包的存在就是为了给数据清理及后续的分析提供一个最佳的起点。tibble既是R包的名字也是数据在R中的一种存储格式。可以将tibble包理解为R中最常见的data.frame(数据框)格式的升级版。像下列代码所示,如果使用read.csv读取数据,那么数据会被存储在data.frame(数据框)格式中。但是当调用read_csv时,数据就会存在...