He builds tools (both computational and cognitive) that make data science easier, faster, and more fun. His work includes packages for data science (ggplot2, dplyr, tidyr), data ingest (readr, readxl, haven), and principled software development (roxygen2, testthat, devtools). He is also ...
ggplot(data = mpg) + geom_smooth( mapping = aes(x = displ, y = hwy, color = drv), show.legend = FALSE )要想在同一张图中显示多个几何对象,可以向 ggplot() 函数中添加多个几何对象函数:ggplot(data = mpg) + geom_point(mapping = aes(x = displ, y = hwy)) + geom_smo...
ggplot(data=mpg)+geom_point(mapping=aes(x=displ,y=hwy,size=class))#>Warning:Using sizefora discrete variable is not advised. 可以看到这种图是很难区分各种汽车类型的,而且运行这个代码时,也有消息提醒不推荐使用点的大小来表示离散变量。其实这种美学映射在生信中用的很多,例如单细胞分析包Seurat的DotPlot...
要想通过单个变量对图进行分面,可以使用函数facet_wrap()。其第一个参数是一个公式,创建公式的方式是在 ~ 符号后面加一个变量名(这里所说的“公式”是R中的一种数据结构,不是数学意义上的公式)。传递facet_wrap()的变量应该是离散型的。ggplot(data = mpg) + geom_point(mapping = aes(x = displ, ...
R for Data Science 作者:Hadley Wickham/Garrett Grolemund 出版社:O'Reilly Media 副标题:Import, Tidy, Transform, Visualize, and Model Data 出版年:2016-12-25 页数:518 定价:USD 39.99 装帧:Paperback ISBN:9781491910399 豆瓣评分 9.4 292人评价
翻译《R for Data Science》-chapter 1-1.1 毛琦 《Geocomputation with R》第三章参考答案 作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量、机器学习、数据可视化、应用统计… HopeR发表于R语言数据... 推荐| 经典R...
not_cancelled %>%group_by(year, month, day) %>%summarize(first = min(dep_time),last = max(dep_time))#> Source: local data frame [365 x 5]#> Groups: year, month [?]#>#> year month day first last#> <int> <int> <int> <int> <int>#> 1 2013 1 1 517 2356#> 2 2013 1...
R语言学习--R for Data Science(一) 这篇文章作为R语言学习系列的开篇,记录一下我的想法。 刚开始接触R语言是因为单细胞数据分析的需要,那时完全是零基础,学习过程是边抄别人的代码,边理解这些代码的含义,遇到了比较多的坑,包括软件安装,环境配置,R包安装,代码换了参数就报错等。这种纯实战虽然可以快速“上手”...
R学习:R for Data Science 向量(2)公众号:生信小课堂 使用原子向量 我们已经弄清楚了不同类型的原子向量间的差别,接下来将讨论处理原子向量的几种重要操作,具体如下。 • 如何将一种原子向量转换为另一种,以及何时系统会自动转换。 • 如何分辨出一个对象是哪种特定类型的向量。 • 在处理长度不同...
《R for Data Science》书籍资料分享 前言 数据分析是我们学习最最重要的学会的技能,尤其是使用R或python进行数据分析,如果你没有数据分析的思维,你后续的分析是非常难做的,以及无法进行下去。 对于我自己来说,R语言的数据处理这块还是比较困难的,因此,自己的都是提前准备好分析的数据,然后进行分析。因此,在此过程...