《利用Python进行数据分析》中文第3版已出版,新版小鼹鼠亮相,对初学者更友好了。 购买链接 第三版多了41页内容,Pandas升级为1.4.0、Python升级为3.10。第三版最大的变化是紧贴Pandas升级,主要是新增了方法和特性的内容。另外,第三版有作者的在线开源电子版了,GitHub地址。 第三版目录略有调整,不如第二版和第...
你可以用我在GitHub上的wesm/pydata-book存储库中的笔记本进行尝试。见图2.3。 当你想关闭一个笔记本时,点击文件菜单,选择 "关闭和停止"。如果你只是简单地关闭浏览器标签,与该笔记本相关的Python进程将在后台继续运行。 虽然Jupyter 笔记本可能感觉与 IPython shell 截然不同,但本章中几乎所有的命令和工具都可以在...
另外,第三版有作者的在线开源电子版了,可以从GitHub地址和Gitee地址下载本书代码。 第三版目录略有调整,不如第二版和第一版的变化大: 第4章NumPy基础新增了生成伪随机数; 第7章数据清洗新增了扩展数据类型和分类数据,实际是把第二版中第12章的内容放到新版第7章里了; 第11章时间序列新增了分组时间重采样。
本书作者 Wes McKinney 是 Python pandas 项目的创始人。本书对 Python 数据科学工具的介绍既贴近实战又内容新颖,非常适合刚开始学习 Python 的数据分析师或刚开始学习数据科学和科学计算的 Python 程序员阅读。读者可以从 GitHub 获取数据文件和相关资料。
第三版多了41页内容,pandas升级为1.4.0、Python升级为3.10。第三版最大的变化是紧贴pandas升级,主要是新增了方法和特性的内容。另外,第三版有作者的在线开源电子版了,可以从GitHub地址和Gitee地址下载本书代码。 第三版目录略有调整,不如第二版和第一版的变化大: 第4章NumPy基础新增了生成伪随机数; 第7章数据...
第4章 NumPy基础:数组和矢量计算 82 NumPy的ndarray:一种多维数组对象 83 通用函数:快速的元素级数组函数 98 利用数组进行数据处理 100 用于数组的文件输入输出 107 线性代数 109 随机数生成 111 范例:随机漫步 112 第5章 pandas入门 115 pandas的数据结构介绍 116 ...
《利用Python进行数据分析》第二版. Contribute to jieseo/python-for-data-analysis development by creating an account on GitHub.
案例数据集可以在Github仓库找到,见第一章。 14.1 来自Bitly的USA.gov数据 2011年,URL缩短服务Bitly跟美国政府网站USA.gov合作,提供了一份从生成.gov或.mil短链接的用户那里收集来的匿名数据。在2011年,除实时数据之外,还可以下载文本文件形式的每小时快照。写作此书时(2017年),这项服务已经关闭,但我们保存一份数...
步骤6:提交合并请求到主分支 在GitHub上创建一个合并请求,将new_branch的修改请求合并到主分支。 3. 甘特图展示 利用Python进行数据分析第二版GitHub操作流程 通过以上步骤和代码实现,你就可以顺利地在GitHub上实现利用Python进行数据分析第二版的操作了。祝你成功!
如果你发现了一种本书或 pandas 库中没有的数据操作方式,请尽管在邮件列表或 GitHub 网站上提出。实际上,pandas 的许多设计和实现都是由真实应用的需求所驱动的。 在本章中,我会讨论处理缺失数据、重复数据、字符串操作和其它分析数据转换的工具。下一章,我会关注于用多种方法合并、重塑数据集。