本书的特色是用传统的电子表格处理数据不仅效率低下,而且不能处理特定格式的数据,对于混乱和庞大的数据集更是无能为力。 本书教您如何使用语法简单、使用方便的Python轻松处理数据。 作者通过分阶段练习,如何有效地获取、清洗、分析和呈现数据,如何自动化数据处理过程,如何安排文件编辑和清洗任务,如何处理更大的数据集,如何获取的数据学习本书将进一步提高数据处理和分析能力。
Python基本语法、数据类型和语言概念概述快速了解如何获取和存储数据,以清洗和格式化数据,消除数据集中的重复值和错误学习何时将数据标准化。 什么时候可以测试和编写数据清理脚本,使用Scrapy编写网络爬虫,使用新的Python库和技术探索和分析数据集,并使用Python解决方案自动化整个数据处理过程? “如果连电子表格和关系数据库都觉得无法回答问题,或者除了这些工具之外还准备进一步学习,那么这本书就是最佳选择。 我一直在等这本书出现。 ”
——Derek Willis,ProPublica新闻APP开发者,OpenElections共同创始人
“所有新手数据科学家、数据工程师或其他技术数据专家都应该阅读本实践指南。 在数据处理领域需要这样的书。 希望你第一次开始用Python处理数据的时候能进行指导。 ”
——Tyrone Grandison博士,Proficiency Labs Intl. CEO
目录版权声明
o’Reilly media,Inc .介绍
本书赞赏
前言
第一章Python介绍
第二章Python基础知识
第三章机器读取的数据
第四章Excel文件的处理
第五章PDF文件的处理和Python中的问题解决
第六章数据的获取和保存
第七章数据清洗:研究、匹配、格式
第八章数据清洗:标准化和脚本化
第九章数据探索与分析
第十章展示数据
第十一章网页捕获:获取和存储网络数据
第十二章高级网页捕获:屏幕捕获和爬行动物
第十三章编程接口的应用
第十四章自动化和规模化
第十五章结论
附录a编程语言比较
附录b初学者的Python学习资源
附录c学习命令行
附录d高级Python设置
附录E Python陷阱
附录F IPython指南
附录g使用亚马逊网络服务
关于作者
关于封面
3https://pan.Baidu.com/s/1b2h _ cxsxfnjrouxu6BCT rw下载