首页 > 编程知识 正文

数据科学与大数据技术推荐书籍,大数据比较好的书籍推荐

时间:2023-05-03 20:06:38 阅读:282987 作者:2281

当然转行不能只是说说而已,还是要下功夫的,于是买了很多书,也被送了很多书,下面谈谈我这一年半看过的相关的书:

SQL

SQL学习指南

个人推荐指数:★★★

SQL是学数据分析挖掘必须会的,这本书因为之前买的,就看的这个,个人感觉,初学者会在多表连接和查询那里纠结很久,当然,我SQL学的并不是很好,还需多多加强,可惜的一点是,这本书的数据好像并没有提供,所以我没办法实操一下。

Python

Python基础教程

个人推荐指数:★

书的内容是用Python2写的,不太适合初学者学习,因为Python2不久将不在维护,还是学Python3好,在京东等商城销量很高,但是不建议作为入门书籍,因为第六章就开始写到参数魔法,新手会很难理解,入门书应当是生动有趣易理解的,这也是我写Python从零开始入门连载的原因之一。

听说已经出的第三版是Python3写的

像计算机科学家一样思考Python

个人推荐指数:★

这本书销量很高,看的时候印象最深的就是递归的思想,如果你已经看过我的Python入门基础课,可以不看这本,这本书相对多出来的知识点问我在Python进阶文章前几篇已经写出来了。这本书不适合作为入门书,原因是每个点讲的不全面。

HeadFirstPython

个人推荐指数:★★★★

这本书是我最开始接触Python看的几本书之一,书中大量插画,使用Python解决一些实际问题,初学者可以不按照本书内容敲代码,看懂即可,因为本书代码量太大,可能让初学者从入门到放弃。

Python程序设计基础

个人推荐指数:★★★

这本书推荐给喜欢应试教育的朋友,作为入门书也是很合适的,基于Python3写的,再说Python已经加入全国计算机二级考试,这本书作为教材也是很OK的。

流畅的Python

个人推荐指数:★★★★

这本书是奉献给那些想将Python写的更优雅的朋友,深度剖析Python的深层内容,细细品读,每章都有极大收获,当然,书很厚,我还没看完。

网络爬虫

精通Python网络爬虫

个人推荐指数:★★★

我学网络爬虫是看的大方的眼神老师视频,通俗易懂,很棒!之后大方的眼神老师这本书出版之后,就看了一遍,书中对网络爬虫原理,urllib库,正则表达式,scrapy讲得比较透彻,推荐大家额外看看BeautifulSoup,xpath等给力解析库,本书使用Fiddler抓包分析,但我更推荐谷歌浏览器的开发者模式。

数据分析

深入浅出数据分析

个人推荐指数:★★★★

这本书适合作为学数据分析的入门书,书中大量插图,生动形象,深入浅出,每章都是为了解决特定问题而反复思考迭代。

机器学习

白话大数据与机器学习

个人推荐指数:★★★★

推荐这本书入门机器学习,不要纠结书中的代码,看每种机器学习的举例介绍,通俗易懂,书中很多漫画插图,算法原理推导基本不深,特别是隐马尔可夫部分讲的很棒,作为入门机器学习的书非常棒!

机器学习

个人推荐指数:★★★★★

周志华老师的机器学习,应当算是国内机器学习书籍销量最高了吧,除去国外书籍,这是你学机器学习必看的经典书籍(因为我所了解的国外有好几本经典的机器学习书籍)。这本书从西瓜数据开始,到西瓜数据结束,每个算法点到即止(不代表深度不够,这里指的是篇幅上不废话)。对我帮助最大的是本书第二章的模型评估选择,讲的非常成体系。当然,书上的理论推导很难,有兴趣可以看看一些学习笔记。

机器学习基础教程

个人推荐指数:★★

这本书是理论书,从线性回归开始,将最小二乘法和极大似然法实现全都详细推导一遍,酣畅淋漓,之后的贝叶斯方法和贝叶斯推理,理论性太强,看的让人想撕书,不过通俗易懂,再之后的分类聚类降维写的没什么特色。数学好的同学可以挑战看看。

集体智慧编程

个人推荐指数:★★

这本书Python代码是2版本,书比较老(经典)了,这本书我看了一部分就放弃了,原因是书中的数据提供的网站很多都失效了,不过这本书的思想还是不错的,以后还会回来看看的。

机器学习实战

个人推荐指数:★★★★★

这本书非常给力,基本不用sklearn等别人造好的轮子,基本都是自己定义函数实现功能,对你从底层了解机器学习代码实现非常有帮助,注释不够多,你可能不明白某段代码的含义,你可以使用print函数输出看看,然后加以理解,遇到没见过的方法,可以百度它的作用,因为书比较老,所以有些方法已经改动过或者不用,你百度最新替代的方法试试。

Python机器学习及实践

个人推荐指数:★★★

整本书180页,不到两天就能撸完,书中提供的代码是Python2,自己稍作修改改成3运行一遍,有Python基础就跳过第一章,第二章将常见机器学习算法的实现,主要有用的是sklearn,通过看完这章,你就知道了用sklearn做机器学习的步骤:导入数据,数据预处理,训练数据训练模型,测试数据预测,模型性能评估。第三章是本书两点,讲到了特征提升、模型正则化、模型检验、超参数搜索优化。本书在模型的欠拟合和过拟合部分阐述的很好,之后讲到了一些流行的库,包括NLTK、Word2Vec、XGBoost、Tensorflow,涉及自然语言处理,深度学习。全本书原理一笔带过,最后一章讲到鼓励参加Kaggle比赛,并拿出了三个案例讲解。本书适合学完sklearn基础的朋友想用sklearn实现完整机器学习项目,缺点是书中模型基本使用的都是默认参数。

统计学习方法

个人推荐指数:★★★★★

想学数据挖掘或者机器学习不可避免要接触数学相关理论,尽管你可以只用sklearn等做机器学习,但不懂底层理论,是无法做深入的,而这本书,就是给你打好机器学习基础的书,先修内容大学数学三件套(高等数学、线性代数、概率论与数理统计),如果你不是数学基础特别好,看这本书的时候会像我一样看不懂一些公式推导,莫慌,百度一下别人的学习笔记或者技术博客,慢慢钻研,本书适合看多次,每次都有新的收获,书本身不厚,230页,建议边看边将感悟推导公司等写在旁边,方便下次看。

数据挖掘

数据挖掘导论

个人推荐指数:★★★

说是导论,大家不要以为他很简单就能看懂,还是有难度的,第一章简介,第二章详谈了数据这一概念,你会接触很多没听过的专业术语,分类算法讲的不多,SVM中对核函数的引入讲解的特别传神,本书花了大量笔墨在关联分析和聚类分析,这两处挖得很深,本书最后讲到异常检测,书中全是理论,没讲代码实现。

数据结构算法

大话数据结构

个人推荐指数:★★★★

如果你还是在校学生,并且想通过校招找一份数据分析挖掘或者机器学习岗位,那必然会面对数据结构算法问题,如果你和我一样非科班出身,刚接触数据结构算法一定会很懵逼,那我推荐你这本书,书中大量插画,帮助理解,上课式情景教学,非常棒,帮你打开数据结构算法大门,让你破门而入!

总结

看视频过程中,能快速掌握核心的技术,至于想拓展,可以翻翻工具书或者看官方文档

学无止境,不断看书总结提升非常有必要,还有很多书等着我看,以后继续给大家分享~

买书如山倒,读书如抽丝,别只有三分钟热度,学习是一件持久战,哦不,是持久快乐的过程

买书可以经常去京东、当当看看,好像是年中大促会有5折之类优惠哦,平时也经常有优惠,最近当当有100-40买书优惠(我要去领盒饭了)。
 人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
入行大数据科学,需要我们具备哪些数学基础?
http://www.duozhishidai.com/article-14941-1.html
数据科学家的工作性质是什么,主要面临什么挑战 ?
http://www.duozhishidai.com/article-13986-1.html
数据科学是什么,如何成为一名数据科学家?
http://www.duozhishidai.com/article-8521-1.html

多智时代-人工智能和大数据学习入门网站|人工智能、大数据、物联网、云计算的学习交流网站

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。