“
数据分析: withopensourcetools
’
第一
18
章
预测分析
看笔记
一、
全书概要
1.
作者简介
本书作者是
PhilippK.Janer
他多年来一直担任物理学家和软件
工程师经验、
为数据分析和数学建模提供咨询服务。
他是的
Gnuplot
输入
操作
:
UnderstandingDatawithGraphs
(
曼宁
出版)的作者也有
o’Reilly
网络
在、
IBMdeveloperWorks
和
IEEE软件
发表了很多拥有华盛顿的文章
大学理论物理学博士学位。
2.
本书大纲
本书名称《数据之魅:基于开源工具的数据分析》,共分四个部分
19
章。
第一部分是
1
_
6
在章中,论述了通过图表技术进行的数据观察,并分别进行了介绍
单变量、双变量、时序、多变量制图技术的应用。 第二部分是
711
章,说话
阐述了用各种建模方法分析数据的方法
讨论了数量水平的估计和不确定性因素,
开启
发送模型的基本组件。
第三部分是
12-15
章、
重点介绍了数据挖掘的方法,
怎么搬运
在模拟中,
通过聚类等方法获取有用的知识。
第四节是
16-19
章、
强调数据分析是业务
在行业和金融等领域的实用化。
另外,本书各章的结尾有“研讨会”的标题
的一节介绍了如何在各种开源工具和源代码库中实践当前章节中描述的理论。 例如
Python
在、
r
在、
gnuplot
在、
Sage
等等。
本书包括许多模拟过程和结果的展示,
通过例子说明开源工具的使用方法
进行数据分析。
通过阅读本书,
笔者结合这些方法的实际使用方法和
用途。
二、
第一
18
章
预测分析
本章讨论了根据数据直接进行预测的方法。
在第二节中,
作者介绍的
如何建立一个概念模型进行预测,
但是在环境复杂的情况下,
我们可能有麻烦了
因为是法结构概念模型的问题,所以本章的预测法很好地解决了这个问题。
预测分析描述了以从数据中直接获取预测信息为目的的各种任务,
其中以下
以下三个应用领域很突出。
1
分类或监督学习。 已将每条记录分配给
定义的类的集合,如垃圾邮件过滤
2
在没有聚类或监视的情况下学习。 将纪
被记录为集群,但集群是未知的。
3
)来上载修改后的文件。 根据以前的兴趣和习惯推荐一个聚会