大 数 据
基础编程实验案例分析3558 www.tup.Tsinghua.edu.cn /图书中心/图书_ 07487001.html
本教程是与yyddp编辑《大数据技术原理与应用》教材配套的实验指导书,结合两本书使用,可以收到更好的学习效果。 本教程共12章,详细介绍了系统和软件的安装、使用以及基础编程方法。
第一章介绍大数据的关键技术和典型软件,帮助读者形成对大数据技术及其典型软件的整体认识; 第2章介绍Linux系统的安装和使用方法,为后面其他章节的学习奠定基础; 第三章介绍分布式计算框架Hadoop的安装和使用方法; 第四章介绍分布式文件系统HDFS的基础编程方法; 第5章介绍分布式数据库HBase的安装和基础编程方法第6章介绍典型的NoSQL数据库的安装和使用方法,包括键值数据库Redis和文档数据库MongoDB。 第7章介绍基本的MapReduce程序的编制方法。 第8章介绍基于Hadoop的数据仓库Hive的安装和使用方法; 第9章介绍了基于内存的分布式计算框架Spark的安装和基础编程方法; 第10章介绍Easel.ly、D3、魔术镜、ECharts、Tableau等5种典型可视化工具的安装和使用方法; 第11章介绍Flume、Kafka、Sqoop等数据收集工具的安装和使用方法。 第12章介绍了一个大数据课程的综合实验案例:网站用户购物行为分析。 本书特色:
分步指导、分步渐进、详细的安装指南将为顺利构建大数据实验环境铺平道路;
深入挖掘,剔除粗糙,丰富的代码实例有助于快速掌握大数据的基础编程方法;
精心设计、巧妙融合,五大数据实验主题促进理论和编程知识的消化和吸收;
结合理论和实际,大数据课程综合实验实例出色地呈现了大数据分析的全过程。
全国高校大数据教育知名教师历时4年精心制作的作品。
全国许多大学公开课教材《大数据技术原理与应用》指定了唯一的辅助实验辅导书。
教程官网可以一站式免费下载全书实验代码、相关软件、课程视频等资源。
大学大数据课程公共服务平台为本教程提供了数字化教学资源的全面支持