首页 > 编程知识 正文

汽车大屏离线地图存哪里好(荒野大镖客2离线登录)

时间:2023-05-03 13:22:12 阅读:70803 作者:1739

一. Hadoop

Hadoop配置:

分布式计算框架MapReduceHDFSYARN框架命令工具HDFS是一个低成本、高可靠性和高吞吐量的分布式文件系统。

MapReduce由两个阶段组成。

Map阶段Reduce阶段Map函数使用key/value对作为输入参数生成一系列写入本地磁盘的key/value对作为中间输出。 MapReduce框架会自动为每个key值汇总这些中间数据,并将具有相同key值的数据批量处理为Reduce ()函数。

reduce ) )函数以key和相应的值列表作为输入,合并key的相同值,从而生成另一系列key/value对,并将其作为最终输出写入HDFS。

Hadoop将资源管理和作业控制划分为两个独立的进程,包括作业监视、容错和重试机制。

资源管理过程工作控制过程2、HDFS原理

1、定义: HDFS是一个容错系统,可以提供高吞吐量的数据访问。 在实现中,HDFS由运行NameNode的一台服务器和运行DataNode的n台服务器组成,如下所示。

2、HDFS存储文件的型号

(1) HDFS客户端与服务器交互,将文件存储在HDFS集群中

)2) HDFS服务器根据参数切换、复制从客户端发送来的文件,并保存到HDFS的DATaNode中。

(3) HDFS的NameNode记录某个文件的元数据信息)元数据信息包括文件大小、文件路径、文件存储块位置、复制信息等)。

注意:客户端访问的文件是/data/ces.log。 在此,客户端不需要在意基础文件被划分为多少个块,每个存储块的具体位置在哪里,以及ces.log文件在服务器上有多少个副本。 对于客户端,只要可以访问/data/ces.log文件即可。

3、HDFS读取数据的流程

(1) HDFS客户端请求读取数据get /data/ces.log

)2) NameNode接收消息,并返回文件对应的元数据信息

)3)根据对应的元数据信息,请求指定的DataNode读取文件块

)4) DataNode向客户端发送相应的文件块数据流,客户端接收文件块数据流,并通过本地文本输出流将数据写入ces.log文件块。

)5)重复步骤(3)和步骤(4),最终得到完整的文件

(6)重复步骤(3)和步骤(4),最终得到完整的文件

(7)重复步骤(3)和步骤(4),最终得到完整的文件

(8)重复步骤(3)和步骤(4),最终得到完整的文件

4、HDFS刻录文件

(1) HDFS客户端向NameNode发送文件写入请求

)2) NameNode是可以根据客户端写文件的信息

)3) HDFS客户端请求写入NameNode的DataNode

)4) NameNode返回可写入DataNode的节点主机列表。 主机列表中的主机数量由配置的文件副本数量决定。

)5)客户端选择HDFS集群中的一个DataNode,要求建立数据连接并准备数据写入。

)6) DataNode可以向HDFS客户端写入数据

(7)客户端向DataNode写入数据

)8) DataNode将数据的结果信息恰当地写入客户机

(9)在DataNode之间复制数据

(10 ) DataNode之间复制数据

(11 )重复到步骤),进行剩下的文件块的写入

) 12 )写入数据后,通知NameNode,NameNode确认元数据并记录

三. MapReduce

特点:

开发简单、可扩展性高、容错性高的四、雅虎

)1) YARN框架主要由资源管理器、AppMaster、节点管理器组成。

)2)资源管理器和AppMaster实现资源的协调功能

)3) AppMaster和NodeManager一起实现任务的执行,监视任务的执行状态

)4)资源管理器和节点管理器一起管理用户计算机上的进程,组织计算

YARN实际上是一个灵活的计算平台,其目标不仅是支持MapReduce的一个计算框架,而且支持多个计算框架的共存。

好处:

资源利用率高、运输成本低的数据共享

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。