首页 > 编程知识 正文

超详细 Hadoop 安装(内附ssh免密登录,图文详解,小白必看)

时间:2023-05-04 10:31:39 阅读:153776 作者:2217

Hadoop伪分发实现(内置ssh,无密集登录,可进行收集查看哦) ) ) ) ) ) ) )。

目录

Hadoop伪分发实现(内置ssh,无密集登录,可进行收集查看哦) ) ) ) ) ) ) )。

一)安装前准备

(2) jdk安装、java环境的构成

三.安装伪分布式hadoop环境

(四) ssh安全登录配置【简化启动】

五:总结

一)安装前准备预安装任务(确保安装了虚拟机和linux系统,然后准备hadoop安装软件包和jdk安装软件包

以下是可能使用的安装工具和网盘的下载链接【自己】:

hadoop-2.7.7.tar.gz链接: https://pan.Baidu.com/s/18 tmvslkfjyulrip9-2iitq

抽屉代码: aoye

2. jdk-8u211-linux-x64.tar

链接: https://pan.Baidu.com/s/1 LG ops6zwmkysw 4u w2 phx ag

抽屉代码: aoye

3.WinSCP-5.17.5-Setup

链接: https://pan.Baidu.com/s/137 bmjiktagzn0P4 fylbuhq

抽屉代码: aoye

(2) jdk安装,java环境配置将hadoop-2.7.7.tar.gz安装软件包和jdk-8u211-linux-x64.tar安装软件包上载到linux系统

2 .将安装包放在根目录下/opt目录下【上传安装包时可以选择对应的目录! 也可以之后移动】

3 .设置jdk【/opt下创建目录jdk,将JDK解压到该文件下】

4.http://www.Sina.com/目录中配置环境变量和启动器,按http://www.Sina.com /【http://www.Sina.com /】进入编辑模式,编辑后首先进入3358 www

#JAVA ENV

export JAVA_HOME=/jdk解压缩目录

export path=$ Java _ home/ml DDR : $ path

5 .更新将启用编辑文件。/etc/profile

6 .输入以验证是否成功安装了java环境:vi /etc/profile

三.伪分布式hadoop环境安装hadoop安装模式:本地安装、伪分布式安装、完全分布式安装

安装过程----解压缩安装包----配置环境----修改五个配置文件-----格式化namenode----启动

动hadoop

 

1.     解压hadoop-2.7.7.tar.gz安装包【在/opt目录下创建hadoop目录,把hadoop-2.7.7.tar.gz解压到该目录下】

解压后目录如下:

2.      配置hadoop环境【在 /etc/profile 目录下配置,输入:vi  /etc/profile,按 i 进入编辑模式,编辑完后先按esc 再输入 :wq 保存并退出】

#HADOOP ENV
export HADOOP_HOME=/hadoop解压目录
export PATH=$HADOOP_HOME/mlddr:$HADOOP_HOME/smlddr:$PATH

3.      刷新使得文件生效,并查看环境是否配置成功【刷新:source /etc/profile  ;    查看是否配置成功:hadoop

4.        进入hadoop解压目录下的/etc/hadoop目录下 【例如: cd /opt/hadoop/hadoop-2.7.7/etc/hadoop】

5.      修改五个配置之一:hadoop-env.sh 【按 i 进入编辑模式,编辑完后先按esc 再输入 :wq 保存并退出】

6.        修改五个配置文件之一: hdfs-site.xml  【在../etc/hadoop目录下输入:vi hdfs-site.xml

<property>
    <name>dfs.replication</name>
    <value>1</value>
</property>
<property>
    <name>dfs.permissions</name>
    <value>1</value>
</property>

7.        修改五个配置文件之一: core-site.xml

 <property>
       <name>fs.defaultFS</name>
       <value>hdfs://主机名:9000</value>
    </property>
    <property>
       <name>hadoop.tmp.dir</name>

      # tmp目录需自己创建在对应的目录下
       <value>/opt/hadoop/hadoop-2.7.7/tmp</value>
    </property>

8.        修改五个配置文件之一: mapred-site.xml  【没有这个配置文件,通过拷贝mapred-site.xml.template产生,输入: cp mapred-site.xml.template mspred-site.xml

  <property>
       <name>mapreduce.framwork.name</name>
       <value>yarn</value>
    </property>

9.        配置五个配置文件之一: yarn-site.xml

<property>
    <name>yarn-resourcemanager.hostname</name>
    <value>主机名</value>
</property>
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>

10.      格式化namenode 【回到hadoop解压主目录,进入mlddr目录下,输入命令进行格式化:hdfs namenode -format

成功后如下截图:

【如有格式化错误可根据所报日志进行查找,注意修改的配置文件中不能有半点错误!!

11.       启动hadoop  【进入hadoop安装目录下的  /smlddr 目录下,输入命令启动:./start-all.sh

注意:启动需多次输入密码,比较麻烦,结尾将给出免密登录的配置(可不用多次输入密码启动hadoop),密码输入是不显示的,输入完回车即可!

12.      启动成功后必须得有以下五个进程【namenode,datanode,secondarynamenode,resourcemanager。nodemanager】,输入查看:  jps

13.      hadoop配置并启动成功,可在浏览器输入端口号访问web页面: 主机名:50070

出现访问不了页面的问题,通过以下解决:

1.  查看防火墙状态并关闭防火墙:

2.   配置windows端ip映射 【进入以下目录:C:WindowsSystem32driversetc,修改hosts文件加入linux主机ip和主机名,切记保存并退出

 

四:    ssh免密登录配置【简化启动】

1.      关闭hadoop【smlddr目录下:./stop-all.sh】

2.      进入/root/.ssh目录:cd ~/.ssh

3.      输入 ssh-keygen -t rsa  【三下回车,生成两个文件id_rsa(私匙),id_rsa.pub(共匙)】

4.      ssh-copy-id 主机名【将公匙拷贝到要免密登录的机器上】

5.      配置好后如下【启动不用再输入密码】

五:    总结

以上为hadoop伪分布安装以及免密登录,解释得有不清楚的地方多多海涵。

 

 

 

 

 

 

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。