hadoop的安装与配置详细过程（简述hadoop安装）

1、创建用户
2、安装jdk
3、修改hosts
4、配置ssh免密登录
5、安装zookeeper
- 解压：
- 修改配置文件
  - 修改内容如下：
  - 配置环境变量
- 启动
6、安装hadoop
- 对于三台节点的配置安排如下：
  - 解压：
  - 修改配置文件：
  - 修改core-site.xml
  - 配置hdfs-site.xml
  - 配置mapred-site.xml
  - 配置yarn-site.xml
  - 配置slaves
7、初始化
- 在初始化前需要将所有机器都配置好hadoop
  - （1）启动zookeeper
  - （2）启动journalnode
  - （3）格式化zk
  - （4）格式化hdfs
  - （5）同步元数据
  - （6）启动hadoop
  - （7）安装fuster
  - （8）网页访问

安装hadoop有好几种方式，以下按照hdfs高可用的方式来安装。

1、创建用户

命令：

1 2	`useradd -m bigdata` `passwd bigdata`

2、安装jdk

解压：

1	`tar -zvf jdk-8u191-linux-x64.tar.gz`

修改环境变量

1 2 3 4 5 JAVA_HOME=/usr/lib/jvm/java-8-openjdk-arm64 JRE_HOME=/usr/lib/jvm/java-8-openjdk-arm64/jre CLASSPATH=:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin export JAVA_HOME JRE_HOME PATH CLASSPATH

3、修改hosts

修改/etc/hosts

1 2 3 10.211.55.12 hadoop01　　# NameNode Active 10.211.55.13 hadoop01　　# NameNode Standby 10.211.55.14 hadoop01　　# DataNode1

4、配置ssh免密登录

在每一台需要配置的机器上执行以下命令：

1	`ssh-keygen –t rsa`

执行完成后默认会在其根目录下创建一个.ssh目录，在这个目录中有id_rsa和id_rsa.pub两个文件。然后将所有机器的id_rsa.pub文件的内容都合并到一个新的文件中，文件命名为authorized_keys，然后将该文件分发到各台机器上。

最后，使用ssh登录其他机器测试是否完成免密。

5、安装zookeeper

下载链接：https://zookeeper.apache.org/releases.html

解压：

1	`tar -zxvf apache-zookeeper-3.5.7-bin.tar.gz`

修改配置文件

将zookeeper下conf目录中的zoo_sample.cfg文件复制一份，新复制的文件重命名为zoo.cfg文件。

修改内容如下：

1 2 3 4 5 6 7 #zookeeper的文件路径 dataDir=/root/zookeeper/data #zookeeper集群节点信息 server.1=hadoop01:2888:3888 server.2=hadoop02:2888:3888 server.3=hadoop03:2888:3888

#server.A=B:C:D 其中A是一个数字，代表这是第几号服务器；B是服务器的IP地址；C表示服务器与群集中的“领导者”交换信息的端口；当领导者失效后，D表示用来执行选举时服务器相互通信的端口。

然后在上述设置的文件目录中新建一个文件，文件名为myid，文件内容为一个数字。例如上述配置的hadoop01对应的是server.1，它的myid的文件内容就是1。

配置环境变量

修改/etc/profile文件

1 2	`export ZOOKEEPER_HOME=/root/zookeeper` `export PATH=$PATH:$ZOOKEEPER_HOME/bin`

启动

启动命令如下

1 2 3 4 #启动 zkServer.sh start #查询状态 zkServer.sh status

6、安装hadoop

对于三台节点的配置安排如下：

hadoo01：journalnode、namenode、datanode、resourcemanager、nodemanager
hadoo02：journalnode、namenode、datanode、resourcemanager、nodemanager
hadoo03：journalnode、datanode、nodemanager

下载链接：https://hadoop.apache.org/releases.html

解压：

1	`tar -zxvf hadoop-2.7.6.tar.gz`

修改配置文件：

hadoop的配置文件在解压后文件夹的etc目录下的hadoop目录中。

修改core-site.xml

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 <configuration>  <property> <name>fs.defaultFS</name> <value>hdfs://nns1</value> </property> <property> <name>io.file.buffer.size</name> <value>131072</value> </property>  <property> <name>hadoop.tmp.dir</name> <value>/data/HadoopData/HDFSData</value> </property>  <property> <name>hadoop.proxyuser.root.hosts</name> <value>*</value> </property> <property> <name>hadoop.proxyuser.root.groups</name> <value>*</value> </property>   <property> <name>ha.zookeeper.quorum</name> <value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value> </property> </configuration>

配置hdfs-site.xml

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 <configuration>  <property> <name>dfs.nameservices</name> <value>nns1</value> </property>  <property> <name>dfs.ha.namenodes.nns1</name> <value>nn1,nn2</value> </property>  <property> <name>dfs.namenode.rpc-address.nns1.nn1</name> <value>hadoop01:9000</value> </property> <property> <name>dfs.namenode.rpc-address.nns1.nn2</name> <value>hadoop02:9000</value> </property> <property> <name>dfs.namenode.http-address.nns1.nn1</name> <value>hadoop01:50070</value> </property> <property> <name>dfs.namenode.http-address.nns1.nn2</name> <value>hadoop02:50070</value> </property>  <property> <name>dfs.namenode.shared.edits.dir</name> <value>qjournal://hadoop01:8485;hadoop02:8485;hadoop03:8485/nns1</value> </property>  <property> <name>dfs.client.failover.proxy.provider.nns1</name> <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value> </property>  <property> <name>dfs.ha.fencing.methods</name> <value>sshfence</value> </property>  <property> <name>dfs.ha.fencing.ssh.private-key-files</name> <value>/root/.ssh/id_rsa</value> </property>  <property> <name>dfs.journalnode.edits.dir</name> <value>/data/HadoopData/HDFSData/journal</value> </property>  <property> <name>dfs.ha.automatic-failover.enabled</name> <value>true</value> </property>  <property> <name>dfs.namenode.name.dir</name> <value>/data/HadoopData/HDFSData/name</value> </property>  <property> <name>dfs.datanode.data.dir</name> <value>/data/HadoopData/HDFSData/data</value> </property>  <property> <name>dfs.replication</name> <value>3</value> </property>  <property> <name>dfs.webhdfs.enabled</name> <value>true</value> </property> </configuration>

配置mapred-site.xml

1 2 3 4 5 6 7 <configuration>  <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>

配置yarn-site.xml

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 <configuration>  <property> <name>yarn.resourcemanager.ha.enabled</name> <value>true</value> </property>  <property> <name>yarn.resourcemanager.ha.rm-ids</name> <value>rm1,rm2</value> </property>  <property> <name>yarn.resourcemanager.cluster-id</name> <value>cluster1-yarn</value> </property>  <property> <name>yarn.resourcemanager.hostname.rm1</name> <value>hadoop01</value> </property> <property> <name>yarn.resourcemanager.hostname.rm2</name> <value>hadoop02</value> </property>  <property> <name>yarn.resourcemanager.ha.id</name> <value>rm1</value> </property>  <property> <name>yarn.resourcemanager.recovery.enabled</name> <value>true</value> </property>  <property> <name>yarn.resourcemanager.zk-address</name> <value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value> </property>  <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> </configuration>

配置slaves

1 2 3 hadoop01 hadoop02 hadoop03

slaves中配置的服务器ip，没改hosts文件则直接写ip地址便可。该文件配置的服务器在启动的时候会启动datanode和nodemanager两个进程。

7、初始化

在初始化前需要将所有机器都配置好hadoop

（一般直接复制上述配置好的文件，注意yarn-site.xml中的id，还有保证配置中的路径在每台机器上都存在）。

（1）启动zookeeper

初始化之前需要保证zookeeper能正常提供服务，启动命令之前有提到

（2）启动journalnode

初始化前需要保证journalnode已经启动。启动脚本在hadoop的sbin目录下，名字为hadoop-daemon.sh。

启动命令如下：

1	`./hadoop-daemon.sh start journalnode`

（3）格式化zk

命令如下

1	`hdfs zkfc -formatZK`

（4）格式化hdfs

命令如下

1	`hadoop namenode -format`

这一步会在上述hdfs-site.xml，配置的dfs.namenode.name.dir路径下创建一系列文件。

（5）同步元数据

在另一台配置了namenode的服务器上执行以下命令：

1	`hdfs namenode -bootstrapStanby`

上述命令如果执行失败，还有一个简单的方法可以同步元数据。可以直接将步骤4中在第一台生成的文件复制到第二台服务器。

（6）启动hadoop

同样在sbin目录下，使用start-all.sh可以启动所有服务，使用start-dfs.sh和start-yarn.sh可以分别启动hdfs和yarn。

使用hadoop-deamon.sh和yarn-deamon.sh分别别启动hdfs和yarn的单个进程。

（7）安装fuster

安装命令如下：

1	`yum install psmisc`

（8）网页访问

hdfs网页访问50070端口，yarn网页访问8088。这两个端口可以在配置文件中修改。
正常启动则可以访问到以下页面。

hadoop的安装与配置详细过程（简述hadoop安装）

以上就是Hadoop源码分析二安装配置过程的详细内容，本系列下一篇文章传送门Hadoop源码分析三启动及脚本剖析更多Hadoop源码分析的资料请持续关注服务器之家！

原文链接：https://blog.csdn.net/qq_39210987/article/details/113921917

如果您对该产品感兴趣，请填写办理（客服微信：xiaoxiongyidong）

关于作者：访客

hadoop的安装与配置详细过程（简述hadoop安装）

目录

1、创建用户

2、安装jdk

3、修改hosts

4、配置ssh免密登录

5、安装zookeeper