暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

hadoop之HDFS HA高可用---YARN-HA配置

大数据小同学 2020-05-07
987

YARN-HA工作机制

  1. 官方文档:
    http://hadoop.apache.org/docs/r2.7.2/hadoop-yarn/hadoop-yarn-site/ResourceManagerHA.html

  2. YARN-HA工作机制

配置YARN-HA集群

环境准备

  1. 修改IP

  2. 修改主机名及主机名和IP地址的映射

  3. 关闭防火墙

  4. ssh免密登录

  5. 安装JDK,配置环境变量等

  6. 配置Zookeeper集群

规划集群

hadoop102hadoop102hadoop102
NameNodeNameNode
JournalNodeJournalNodeJournalNode
DataNodeDataNodeDataNode
ZKZKZK
ResourceManagerResourceManager
NodeManagerNodeManagerNodeManager

具体配置

  1. yarn-site.xml

<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

<!--启用resourcemanager ha-->
<property>
<name>yarn.resourcemanager.ha.enabled</name>
<value>true</value>
</property>

<!--声明两台resourcemanager的地址-->
<property>
<name>yarn.resourcemanager.cluster-id</name>
<value>cluster-yarn1</value>
</property>

<property>
<name>yarn.resourcemanager.ha.rm-ids</name>
<value>rm1,rm2</value>
</property>

<property>
<name>yarn.resourcemanager.hostname.rm1</name>
<value>hadoop102</value>
</property>

<property>
<name>yarn.resourcemanager.hostname.rm2</name>
<value>hadoop103</value>
</property>

<!--指定zookeeper集群的地址-->
<property>
<name>yarn.resourcemanager.zk-address</name>
<value>hadoop102:2181,hadoop103:2181,hadoop104:2181</value>
</property>

<!--启用自动恢复-->
<property>
<name>yarn.resourcemanager.recovery.enabled</name>
<value>true</value>
</property>

<!--指定resourcemanager的状态信息存储在zookeeper集群-->
<property>
<name>yarn.resourcemanager.store.class</name>
<value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
</property>
</configuration>

  1. 同步更新其他节点的配置信息

启动hdfs

  1. 在各个JournalNode节点上,输入以下命令启动journalnode服务:

sbin/hadoop-daemon.sh start journalnode

  1. 在[nn1]上,对其进行格式化,并启动:

bin/hdfs namenode -format
sbin/hadoop-daemon.sh start namenode

  1. 在[nn2]上,同步nn1的元数据信息

bin/hdfs namenode -bootstrapStandby

  1. 启动[nn2]:

sbin/hadoop-daemon.sh start namenode

  1. 启动所有DataNode

sbin/hadoop-daemons.sh start datanode

  1. 将[nn1]切换为Active

bin/hdfs haadmin -transitionToActive nn1

启动YARN

  1. 在hadoop102中执行:

sbin/start-yarn.sh

  1. 在hadoop103中执行:

sbin/yarn-daemon.sh start resourcemanager

  1. 查看服务状态

bin/yarn rmadmin -getServiceState rm1


简书:https://www.jianshu.com/u/0278602aea1d
CSDN:https://blog.csdn.net/u012387141
特别感谢:尚硅谷教育


文章转载自大数据小同学,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论