本文记录一下 Mac 本机安装 Hadoop 的过程,免得每次都要去搜索一堆博客才能安装成功。
环境
Mac:10.15.7
Hadoop:2.7.4
JDK:1.8.0_151
下载并解压
从官网下载解压到某个目录下,并在 /etc/profile 设置环境变量:
1  | export HADOOP_HOME=/usr/local/hadoop  | 
使环境变量生效:
1  | source /etc/profile  | 
查看是否安装成功:
1  | hadoop version  | 
修改 Hadoop 配置
修改 hadoop-env.sh 文件
1  | # 设置JAVA_HOME  | 
修改 core-site.xml 文件
1  | <property>  | 
修改 hdfs-site.xml 文件
1  | <property>  | 
修改 mapred-site.xml 文件
1  | <!-- 指定 mapreduce 运行在 yarn 上 -->  | 
修改 yarn-site.xml 文件
1  | <property>  | 
至此,需要修改和配置的文件就差不多了。
运行 Hadoop
格式化文件系统
1  | hdfs namenode -format  | 
启动 NameNode 和 DataNode 服务
1  | HADOOP_HOME/sbin/start-dfs.sh  | 

启动 Yarn
1  | HADOOP_HOME/sbin/start-yarn.sh  | 

一键启动
1  | HADOOP_HOME/sbin/start-all.sh  | 
查看相关进程
1  | jps  | 
遇到的问题
DataNode 启动失败
由于多次格式化导致 NameNode 和 DataNode 的 clusterID 不一致,修改为一致即可。
1  | cat /usr/local/hadoop/current/dfs/data/current/VERSION | grep 'clusterID'  |