96SEO 2026-02-19 18:21 0
署(一)1、HDFS一、安装1、基础安装1.1、配置JDK-181.2、下载并解压hadoop安装包本地运行模式测试

eg:2、完全分布式运行模式1、概要2、编写集群分发脚本把1~4步安装的同步到其他服务器2.1、创建脚本vim
/var/opt/hadoopSoftware/hadoopScript/bin/xsync添加执行权限2.2、开始同步JDK、Hdoop、环境变量3、配置ssh免密4、配置xml4.1、集群部署规划如下4.2、所需配置文件4.3、配置集群1核心配置文件2HDFS配置文件3YARN配置文件4MapReduce配置文件5、启动整个集群5.1、配置workers5.2、启动集群5.3、页面地址6、集群测试6.1、上传文件到集群测试6.2、上传大文件测试6.3、hadoop集群测试7、集群崩溃处理1先停止集群2删除每个集群上的3格式化集群4启动集群8、配置历史服务器8.1、配置mapred-site.xml8.2、同步配置8.3、在hadoop1上启动历史服务器8.4、查看历史服务器是否启动8.5、查看JobHistory9、配置日志聚合功能1配置yarn-site.xml2同步配置3关闭重启NodeManager、ResourceManager、HistoryServer10、集群启停总结1、整体启动停止(推荐)1整体启动、停止HDFS2整体启动体制YARN3启停historyserver2、各个服务组件分别启/停1启/停HDFS组件2启/停YARN组件3启停historyserver11、编写Hadoop集群常用脚本1批量启停hadoop服务2查看所有服务器Java进程脚本jpsall12、常用端口号参考网站Hadoop3.3.1完全分布式部署(一)
的开源软件框架在大量计算机组成的集群中实现了对海量数据的分布式计算。
NameNode主要是用来保存HDFS的元数据信息比如命名空间信息块信息等。
当它运行的时候这些信息是存在内存中的。
但是这些信息也可以持久化到磁盘上。
NameNode就是来帮助解决上述问题的它的职责是合并NameNode的edit
logs并更新到自己的fsimage上。
一旦它有了新的fsimage文件它将其拷贝回NameNode中。
NameNode在下次重启时会使用这个新的fsimage文件从而减少重启的时间。
https://download.oracle.com/java/17/archive/jdk-17_linux-x64_bin.tar.gz
https://download.oracle.com/java/19/latest/jdk-19_linux-x64_bin.tar.gz
/var/opt/hadoopSoftware/jdk-8u361-linux-x64.tar.gz
/var/opt/hadoopSoftware配置环境变量在profile.d下创建hadoop所需的环境变量
JAVA_HOME/var/opt/software/jdk1.8.0_361
https://dlcdn.apache.org/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz
/var/opt/hadoopSoftware/hadoop-3.3.1.tar.gz
HADOOP_HOME/var/opt/hadoopSoftware/hadoop-3.3.1
HDFS_SECONDARYNAMENODE_USERroot
/var/opt/hadoopSoftware/hadoop-3.3.1/tinput
/var/opt/hadoopSoftware/hadoop-3.3.1/tinput/word.txt
share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar
/var/opt/hadoopSoftware/hadoopScript/bin
/var/opt/hadoopSoftware/hadoopScript/config创建需要同步的服务器地址
/var/opt/hadoopSoftware/hadoopScript/config/hadoop_hosts
/var/opt/hadoopSoftware/hadoopScript/bin/xsync添加执行权限
/var/opt/hadoopSoftware/hadoopScript/config/hadoop_hosts
遍历所有名例如有软连接他会cd到真正的数据目录pdir$(cd
done目前xsync只能同步当前需要写xsync脚本的绝对路径/var/opt/hadoopSoftware/hadoopScript/bin/xsync
/var/opt/hadoopSoftware/hadoopScript/bin/xsync
/var/opt/hadoopSoftware/hadoopScript/bin/xsync
/etc/profile(根据自身需求后期可以使用ansible-playbook)
或如果想要应用这个脚本到全局可以进行如下环境变量设置根据自身情况进行设置仅参考
HSCRIPT_HOME/var/opt/hadoopSoftware/hadoopScript
/etc/profile.d/my_env.sh3、配置ssh免密
配置hadoop1和hadoop2免密登录hadoop[1,2,3]
hadoop1hadoop2hadoop3HDFSNameNodeDataNodeDataNodeSecondaryNameNodeDataNodeYARNNodeManagerNodeManagerResourceManagerNodeManager
$HADOOP_HOMEcore-default.xml$HADOOP_HOME/share/doc/hadoop/hadoop-project-dist/hadoop-common/core-default.xmlhdfs-default.xml$HADOOP_HOME/share/doc/hadoop/hadoop-project-dist/hadoop-hdfs/hdfs-default.xmlyarn-default.xml$HADOOP_HOME/share/doc/hadoop/hadoop-yarn/hadoop-yarn-common/yarn-default.xmlmapred-default.xml$HADOOP_HOME/share/doc/hadoop/hadoop-mapreduce-client/hadoop-mapreduce-client-core/mapred-default.xml
core-site.xmlhdfs-site.xmlyarn-site.xmlmapred-site.xml
$HADOOP_HOME/etc/hadoop/core-site.xml?xml
hrefconfiguration.xsl?configuration!--
--propertynamefs.defaultFS/namevaluehdfs://hadoop1:8082/value/property!--
--propertynamehadoop.tmp.dir/namevalue/var/opt/hadoopSoftware/hadoop-3.3.1/data/value/property!--
--propertynamehadoop.http.staticuser.user/namevalueroot/value/property
$HADOOP_HOME/etc/hadoop/hdfs-site.xml?xml
--propertynamedfs.namenode.http-address/namevaluehadoop1:9870/value/property!--
--propertynamedfs.namenode.secondary.http-address/namevaluehadoop3/value/propertypropertynamedfs.datanode.http.address/namevalue0.0.0.0:9864/valuedescriptionThe
如果为true(默认值)则namenode要求连接datanode的地址必须解析为主机名。
如有必要将执行反向DNS查找。
所有从不可解析地址注册datanode的尝试都将被拒绝。
建议保留该设置以防止在DNS中断期间意外注册由excluded文件中hostname列出的datanode。
只有在没有基础设施支持反向DNS查找的环境中才将此设置为false。
--!--propertynamedfs.namenode.datanode.registration.ip-hostname-check/namevaluefalse/value/property--/configuration3YARN配置文件
$HADOOP_HOME/etc/hadoop/yarn-site.xml?xml
hrefconfiguration.xsl?configuration!--
--propertynameyarn.nodemanager.aux-services/namevaluemapreduce_shuffle/value/property!--
--propertynameyarn.resourcemanager.hostname/namevaluehadoop2/value/property!--
3.1.3需要配置HADOOP_MAPRED_HOME。
3.2以上修复了就不用配置了--propertynameyarn.nodemanager.env-whitelist/namevalueJAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_HOME,HADOOP_MAPRED_HOME/value/property/configuration4MapReduce配置文件
$HADOOP_HOME/etc/hadoop/mapred-site.xml?xml
hrefconfiguration.xsl?configuration!--
--propertynamemapreduce.framework.name/namevalueyarn/value/property/configuration修改完成后同步到所有服务器
$HADOOP_HOME/etc/hadoop5、启动整个集群
$HADOOP_HOME/etc/hadoop/workers
$HADOOP_HOME/etc/hadoop/workers5.2、启动集群
$HADOOP_HOME1、初始化文件系统第一次运行格式化集群
$HADOOP_HOME/data/dfs/name/current/VERSION2、启动集群NameNode和DataNode守护进程:
$HADOOP_HOME/sbin/start-dfs.sh查看启动的服务jps
$HADOOP_HOME/sbin/start-yarn.sh5.3、页面地址
查看datanode存储的数据可以使用如下方式还原每一台服务器存储的都一样
data/dfs/data/current/BP-12……/current/finalized/subdir0/subdir0/blk……/……#
$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar
$HADOOP_HOME/sbin/stop-dfs.sh2删除每个集群上的
$HADOOP_HOME/sbin/start-yarn.sh8、配置历史服务器
$HADOOP_HOME/etc/hadoop/mapred-site.xmlconfiguration!--
--propertynamemapreduce.jobhistory.address/namevaluehadoop1:10020/value/property!--
--propertynamemapreduce.jobhistory.webapp.address/namevaluehadoop1:10888/value/property
$HADOOP_HOME/etc/hadoop/mapred-site.xml8.3、在hadoop1上启动历史服务器
$HADOOP_HOME/sbin/start-yarn.sh启动历史服务器
$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar
注开启日志聚合功能需要重启NodeManager、ResourceManager、HistoryServer。
$HADOOP_HOME/etc/hadoop/yarn-site.xmlconfiguration!--
--propertynameyarn.log-aggregation-enable/namevaluetrue/value/property!--
--propertynameyarn.log.server.url/namevaluehttp://hadoop1:19888/jobhistory/logs/value/property!--
--propertynameyarn.log-aggregation.retain-seconds/namevalue604800/value/property
$HADOOP_HOME/etc/hadoop/yarn-site.xml3关闭重启NodeManager、ResourceManager、HistoryServer
$HADOOP_HOME/sbin/stop-yarn.sh重启
$HADOOP_HOME/sbin/start-yarn.sh
$HADOOP_HOME/sbin/stop-dfs.shhadoop1
$HADOOP_HOME/sbin/start-dfs.sh2整体启动体制YARN
$HADOOP_HOME/sbin/stop-yarn.shhadoop2
$HADOOP_HOME/sbin/start-yarn.sh3启停historyserver
$HADOOP_HOME/sbin/start-dfs.shecho
$HADOOP_HOME/sbin/start-yarn.shecho
$HADOOP_HOME/sbin/stop-yarn.shecho
$HSCRIPT_HOME/bin/jpsall创建所需查看服务器的host地址
/var/opt/hadoopSoftware/hadoopScript/config/all_hadoop_hosts
/var/opt/hadoopSoftware/hadoopScript/config/all_hadoop_hosts
Hadoop官网http://hadoop.apache.org/
Hadoop下载https://www.apache.org/dyn/closer.cgi/hadoop/common/
Hadoop历史版本下载http://archive.apache.org/dist/hadoop/core/
Hadoop文档http://hadoop.apache.org/docs/
Hive下载http://mirror.bit.edu.cn/apache/hive/
Hive历史版本下载http://archive.apache.org/dist/hive/
Hive文档https://cwiki.apache.org/confluence/display/Hive
HBase官网http://hbase.apache.org/
HBase下载http://mirrors.sonic.net/apache/hbase/
HBase历史版本下载http://archive.apache.org/dist/hbase/
HBase文档http://hbase.apache.org/book.html
HBase中文文档http://abloz.com/hbase/book.html
Spark官网http://spark.apache.org/
Spark下载http://spark.apache.org/downloads.html
Spark文档http://spark.apache.org/docs/latest/
Zookeeper官网http://zookeeper.apache.org/
Zookeeper下载http://zookeeper.apache.org/releases.html#download
Flume官网http://flume.apache.org/
Flume下载http://flume.apache.org/download.html
Flume文档http://flume.apache.org/documentation.html
Mahout官网http://mahout.apache.org/
Mahout下载http://mahout.apache.org/general/downloads.html
下载地址http://archive.cloudera.com/cdh5/cdh/5/
文档地址http://archive.cloudera.com/cdh5/cdh/5/
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback