96SEO 2026-02-19 12:51 8
项目官方#xff1a;https://hadoop.apache.org/

Hadoop最早诞生于Cutting于1998年左右开发的一个全文文本搜索引擎
Lucene这个搜索引擎在2001年成为Apache基金会的一个子项目也是
首先准备三台Linux服务器预装CentOS7。
三台服务器之间需要网络互通。
本地测试环境的IP地址分别为192.168.2.128192.168.2.129
/etc/hosts这里是给每个机器配置一个机器名。
后续集群中都会通过机器名进行配
Hadoop集群节点之间需要进行频繁复杂的网络交互在实验环境建议关闭防火墙。
生产环境下可以根据情况选择是按照端口配置复杂的防火墙规则或者关闭内部防火墙使用堡垒机进行统一防护。
node015、在node02node03节点分别执行上述四个步骤注意节点名称的替换
jdk-8u212-linux-x64.tar.gz。
解压到/usr/java目录。
注node01、node02、node03三个节点都按装部署jdk环境
JAVA_HOME/usr/java/jdk1.8.0_291
PATH$PATH:$JAVA_HOME/bin5、创建用户(可选)
通常在正是的生产环境中root用户都是要被严格管控的这时就需要单独创建一个用户来管理这些应用
下载地址https://hadoop.apache.org/release/3.2.2.html
其中HDFS是一个分布式的文件系统主要负责文件的存储。
由NameNode、Secondary
NameNode和DataNode三种节点组成。
HDFS上的文件会以文件块(Block)的形式存储到不同的DataNode节点当中。
NameNode则用来存储文件的相关元数据比如文件名、文件目录结果、文件的块列表等。
然后SecondaryNameNode则负责每隔一段时间对NameNode上的元数据进行备份。
Yarn是一个资源调度的工具负责对服务器集群内的计算资源主要是CPU和内存进行合理的分配与调度。
由ResourceManager和NodeManager两种节点组成。
ResourceManager负责对系统内的计算资源进行调度分配将计算任务分配到具体的NodeManger节点上执行。
而NodeManager则负责具体的计算任务执行。
1、在所有虚拟机根目录下新建文件夹exportexport文件夹中新建data、servers和software文件
HADOOP_HOME/export/servers/hadoop-3.2.2
PATH$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin使配置文件生效
以下所有的配置文件都在hadoop安装目录下etc文件中路径如下
JAVA_HOME/usr/java/jdk1.8.0_2912、配置core-site.xml文件
athttp://www.apache.org/licenses/LICENSE-2.0Unless
--propertynamefs.defaultFS/namevaluehdfs://node01:8020/value/property!--
--propertynamehadoop.tmp.dir/namevalue/export/servers/hadoop-3.2.2/data/value/property!--
--propertynamehadoop.http.staticuser.user/namevalueroot/value/property
/configuration3、配置hdfs-site.xml文件
athttp://www.apache.org/licenses/LICENSE-2.0Unless
端访问地址--propertynamedfs.namenode.http-address/namevaluenode01:9870/value/property!--
端访问地址--propertynamedfs.namenode.secondary.http-address/namevaluenode03:9868/value/property!--
--propertynamedfs.replication/namevalue2/value/property!--
--propertynamedfs.webhdfs.enabled/namevaluetrue/value/property
athttp://www.apache.org/licenses/LICENSE-2.0Unless
--propertynameyarn.nodemanager.aux-services/namevaluemapreduce_shuffle/value/property!--
的地址--propertynameyarn.resourcemanager.hostname/namevaluenode02/value/property!--
跑示例时要用到--propertynameyarn.nodemanager.env-whitelist/namevalueJAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME/value/property!--
--propertynameyarn.log-aggregation-enable/namevaluetrue/value/property!--
--propertynameyarn.log.server.url/namevaluehttp://node01:19888/jobhistory/logs/value/property!--
--propertynameyarn.log-aggregation.retain-seconds/namevalue604800/value/property
athttp://www.apache.org/licenses/LICENSE-2.0Unless
--propertynamemapreduce.framework.name/namevalueyarn/value/property!--
--propertynamemapreduce.jobhistory.webapp.address/namevaluenode01:19888/value/property
node037、将配置完成后的hadoop整体分发到另外的节点完成node02、node03两个节点和node01相同的配置
rootnode02:/export/servers/hadoop-3.2.2
rootnode03:/export/servers/hadoop-3.2.25、启动Hadoop集群
1、先启动hdfs服务在node01上启动NameNode、DataNode
第一次启动hdfs服务时需要先对NameNode进行格式化。
在NameNode所
/export/servers/hadoop-3.2.2/data/dfs/name/current目录下创建一个NameNode的镜像。
当前版本hadoop如果不创建单独用户而是直接使用root用户启动会报错。
这时就需要添加之前配置的HDFS_NAMENODE_USER
/etc/profile在最后追加如下内容保存退出source
/etc/profilenode02、node03节点不要忘记配置
HDFS_SECONDARYNAMENODE_USERroot
HADOOP_PID_DIR/export/servers2、接下来启动Yarnnode02上启动ResourceManager、DataNoda
注意下在yarn-site.xml中配置了日志聚合将yarn的执行日志配置到了
hdfs上。
所以yarn建议在hdfs后启动。
当然在生产环境下需要评估这
C:\Windows\System32\drivers\etc打开hosts文件
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback