分享好友 最新动态首页 最新动态分类 切换频道
Hadoop下载安装及HDFS配置教程
2024-12-27 03:27

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System,简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算。
简言之,Hadoop的核心就是解决两个问题,一是存储(采用HDFS,二是计算(采用MapReduce编程模型

Hadoop下载安装及HDFS配置教程

1、安装虚拟机VMware

Hadoop框架运行组lunix系统之上,那么window系统上如何运行Hadoop呢?这就需要虚拟机了。VMWare (Virtual Machine ware)是一个“虚拟PC”软件公司,它的产品可以使你在一台机器上同时运行二个或更多Windows、DOS、LINUX系统。简单来说是一种软件,用它可以在一个系统中装另外一个系统。这就满足了我们window系统上安装lunix系统的需求。

1.1 VMware Workstation Pro 15.5下载

链接:https://pan.baidu.com/s/1Z3H3SNKgmvcAYD7_Q1rQlQ
提取码:0zty

1.2 虚拟机安装

2、在虚拟机上安装CentOS系统

2.1 CentOS系统下载

https://www.jianshu.com/p/a63f47e096e8

2.2 CentOS系统安装

https://www.runoob.com/w3cnote/vmware-install-centos7.html
对于CentOS系统的安装,我建议新手直接选择【典型】配置即可,不必设置太多自定义选项。系统安装关键两点和在电脑上安装window系统一样,选择系统位置和分配磁盘空间

2.3 JDK安装和环境配置

https://www.cnblogs.com/maomao999/p/9764251.html

1、下载Hadoop

到Apache官方网站下载自己对应版本即可
https://hadoop.apache.org/releases.html

2、建议保留安装的初始CentOS系统,然后克隆这个初始系统,进行Hadoop的相关配置

3、添加ip地址和hostname以及ip和hostname的关联

3.1查看ip地址
 
 
3.2 添加ip地址到ifcfg-ens33文件
 
 
3.3 修改hostname名字
 
 
3.4 将ip与hostname关联
 
 
3.5 重启系统
 

4、将hadoop压缩包通过Xftp传到CentOS系统中

5、解压hadoop压缩包

 
 
5.1 hadoop文件结构

bin文件夹:里面都是可执行的二进制脚本文件
etc/hadoop文件夹:里面都是hadoop系统配置文件,后面对于hadoopp的配置文件都在这个目录。
sbn文件夹:里面都是可执行的二进制脚本文件,里面包括HDFS的启动,关闭
share文件夹:里面是hadoop的文档和运行核心包

6、配置hadoop环境变量

编辑环境变量

 
 
 

验证hadoop是否加入环境变量

 
 

7、配置hadoop-env.sh

将JAVA的路径配置到hadoop的环境文件中

 
 

8、配置core-sit.xml

 

1、配置哪台机器为namenode

 

2、默认hadoop的配置将数据放在系统临时目录中:/tmp/hadoop-${user.name},系统临时目录可能会导致集群数据的不安全,因此修改配置,将数据存放在指定的目录,本文将数据存放在解压后的hadoop-2.9.2的下的data文件夹下

 

9、配置hdfs-site.xml(用来对hdfs文件系统做相关配置

 

1、修改block的副本数据,因为本次hdfs是单机版的集群,只有一个服务器,3个副本也没有地方放,所以,把副本数修改为1

 

2、修改root的权限,这样可以让非root用户也可以操作hdfs

 

10、配置slaves文件,就是配置哪些机器为DataNode节点,跟随NameNode同时启动

 
 

11、格式化NameNode(仅仅第一次需要格式化

就像U盘一样,插到windows系统上需要格式化为windows的文件系统,插到lunix系统上需要格式化为lunix的文件系统

 

12、启动hdfs集群

 

查看是否启动成功

 
 

13、上传文件数据到hdfs

如将aa.txt文件上传到hdfs的根目录(/)

 

14、访问hdfs可视化管理界面

关闭防火墙

 

在浏览器中输入 IP地址:50070即可查看

最新文章
逆水寒手游江湖门派技能效果
逆水寒手游中有五大江湖门派,加入之后可以学会独特的门派技能。不少玩家对于这些门派的技能非常感兴趣,本次就给大家详细介绍一下。1、相思门相思剑法一式:突刺,对路径敌人造成伤害二式:化为剑影,跟随指定目标,持续造成伤害。三式:斩击。
还有6天,一年一度的云电脑产业嘉年华即将开启
12月18日14:00北京香格里拉饭店2024通信产业大会AI赋能云电脑创新发展论坛一年一度的云电脑产业嘉年华盘点2024云电脑产业发展特征展望2025AI云终端技术趋势发布2024云电脑产业创新调研(第二届)行业领袖纵论AI赋能产业机会和挑战最新云电
网站运营做seo/保定seo推广外包
  在有条件有能力的情况下,可以考的证书还是比较多的,也没有必要全部都考,主要看自己需要,符合需求。 那先了解一下PMP: PMP®的全称是Project Management Professional(项目管理专业人士资格认
武汉范湖万达CBD在线中学生编程培训班
课程单价:240元课时数:80节全部校区:童程童美少儿编程(河西万达中心)课程内容:课程分为3个单元,每个单元都会带领学生用AI工具从0到1完整的开发一个项目。课程特色这个阶段的学习,孩子们将收获35个AI体感游戏开发的知识点、50个程序
刺激的最多人玩的手游排行榜 2023耐玩的多人游戏top5
现在问世了不少多人玩的游戏,在多人游戏中玩家可以随便交友,跟队友一起完成一些困难任务,那么刺激的最多人玩的手游排行榜情况怎么样?现在的联机多人游戏吸引了不少玩家,市面上的多人游戏多不胜数,小编为大家挑选了五个优质的联机类游
百度推广优化攻略,揭秘提升企业品牌影响力的核心策略
百度推广优化的关键在于精准定位、内容优化、数据分析与策略调整。通过优化关键词、提升广告质量、利用数据驱动决策,企业能更有效地触达目标受众,增强品牌曝光度和用户互动,从而显著提升品牌影响力和市场竞争力。随着互联网的快速发展,
血压高和喝酒关系大吗
血压高的患者可以适量喝红酒,但不建议过多饮用。红酒中含有的多酚类物质有助于增强一氧化氮的释放,而一氧化氮能够松弛平滑肌细胞,从而使外周血管扩张,达到一定的降压效果。但是需要注意的是,虽然红酒中的这些成分有一定的好处,但并不
语音助手与chatgpt
语音助手与ChatGPT:为人机交互带来全新体验随着人工智能技术的快速发展,语音助手和自然语言处理技术成为了人机交互领域的热门研究方向。语音助手被广泛应用于智能音箱、智能手机等设备中,通过语音指令实现信息检索、语音识别、语音合成
谷歌每年260亿美元买断搜索入口,法院判为垄断行为,可能重塑互联网市场
以“不做恶”为座右铭的谷歌,终于被判定为在市场上采取了“做恶”的行为。美国联邦法官做出裁决,谷歌非法垄断了搜索市场。根据法院判决,谷歌的行为,违反了反垄断的谢尔曼法的第二条,即在美国市场上通过排他性的分销协议,建立起了一般
驻马店2020高考查分网站入口
河南省2020年高考成绩查询时间7月25日0时   河南省2020年高招各批次最低录取控制分数线7月25日0时公布,考生即可通过多种方式查询高考成绩,全省考生“一分一段表”也将同时发布。  高考查分渠道有:河南省教育厅网站、河南省招生办公
相关文章
推荐文章
发表评论
0评