`
lirenjuan
  • 浏览: 68384 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

Hadoop 相关节点说明

 
阅读更多

Hadoop框架中最核心的设计就是:MapReduce和HDFS。

 

MapReduce的思想是由Google的一篇论文所提及而被广为流传的,简单的一句话解释MapReduce就是“任务的分解与结果的汇总”。

 

HDFS是Hadoop分布式文件系统(Hadoop Distributed File System)的缩写,为分布式计算存储提供了底层支持。

 

NameNode:负责记录文件是如何分割数据块,以及这些分别被存储的。

 

DataNode:负责把HDFS数据块读写到本地文件系统中。

 

SecondaryNode:次要的nameNode,它与nameNode通信,保存最新的nameNode快照。

当nameNode宕机能及时当作备用nameNode使用。

 

Jobtracker:主要负责任务的接受,初始化,调度以及对TaskTracker的监控。

 

TaskTracker:具体的任务内容。

 

HDFS -写文件:

client - nameNode(写请求),nameNode根据文件大小分割数据块.

nameNode - client(响应请求),响应nameNode的数据块信息.

client - dataNode(存取数据块,并且进行备份).

 

HDFS - 读文件:

client - nameNode(读请求).

nameNode - client(响应请求),返回nameNode数据块的信息.

client - dataNode(读数据块)

 

HDFS设计特点:

1.块存放:默认分三块保存。

2.心跳监控dataNode状态,如发现问题及时备份,保证数据安全.

3.数据复制dataNode失败,需要平衡节点的利用率。采用threshold配置.

4.数据交验采用crc32.

5.nameNode单点失败任务处理信息保存在本地系统文件.

 

 

分享到:
评论

相关推荐

    基于hadoop2.85的hive2.3.4安装

    安装hive前提是要先安装hadoop集群,并且hive只需要再hadoop的namenode节点集群里安装即可(需要再所有namenode上安装),可以不在datanode节点的机器上安装。另外还需要说明的是,虽然修改配置文件并不需要你已经把...

    Hadoop集群(zookeeper框架下)增加服役节点_step-b-step.docx

    图文并茂,step by step,详细说明Hadoop集群(zookeeper框架下)增加服役节点操作步骤。 1. 现有集群环境情况 2. 准备工作 2.1 修改主机名 2.2 配置ssh免密登录 2.3 jdk安装 2.4 hadoop安装 2.5 关闭待新增节点的...

    大数据运维技术第4章 Hadoop文件参数配置课件.pptx

    Hadoop配置文件说明;4.1.1 Hadoop环境配置;4.1.2 Hadoop守护进程环境配置;4.1.3 Hadoop配置参数格式;4.1.3 Hadoop配置参数格式;4.1.4 获得Hadoop集群全部配置信息;4.2 在Master节点上安装Hadoop;(1)解压缩hadoop-...

    hadoop 集群搭建说明书.rar

    环境说明: 集群中包括4个节点:1个Master,3个Salve,在虚拟机上搭建的linux系统环境。节点之间局域网连接,可以相互ping通.节点IP地址分布如下:

    Docker部署本地以及集群hadoop.zip

    6 跨物理节点构建基于docker的10节点HDFS集群-说明文档-01 7. 跨物理节点构建基于docker的任意节点的HDFS集群-01 8. 见证奇迹-快速构建10节点的HDFS集群-01 本资料共包含以下附件: Docker一键部署hadoop分布式.zip

    hadoop-管理

    用户可以通过dfsadmin -safemode $value来操作安全模式,参数$value的说明如下: enter – 进入安全模式 leave – 强制NameNode离开安全模式 get – 返回安全模式是否开启的信息 wait – 等待,一直到安全模式结束。...

    Hadoop实战手册

    Hadoop 集群系统 配置安装配置20#检查node节点linux 基础环境是否正常,参考 [ linux 基础环境搭建]一节。20#配置从master 机器到 node 节点无密钥登陆20#检查master到每个node节点在hadoop用户下使用密钥登陆是否...

    操作系统课设——Hadoop文件系统

    选择需要访问的文件, 在点击DownLoad按钮, 结果如下, 返回“DONE”说明下载成功, 这时Hadoop文件夹里将出现相应的文件。 四、 编程细节: 左边为OS-FILE项目的包树状图 UI包中的OSWindow类, 是最主要的类...

    Hadoop入门实战手册

    1.1 ..................................................................................................4 什么是Hadoop? 1.2 ................................................................................

    高可用性的HDFS:Hadoop分布式文件系统深度实践

    1.4.1 Hadoop的元数据备份方案 1.4.2 Hadoop的SecondaryNameNode方案 1.4.3 Hadoop的Checkpoint ode方案 1.4.4 Hadoop的BackupNode方案 1.4.5 DRDB方案 1.4.6 FaceBook的AvatarNode方案 1.5 方案优缺点比较 第2章 ...

    Hadoop2.2.0集群搭建手册

    Hadoop2.2.0版本 - 虚拟机VMWare - Linux(ubuntu) ,多节点伪分布环境搭建详细操作手册,可以直接用于完全分布。每一步都有自己详细操作记录和相关说明,几夜风雨的辛劳搭建和测试。 此操作手册搭建的集群详细说明: ...

    从零开始Hadoop安装和配置.rar

    说明,因为这里涉及到多台计算机的共同操作,对于主节点namenode 整篇文章照做,对于datanode节点,除了Hadoop的配置,其他照做,如果配置主机数为多太,只需在后更改hadoop配置文件即可 ________________

    从零开始Hadoop安装和配置.docx

    说明,因为这里涉及到多台计算机的共同操作,对于主节点namenode 整篇文章照做,对于datanode节点,除了Hadoop的配置,其他照做,如果配置主机数为多太,只需在后更改hadoop配置文件即可 ________________

    基于Hadoop的全国酒店数据清洗项目源码+报告.zip

    基于Hadoop的全国酒店数据清洗项目源码+报告.zip结合本案例背景介绍,说明对本数据集进行分析的目的,说明采用的分析技术,实现的价值。 本案采用的数据集是全国各省市酒店的运营情况数据集,对该数据集进行分析的...

    zookeeper+hadoop+hbase+hive(集成hbase)安装部署教程(超详细).docx

    说明: 1. 安装软件版本: jdk1.8.0_131、apache-zookeeper-3.8.0、hadoop-3.3.2、hbase-2.4.12 mysql5.7.38、mysql jdbc驱动mysql-connector-java-8.0.8-dmr-bin.jar、 apache-hive-3.1.3 2.本文软件均安装在自建...

    ansible-role-hadoop:Ansible角色,用于安装Hadoop集群

    在节点集群中安装和配置Hadoop系统(2.X版)。 角色变量 可以传递给此角色的变量及其简要说明如下: # The type of the node: slave or master or resourcemanager or nodemanager or datanode or namenode ...

    Oozie安装部署及任务定义说明

    Workflow.xml中控制流程节点说明 10 action节点 10 start节点 11 end节点 11 Kill节点 12 decision节点 12 fork节点和join节点 12 工作流配置实例(oracle-hdfs-oacle) 13 Oozie任务定时调度 15 配置方式 15 oozie ...

    Hadoop概况介绍

    Hadoop成员简单介绍说明及核心框架结构说明,主要是:Haddop两大核心设计:底层用于存储集群中所有存储节点文件的文件系统HDFS来执行MapReduce的MapReduce引擎

    实验报告-hadoop分布式环境搭建.doc

    hadoop分布式环境搭建的完整详细的实验报告,基于Hadoop的伪分布式安装,3个节点的分布式集群的安装和配置说明。很详细,值得借鉴

Global site tag (gtag.js) - Google Analytics