在线精品99_中国九九盗摄偷拍偷看_91免费版在线观看_91.app_91高清视频在线_99热最新网站

分布式计算Hadoop指的是什么

138次阅读
没有评论

共计 934 个字符,预计需要花费 3 分钟才能阅读完成。

这篇文章给大家介绍分布式计算 Hadoop 指的是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。

Hadoop 是什么:Hadoop 是一个开发和运行处理大规模数据的软件平台,是 Appach 的一个用 java 语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算。

Hadoop 框架中最核心设计就是:HDFS 和 MapReduce。HDFS 提供了海量数据的存储,MapReduce 提供了对数据的计算。

数据在 Hadoop 中处理的流程可以简单的按照下图来理解:数据通过 Haddop 的集群处理后得到结果。

HDFS:Hadoop Distributed File System,Hadoop 的分布式文件系统。

大文件被分成默认 64M 一块的数据块分布存储在集群机器中。

如下图中的文件 data1 被分成 3 块, 这 3 块以冗余镜像的方式分布在不同的机器中。

MapReduce:Hadoop 为每一个 input split 创建一个 task 调用 Map 计算,在此 task 中依次处理此 split 中的一个个记录 (record),map 会将结果以 key–value 的形式输出,hadoop 负责按 key 值将 map 的输出整理后作为 Reduce 的输入,Reduce Task 的输出为整个 job 的输出,保存在 HDFS 上。

Hadoop 的集群主要由 NameNode,DataNode,Secondary NameNode,JobTracker,TaskTracker 组成。

如下图所示:

NameNode 中记录了文件是如何被拆分成 block 以及这些 block 都存储到了那些 DateNode 节点。

NameNode 同时保存了文件系统运行的状态信息。

DataNode 中存储的是被拆分的 blocks。

Secondary NameNode 帮助 NameNode 收集文件系统运行的状态信息。

JobTracker 当有任务提交到 Hadoop 集群的时候负责 Job 的运行, 负责调度多个 TaskTracker。

TaskTracker 负责某一个 map 或者 reduce 任务。

关于分布式计算 Hadoop 指的是什么就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-08-25发表,共计934字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)
主站蜘蛛池模板: 美女裸体十八禁免费网站 | 精品人妻人人做人人爽夜夜爽 | 亚洲国产精品一区 | 国产香蕉视频在线播放 | 性欧美老妇另类xxxx | 欧美亚洲国产片在线观看 | 吃奶揉捏奶头高潮视频在线观看 | 深夜视频福利 | 亚洲国产成人精品一区二区三区 | 国产美女一级做视频爱 | 国产精品激情av久久久青桔 | jj视频污| 久久国产精品一区二区三区 | 亚洲 欧洲 校园 自拍 都市 | 国产精品成人久久久 | 欧美一区二区三区精品 | 伊人狠狠色丁香综合尤物 | 丰满少妇三级全黄 | 中文国产成人精品久久无广告 | 蜜臀av在线观看 | 亚洲一区二区三区无码久久 | 四虎影视成人永久在线观看 | 性欲天堂 | 欧美亚洲日本一区 | 国产第六页 | 秋霞网琪琪韩国理论片 | 三黄日本三级在线观看 | 亚洲欧洲国产综合 | 精品国产亚一区二区三区 | 成人亚洲在线观看 | 日本在线毛片视频免费看 | 亚洲色精品vr一区区三区 | 亚洲av成人午夜福利在线观看 | 白嫩美女一级高清毛片免费看 | 一区二区国产在线播放 | 日本免费一区二区三区在线看 | 成人午夜在线观看 | 97精品依人久久久大香线蕉97 | 国产午夜精品无码 | 国产盗摄xxxx视频xxxx | 久久99久久99精品观看 |