Hadoop的优点和缺点是什么?
Hadoop的优点
(1)Hadoop具有按位存储和处理数据能力的高可靠性。
(2)Hadoop通过可用的计算机集群分配数据,完成存储和计算任务,这些集群可以方便地扩展到数以千计的节点中,具有高扩展性。
(3)Hadoop能够在节点之间进行动态地移动数据,并保证各个节点的动态平衡,处理速度非常快,具有高效性。
(4)Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配,具有高容错性。
Hadoop的缺点
(1)Hadoop不适用于低延迟数据访问。
(2)Hadoop不能高效存储大量小文件。
(3)Hadoop不支持多用户写入并任意修改文件。
Hadoop的核心组件
Hadoop自诞生以来,主要出现了Hadoop1、Hadoop2、Hadoop3三个系列多个版本。
HDFS和MapReduce是Hadoop1的核心组件,Hadoop生态圈里的很多组件都是基于HDFS和MapReduce发展出来的。在继Hadoop1之后出现了Hadoop2,Hadoop2在Hadoop1的基础上做了改进。
相比Hadoop1,Hadoop2的三大核心组件分别是HDFS、MapReduce、Yarn。目前市面上绝大部分企业使用的是Hadoop2,本书使用的是Hadoop2.7.3这一版本。
Hadoop2的一个公共模块和三大核心组件组成了四个模块,简介如下。
(1)HadoopCommon:为其他Hadoop模块提供基础设施。
(2)HDFS:具有高可靠性、高吞吐量的分布式文件系统。
(3)MapReduce:基于Yarn系统,分布式离线并行计算框架。
(4)Yarn:负责作业调度与集群资源管理的框架。
【免责声明】本文部分系转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,如涉及作品内容、版权和其它问题,请在30日内与我们联系,我们会予以重改或删除相关文章,以保证您的权益!
Java开发高端课程免费试学
大咖讲师+项目实战全面提升你的职场竞争力
- 海量实战教程
- 1V1答疑解惑
- 行业动态分析
- 大神学习路径图
相关推荐
更多


2025-05-23



Java开班时间
-
北京 丨 8月29日
火速抢座 -
上海 丨 8月29日
火速抢座 -
广州 丨 8月29日
火速抢座 -
兰州 丨 8月29日
火速抢座 -
杭州 丨 8月29日
火速抢座 -
南京 丨 8月29日
火速抢座 -
沈阳 丨 8月29日
火速抢座 -
大连 丨 8月29日
火速抢座 -
长春 丨 8月29日
火速抢座 -
哈尔滨 丨 8月29日
火速抢座 -
济南 丨 8月29日
火速抢座 -
青岛 丨 8月29日
火速抢座 -
烟台 丨 8月29日
火速抢座 -
西安 丨 8月29日
火速抢座 -
天津 丨 8月29日
火速抢座 -
石家庄 丨 8月29日
火速抢座 -
保定 丨 8月29日
火速抢座 -
郑州 丨 8月29日
火速抢座 -
合肥 丨 8月29日
火速抢座 -
太原 丨 8月29日
火速抢座 -
苏州 丨 8月29日
火速抢座 -
武汉 丨 8月29日
火速抢座 -
成都 丨 8月29日
火速抢座 -
重庆 丨 8月29日
火速抢座 -
厦门 丨 8月29日
火速抢座 -
福州 丨 8月29日
火速抢座 -
珠海 丨 8月29日
火速抢座 -
南宁 丨 8月29日
火速抢座 -
东莞 丨 8月29日
火速抢座 -
贵阳 丨 8月29日
火速抢座 -
昆明 丨 8月29日
火速抢座 -
洛阳 丨 8月29日
火速抢座 -
临沂 丨 8月29日
火速抢座 -
潍坊 丨 8月29日
火速抢座 -
运城 丨 8月29日
火速抢座 -
呼和浩特丨8月29日
火速抢座 -
长沙 丨 8月29日
火速抢座 -
南昌 丨 8月29日
火速抢座 -
宁波 丨 8月29日
火速抢座 -
深圳 丨 8月29日
火速抢座 -
大庆 丨 8月29日
火速抢座