Hadoop 教程

Hadoop可运行于一般的商用服务器上,具有高容错、高可靠性、高扩展性等特点

特别适合写一次,读多次的场景

适合

  • 大规模数据

  • 流式数据(写一次,读多次)

  • 商用硬件(一般硬件)

不适合

  • 低延时的数据访问

  • 大量的小文件

  • 频繁修改文件(基本就是写1次)

Hadoop架构

//img.mukewang.com/wiki/5bf255ab0919f18803080176.jpg

  • HDFS: 分布式文件存储

  • YARN: 分布式资源管理

  • MapReduce: 分布式计算

  • Others: 利用YARN的资源管理功能实现其他的数据处理方式

内部各个节点基本都是采用Master-Woker架构


本内容均来自互联网,仅供参考,如有侵权请及时通知本站予以删除。邮箱:wiki#imooc.com (#改成@)

意见反馈 帮助中心 APP下载
官方微信