HDFS分布式文件系统

  • 2020 年 09 月 24 日
  • 41次
  • 179 字
  • 暂无评论

HDFS 是一个文件系统,用于存储文件,通过统一的命名空间—目录树来定位文件。其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。
HDFS设计理念
分而治之:将大文件、大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析;对同一个文件进行联合管理。每个小文件做冗余备份,并且分散到不同的服务器中,做到高可靠不丢失。为各类分布式运算框架(如:mapreduce,spark,tez,……)提供数据存储服务。


版权属于:hierarch

本文链接:https://hiea.top/archives/161.html



—— 暂无评论 ——

OωO