本页使用了标题或全文手工转换

集群文件系统

维基百科,自由的百科全书
跳转至: 导航搜索

集群文件系统是指运行在多台计算机之上,之间通过某种方式相互通信从而将集群内所有存储空间资源整合、虚拟化并对外提供文件访问服务的文件系统。与NTFSEXT等本地文件系统的目的不同,集群文件系统运行在集群环境,而本地文件系统则运行在单机环境,纯粹管理块和文件之间的映射以及文件属性。

分类[编辑]

存储空间[编辑]

按照对存储空间的访问方式,集群文件系统可分为共享存储型集群文件系统和分布式集群文件系统。前者是多台计算机识别到同样的存储空间,并相互协调共同管理其上的文件,又被称为共享文件系统;后者则是每台计算机各自提供自己的存储空间,并各自协调管理所有计算机节点中的文件。Veritas英语Veritas Software的VxFS/VCS,昆腾Stornext,中科蓝鲸BWFS,EMC的MPFS都属于共享存储型集群文件系统。而Apache Hadoop的子项目HDFS、GlusterFSCeph英语Ceph (software)OpenStack的Swift项目等都属于分布式集群文件系统。分布式集群文件系统可扩展性更强,目前已知最大可扩展至10K节点。

对于分布式集群,其对文件元数据的管理方式又可以分为单一路径映像单一文件系统映像两种方式。

元数据管理[编辑]

按照元数据的管理方式,可分为对称式集群文件系统和非对称式集群文件系统。前者每个节点的角色均等,共同管理文件元数据,节点间通过高速网络进行信息同步互斥锁等操作,典型代表是Veritas的VCS。而非对称式集群文件系统中,有专门的一个或者多个节点负责管理元数据,其他节点需要频繁与元数据节点通信以获取最新的元数据比如目录列表文件属性等等,后者典型代表比如HDFS、GlusterFS、BWFS、Stornext等。对于集群文件系统,其可以是分布式+对称式、分布式+非对称式、共享式+对称式、共享式+非对称式,两两任意组合。

文件访问方式[编辑]

按照文件访问方式来分类,集群文件系统可分为串行访问式和并行访问式,后者又被俗称为并行文件系统。串行访问是指客户端只能从集群中的某个节点来访问集群内的文件资源,而并行访问则是指客户端可以直接从集群中任意一个或者多个节点同时收发数据,做到并行数据存取,加快速度。HDFS、GlusterFS、pNFS等集群文件系统,都支持并行访问,需要安装专用客户端,传统的网络文件系统网络文件共享系统客户端不支持并行访问。

目前已知的所有集群文件系统的架构逃不出分布式/共享式、串行并行、对称式/非对称式之间的两两组合。

参考资料[编辑]

  • 《大话存储 终极版》