分布式存储系统将数据分散存储在多台独立的设备上。传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,也是可靠性和安全性的焦点,不能满足大规模存储应用的需要。分布式网络存储系统采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。
简单来说:为了简化用户端的使用,提供了一个分布式缓存系统来提供对此分布式存储系统的访问接口以及本地数据缓冲以降低网络压力。传统定义:分布式存储系统是大量PC服务器通过Internet互联,对外提供一个整体的服务。
分布式存储系统具有以下几个特性
可扩展:分布式存储系统可以扩展到几百台甚至几千台这样的一个集群规模,系统的整体性能线性增长。
低成本:分布式存储系统的自动容错、自动负载均衡的特性,允许分布式存储系统可以构建在低成本的服务器上。另外,线性的扩展能力也减少服务器成本,实现分布式存储系统的自动运维。
高性能:无论是针对单台服务器,还是针对整个分布式的存储集群,都要求分布式存储系统具备高性能。
易用:分布式存储系统需要对外提供方便易用的接口,另外,也需要具备完善的监控、运维工具,并且可以方便地与其他的系统进行集成。
分布式存储系统面临的挑战
分布式存储系统的挑战主要在于数据和状态信息的持久化,要求在自动迁移、自动容错和并发读写的过程中,保证数据的一致性。
容错:如何可以快速检测到服务器故障,并自动将在故障服务器上的数据进行迁移。
负载均衡:新增的服务器如何在集群中保障负载均衡?数据迁移过程中如何能够不影响现有的服务。
事务与并发控制:如何实现分布式事务。
易用性:如何设计对外接口,使得设计的系统易于使用。
存储系统当前正处于前所未有的变革时期,一方面,大数据的发展对于数据存储的需求与日俱增;另一方面,传统存储厂商的出货量却增长并不明显,甚至有下滑的倾向。这其中很大的因素就是分布式存储逐步受到用户的青睐,这和分布式存储的特点是相关的,在大数据时代,很多企业的数据都是逐步积累的,这就要求存储系统有很好的横向扩展能力;而要对传统存储设备进行横向扩展,会带来很高的成本,但是分布式存储却能够很好地解决这样的问题。
扫一扫,获取最新资讯!
我的评论
最新评论
2020-07-13
2020-07-12
2020-07-13
2020-07-13
2020-07-12