分布式存儲的概念
分布式存儲基于標(biāo)準(zhǔn)硬件和分布式架構(gòu),將數(shù)據(jù)分散存儲到多個存儲服務(wù)器上,通過網(wǎng)絡(luò)將分散存儲的資源構(gòu)成一個虛擬的資源池,進(jìn)行統(tǒng)一管理并向外提供服務(wù)。
H3C分布式存儲包含了各種分布式文件系統(tǒng)、分布式塊存儲、分布式對象存儲、分布式數(shù)據(jù)庫和分布式緩存等。其特點是基于軟件實現(xiàn),具有成本低、擴(kuò)展性強(qiáng)、高性能、高可靠、生態(tài)開放等優(yōu)點。
分布式存儲可以提供EB級以上的存儲空間,廣泛應(yīng)用于云計算、大數(shù)據(jù)分析、AI、HPC、工業(yè)互聯(lián)網(wǎng)等場景,成為當(dāng)前處理海 量、多源和異構(gòu)數(shù)據(jù)理想的架構(gòu)。未來,對分布式存儲的應(yīng)用仍將保持高速增長趨勢。
分布式存儲節(jié)點的閃存加速與優(yōu)化
采用分布式的目的在于追求高性能、高擴(kuò)展和高可用。除了系統(tǒng)架構(gòu)外,存儲集群的整體性能還取決于其它幾個因素,其中一個重要因素就是存儲節(jié)點本身的能力。
為了提高單節(jié)點的性能,存儲節(jié)點普遍采用SSD+HDD混合部署,通過各種SSD緩存加速技術(shù)去提升節(jié)點的讀寫性能,例如:
元數(shù)據(jù)加速,將元數(shù)據(jù)和寫日志(journal)與文件數(shù)據(jù)分離,元數(shù)據(jù)和寫日志部署到獨立的SSD上,減少了讀寫元數(shù)據(jù)和寫日志對數(shù)據(jù)IO讀寫的影響,提升了整體數(shù)據(jù)讀寫的性能。