近日,IDC在《關(guān)鍵業(yè)務(wù)平臺以業(yè)務(wù)連續(xù)性助力“數(shù)字優(yōu)先”戰(zhàn)略》(Mission-Critical Platforms Deliver Continuity in the Shift to "Digital First" Strategies)報告中授予HPE Superdome Flex系列服務(wù)器AL4級別的可用性評價,并指出“HPE是AL4級市場的主要參與者”。
HPE Superdome Flex 系列服務(wù)器正是如此,基于RAS策略進行設(shè)計,可靠性(Reliability)、可用性(Availability)和可維護性(Serviceability)目標都得到了實現(xiàn),具體行動步驟包括:
1. 通過檢測和記錄錯誤來確定出現(xiàn)的故障。
2. 對故障進行分析,防止其影響到更高 級別的IT堆棧,如操作系統(tǒng)、數(shù)據(jù)庫、應用程序和數(shù)據(jù)等。
3. 修復故障來減少或避免停機。
此次IDC授予HPE Superdome Flex系列服務(wù)器AL4級評價,也充分肯定了其較高水準的RAS能力——稱HPE Superdome Flex系列服務(wù)器是具有容錯能力的平臺,在任何情況下都能連續(xù)地運行,具有覆蓋整個系統(tǒng)的硬件RAS和硬件冗余功能。
具體來看,HPE Superdome Flex的RAS功能體現(xiàn)在以下三方面:
使用RAS功能跨子系統(tǒng)進行錯誤檢測
在較低的IT層級使用子系統(tǒng)RAS功能,來收集證據(jù)以檢測錯誤、確定根本原因并找到錯誤之間的相關(guān)性。其中,內(nèi)存RAS技術(shù)可增強內(nèi)存可靠性并降低內(nèi)存中斷率。
Platform RAS提供自適應路由,能夠在系統(tǒng)發(fā)生故障處或故障鏈路周圍路由流量。HPE Superdome Flex服務(wù)器由英特爾®至強®可擴展處理器提供支持,具備了完整RAS功能,包括創(chuàng)新的錯誤檢測和重試機制。
固件優(yōu)先阻止錯誤影響操作系統(tǒng)和應用程序
內(nèi)存、CPU或I/O通道中發(fā)生的錯誤將停留在固件級別。固件可以收集錯誤數(shù)據(jù)并進行診斷,即使在處理器未完全正常工作的情況下,診斷仍能正常進行,可針對系統(tǒng)內(nèi)存、CPU、I/O和互連組件進行預測性故障分析
分析引擎對故障進行處理和糾正
分析引擎持續(xù)地對所有硬件進行故障分析。它可以預測故障,還能啟動自動恢復功能,并將問題及時告知系統(tǒng)管理員和管理軟件,進一步減少了人為錯誤的發(fā)生,并提高了系統(tǒng)的可用性。