產(chǎn)品介紹:
創(chuàng)造性的應用“故障分級”概念,融入“智能感知”系統(tǒng),徹底顛覆傳統(tǒng)高可用集群系統(tǒng)簡單的二元化故障判斷方式,將傳統(tǒng)高可用系統(tǒng)僅對“故障”所引起的結(jié)果(如宕機)做出反應提升為對“故障”的成因(系統(tǒng)健康指標)進行監(jiān)控與分析,配合獨特的“故障預警”機制,在核心系統(tǒng)即將發(fā)生嚴重影響業(yè)務持續(xù)運作情況前及時發(fā)出“預警”,并在必要的情況下自動執(zhí)行精確而迅速的故障隔離及應用轉(zhuǎn)移,將故障事后處理提升為故障事前預知,充分保障用戶核心應用7×24小時持續(xù)可靠運作,可支持多達256個節(jié)點的應用,并為局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)上的客戶機提供高可用性的服務。
Landercluster-MN高可用集群軟件監(jiān)視程序監(jiān)視群集中每一個節(jié)點狀態(tài),并且對出現(xiàn)的故障很快地做出反應,使應用程序不會因為任何單點故障而停止服務,Landercluster高可用集群軟件可以自動探測處理器、內(nèi)存、LAN介質(zhì)、存儲設備、網(wǎng)卡、進程、應用程序?qū)崟r健康指標,并定義各種狀態(tài)下集群觸發(fā)的狀態(tài)并對分級的故障做出分級響應。
1. 智慧系統(tǒng)健康與可用性評價體系
一個核心業(yè)務系統(tǒng)的可用與否的關鍵因素是整個系統(tǒng)的健康程度,傳統(tǒng)高可用系統(tǒng)僅僅簡單的認為系統(tǒng)只有“可用”與“不可用”兩種狀態(tài),這樣的判斷雖然簡單但卻僅僅考慮了兩種極端的狀態(tài),顯然無法對系統(tǒng)進行全面保護。LanderCluster高可用集群軟件在業(yè)界首次提出了創(chuàng)造性的“系統(tǒng)健康評價體系”并加以應用,我們認為對系統(tǒng)的可用性判斷必須是持續(xù)的,而非極端的,大量的情況證明系統(tǒng)從“可用”轉(zhuǎn)向“不可用”并非是瞬間發(fā)生,而存在一個過程,在這個過程中,系統(tǒng)的某些核心指標將會提前顯示出異常,雖然此時系統(tǒng)對外表現(xiàn)出的仍然為“可用”,但整個系統(tǒng)實際已經(jīng)處于“亞健康”,對客戶端的請求反應逐漸變慢,系統(tǒng)出現(xiàn)不穩(wěn)定的跡象,系統(tǒng)整體可用性逐漸降低,如果不進行任何干預,系統(tǒng)在未來某個時點將有極大可能轉(zhuǎn)化為真正“不可用”,從而導致災難性的后果。通過LanderCluster高可用集群軟件的“系統(tǒng)健康評價體系”全新的系統(tǒng)核心指標持續(xù)檢測功能,用戶將及時發(fā)現(xiàn)系統(tǒng)的異常狀態(tài),有效判斷系統(tǒng)目前真正的“健康”程度,并且經(jīng)過對系統(tǒng)核心指標的綜合分析,將能對系統(tǒng)未來可能發(fā)生的狀況進行“預知”,直擊造成系統(tǒng)轉(zhuǎn)向“不可用”的原因,提前發(fā)現(xiàn),提前預警,提前解決,令用戶從“被動”的解決轉(zhuǎn)向“主動”的發(fā)現(xiàn)與處理,讓系統(tǒng)的可用性判斷從“不可知”轉(zhuǎn)為“可預知”。
2. 首創(chuàng)智能預警體系
當系統(tǒng)完全癱瘓時再進行拯救,猶如為心臟停止跳動的病人進行復蘇,難道不覺得太晚了嗎,如果我們能夠預知系統(tǒng)將逐漸變得不穩(wěn)定,而提前作出應對,防止系統(tǒng)崩潰,或者將突發(fā)性宕機轉(zhuǎn)化為計劃性維護,將對您產(chǎn)生更多益處。LanderCluster全新的系統(tǒng)智能預警體系,持續(xù)監(jiān)控維持核心系統(tǒng)穩(wěn)定運作的重要指標變化,包括處理器、內(nèi)存、LAN介質(zhì)、存儲設備、網(wǎng)卡、進程、應用程序?qū)崟r狀態(tài),任意指標出現(xiàn)異常狀況,即可快速作出響應,防患于未然。
3.強大的故障分級處理
傳統(tǒng)集群軟件僅將系統(tǒng)宕機定義為故障,然而"故障"就僅僅是"宕機",無法訪問嗎?真實的"故障"應當以系統(tǒng)健康狀況及用戶的承受能力作為衡量標準,不同的用戶對系統(tǒng)故障的定義是不同的,LanderCluster高可用集群軟件獨特的故障分級處理系統(tǒng)能夠滿足用戶自定義故障閥值,建立不同的故障評價標準,并對每一類故障進行自定義操作,提供最大的靈活性。同時系統(tǒng)提供豐富插件,為用戶提供精準的故障分析。
4.集群按業(yè)務分組,單組集群支持多達64個節(jié)點及64個任務
用戶環(huán)境中的關鍵業(yè)務,從邏輯上分析,可以分成若干個相對獨立的組,每一個獨立的組,包含若干個服務器,包含若干個數(shù)據(jù)安全解決方案的產(chǎn)品,LanderCluster高可用集群軟件支持為每組核心業(yè)務獨立分組,便于管理,我們把邏輯相關的服務器部署在一個服務器組里,而把邏輯不相關的服務器放入不同的服務器組里。在服務器組內(nèi),可以構建集群,復制,備份和容災等數(shù)據(jù)安全解決方案。LanderCluster高可用集群軟件在每個分組內(nèi)可支持多達64個節(jié)點,并可同時管理64個任務,LanderVault甚至可支持256節(jié)點256任務,完全滿足大型企業(yè)級用戶需求,為用戶的系統(tǒng)擴展提供了充足的空間。
5.豐富的集群備援模式
支持豐富的集群備援模式,包括:單機高可用、主從、對等、多備一、一備多、多備多、多機互備,雙存儲備援,純軟環(huán)境集群,遠程高可用,虛擬環(huán)境高可用等各類靈活方式
6.深度應用偵測代理(User Application Agent)
集群保護下的核心業(yè)務,是通過代理(Agent)實時采集應用的運行態(tài)數(shù)據(jù),結(jié)合“評價體系”來診斷系統(tǒng)可用性的??捎眯灾笜朔譃閮深悾阂活愂墙Y(jié)果類,即 模擬客戶端訪問是否成功,是否獲得期望的響應;另一類是風險類,體現(xiàn)的是系統(tǒng)當前運行態(tài)的風險指數(shù),如應用的連接數(shù)、數(shù)據(jù)庫的存儲空間使用率、Web的訪 問遲延、網(wǎng)絡的流量、CPU的負載、系統(tǒng)內(nèi)存的余量等等,這些因素都是系統(tǒng)能否正常工作的潛在風險,是進行故障預警的重要預測依據(jù)。 LanderCluster高可用集群軟件提供常用軟件的偵測代理,如Oracle、MS-Sql以及Web等,這些監(jiān)控對象的接口及方法,被靈活保存在XML配置文件中。集群提供開放的應 用代理接口,用戶可根據(jù)開發(fā)模板,自定義監(jiān)控對象的指標采集方法,就可以讓集群系統(tǒng)實時監(jiān)控這些指標,觸發(fā)相關的事件。
7.增強的跨平臺集群系統(tǒng)集中管理
用戶的核心業(yè)務系統(tǒng)往往無法在單一的平臺中運行,大量分立的環(huán)境將極大增加管理員工作復雜度,降低系統(tǒng)整體可靠度。LanderVault應用JAVA技 術,實現(xiàn)全面的跨平臺管理,允許用戶在不同的平臺中統(tǒng)一的管理整個集群,在不同平臺中擁有統(tǒng)一界面,通過增強的LanderVault集中管理平臺,用戶 能夠全面集中監(jiān)控及管理資源組內(nèi)各臺服務器的存儲資源,網(wǎng)絡負載,系統(tǒng)進程,系統(tǒng)服務,并可對目標服務器的進程及服務進行操作,從而極大簡化集中管理的復 雜度,實現(xiàn)合理資源配置。