產(chǎn)品介紹:
RoseHA高可用性系統(tǒng)解決方案以低成本且簡便的方式,實現(xiàn)了兩個節(jié)點的Cluster環(huán)境.客戶只需要在原有的單機系統(tǒng)上增加一臺服務(wù)器、一個共享存儲設(shè)備,通過Rose基于共享存儲的高可用解決方案即可實現(xiàn)關(guān)鍵業(yè)務(wù)的7X24小時連續(xù)運行,對于需要更有效應(yīng)用現(xiàn)有服務(wù)器資源的用戶而言,是最為適用的解決方案。
RoseHA雙機系統(tǒng)的兩臺服務(wù)器(主機)都與磁盤陣列(共享存儲)系統(tǒng)直接連接,用戶的操作系統(tǒng)、應(yīng)用軟件和RoseHA高可用軟件分別安裝在兩臺主機上,數(shù)據(jù)庫等共享數(shù)據(jù)存放在存儲系統(tǒng)上,兩臺主機之間通過私用心跳網(wǎng)絡(luò)連接。配置好的系統(tǒng)主機開始工作后,RoseHA軟件開始監(jiān)控系統(tǒng),通過私用網(wǎng)絡(luò)傳遞的心跳信息,每臺主機上的RoseHA軟件都可監(jiān)控另一臺主機的狀態(tài)。當工作主機發(fā)生故障時,心跳信息就會產(chǎn)生變化,這種變化可以通過私用網(wǎng)絡(luò)被RoseHA軟件捕捉。當捕捉到這種變化后RoseHA就會控制系統(tǒng)進行主機切換,即備份機啟動和工作主機一樣的應(yīng)用程序接管工作主機的工作(包括提供TCP/IP網(wǎng)絡(luò)服務(wù)、存儲系統(tǒng)的存取等服務(wù))并進行報警,提示管理人員對故障主機進行維修。當維修完畢后,可以根據(jù)RoseHA的設(shè)定自動或手動再切換回來,也可以不切換,此時維修好的主機就作為備份機,雙機系統(tǒng)繼續(xù)工作。
RoseHA實現(xiàn)容錯功能的關(guān)鍵在于,對客戶端來說主機是透明的,當系統(tǒng)發(fā)生錯誤而進行切換時,即主機的切換在客戶端看來沒有變化,所有基于主機的應(yīng)用都仍然正常運行。RoseHA采用了虛擬IP地址映射技術(shù)來實現(xiàn)此功能。客戶端通過虛擬地址和工作主機通訊,無論系統(tǒng)是否發(fā)生切換,虛擬地址始終指向工作主機。在進行網(wǎng)絡(luò)服務(wù)時,RoseHA提供一個邏輯的虛擬地址,任何一個客戶端需要請求服務(wù)時只需要使用這個虛擬地址。正常運行時,虛擬地址及網(wǎng)絡(luò)服務(wù)由主服務(wù)器提供。當主服務(wù)器出現(xiàn)故障時,RoseHA會將虛擬地址轉(zhuǎn)移到另外一臺服務(wù)器的網(wǎng)卡上,繼續(xù)提供網(wǎng)絡(luò)服務(wù)。切換完成后,在客戶端看來系統(tǒng)并沒有出現(xiàn)故障,網(wǎng)絡(luò)服務(wù)仍然可以使用。除IP地址外,HA還可以提供虛擬的計算機別名供客戶端訪問。對于數(shù)據(jù)庫服務(wù),當有主服務(wù)器出現(xiàn)故障時,另外一臺服務(wù)器就會自動接管,同時啟動數(shù)據(jù)庫和應(yīng)用程序,使用戶數(shù)據(jù)庫可以正常操作。
● 友好的界面
RoseHA 提供了友好直觀的圖形安裝界面和監(jiān)控管理界面。通過直觀而又方便的Java Applet管理界面,用戶可以交互式地對集群系統(tǒng)進行配置、監(jiān)控和管理,并可以利用Applet的網(wǎng)絡(luò)特性,通過網(wǎng)絡(luò)對系統(tǒng)進行遠程管理,實時地顯示出主機系統(tǒng)及服務(wù)的狀態(tài)
● 靈活的Active-Active模式和Active-Standby模式
RoseHA支持Active-Active模式和Active-Standby模式。用戶可指定每臺服務(wù)器的作用(active or standby),指定要監(jiān)控的服務(wù)和硬件部分,定義指定的服務(wù)發(fā)生故障后要采取的進一步行動(如是否重新啟動該服務(wù)、允許的最大啟動時間等)。
● 支持多條心跳路徑
可以將網(wǎng)線和RS-232串口線作為RoseHA軟件的心跳路徑。配置多條心跳路徑可以避免系統(tǒng)的單點故障。
● 支持虛擬MAC地址
在網(wǎng)絡(luò)環(huán)境中,每個IP與唯一的MAC綁定在一起。而傳統(tǒng)的集群結(jié)構(gòu)下,將致使集群的活動IP在不同時刻綁定不同的MAC地址,導致跨網(wǎng)段通信出現(xiàn)問題。為了使集群軟件更好的支持這種網(wǎng)絡(luò)安全級別較高的網(wǎng)絡(luò)環(huán)境,RoseHA提供了支持虛擬MAC地址的功能,使集群環(huán)境IP地址實現(xiàn)與唯一MAC地址綁定。
● 自動切換
當系統(tǒng)出現(xiàn)故障時(如:系統(tǒng)宕機、HA進程/應(yīng)用進程被殺掉、RS-232、SCSI、光纖、網(wǎng)絡(luò)線纜斷開),RoseHA 將確定故障原因,并采取相應(yīng)對策,并將這些應(yīng)用切換到備份服務(wù)器上。而故障服務(wù)器中未受影響的應(yīng)用不會被切換,即不會受任何影響。不需要系統(tǒng)管理員干預(yù)。
● 自動檢測
在集群系統(tǒng)的每一臺服務(wù)器內(nèi),RoseHA具有兩個核心進程,它們互相監(jiān)控,如果其中一個進程失敗,另一個進程會立即進行恢復(fù),避免了RoseHA自身服務(wù)的單點故障。
● 服務(wù)器可靠性
在主服務(wù)器出現(xiàn)故障(如掉電或宕機)時,另外一臺服務(wù)器接管故障服務(wù)器上運行的所有的關(guān)鍵性應(yīng)用。
● 網(wǎng)絡(luò)可靠性
如果服務(wù)器的網(wǎng)絡(luò)部分發(fā)生故障,會導致客戶不能連接和訪問到服務(wù)器,這同樣是致命的故障。如果該服務(wù)器配備了冗余的網(wǎng)絡(luò)接口,RoseHA會使用它來恢復(fù)網(wǎng)絡(luò)連接。在沒有配備冗余的網(wǎng)絡(luò)接口,或者所有的網(wǎng)絡(luò)接口均出現(xiàn)故障時,HA會將該應(yīng)用切換到另外一臺服務(wù)器上。切換完成后,客戶在短暫的切換過程后能夠繼續(xù)訪問所需的服務(wù)。
● 存儲可靠性
需要將應(yīng)用的全部數(shù)據(jù)存儲在兩臺服務(wù)器都能訪問到的共享磁盤中。建議使用磁盤陣列來存儲數(shù)據(jù),這樣可以避免單點故障,而且便于對系統(tǒng)的容量進行擴充。對由Volume Manager軟件管理的磁盤陣列,RoseHA提供了相應(yīng)的處理程序,以保證磁盤陣列及數(shù)據(jù)的可靠性。
● 應(yīng)用可靠性
在高可用性系統(tǒng)中可以運行多個應(yīng)用。每一個應(yīng)用是作為一個服務(wù)而存在的。在服務(wù)器中,當某個服務(wù)失敗而其它服務(wù)正常運行時,RoseHA將處理這個失敗的服務(wù)。在將這個服務(wù)切換到另一臺服務(wù)器上時,該服務(wù)器上運行的服務(wù)也不會受到影響。對于與網(wǎng)絡(luò)不相關(guān)的純數(shù)據(jù)應(yīng)用,只需要切換數(shù)據(jù)存儲和數(shù)據(jù)處理軟件。而對于與網(wǎng)絡(luò)相關(guān)的客戶機/服務(wù)器應(yīng)用,除了要切換數(shù)據(jù)存儲和數(shù)據(jù)處理軟件外,還需要切換相關(guān)的虛擬IP。如果希望兩個服務(wù)獨立地進行切換,則此兩個虛擬IP地址不能相同。如果使用了相同的IP地址,在發(fā)生切換時,RoseHA會將所有使用該IP的服務(wù)都切換到另外一臺服務(wù)器上去。
● 豐富的附加功能
提供不同的針對特定應(yīng)用的Agent程序,使服務(wù)監(jiān)控更切實際,更加有效;提供用于開發(fā)Agent程序的應(yīng)用程序界面(API),使用者可針對特定的服務(wù)編寫Agent程序,執(zhí)行與特定服務(wù)相關(guān)的狀態(tài)診斷及錯誤恢復(fù)工作。