產(chǎn)品介紹:
RoseHA高可用性系統(tǒng)解決方案以低成本且簡便的方式,實現(xiàn)了兩個節(jié)點的Cluster環(huán)境.客戶只需要在原有的單機系統(tǒng)上增加一臺服務器、一個共享存儲設備,通過Rose基于共享存儲的高可用解決方案即可實現(xiàn)關鍵業(yè)務的7X24小時連續(xù)運行,對于需要更有效應用現(xiàn)有服務器資源的用戶而言,是最為適用的解決方案。
RoseHA雙機系統(tǒng)的兩臺服務器(主機)都與磁盤陣列(共享存儲)系統(tǒng)直接連接,用戶的操作系統(tǒng)、應用軟件和RoseHA高可用軟件分別安裝在兩臺主機上,數(shù)據(jù)庫等共享數(shù)據(jù)存放在存儲系統(tǒng)上,兩臺主機之間通過私用心跳網(wǎng)絡連接。配置好的系統(tǒng)主機開始工作后,RoseHA軟件開始監(jiān)控系統(tǒng),通過私用網(wǎng)絡傳遞的心跳信息,每臺主機上的RoseHA軟件都可監(jiān)控另一臺主機的狀態(tài)。當工作主機發(fā)生故障時,心跳信息就會產(chǎn)生變化,這種變化可以通過私用網(wǎng)絡被RoseHA軟件捕捉。當捕捉到這種變化后RoseHA就會控制系統(tǒng)進行主機切換,即備份機啟動和工作主機一樣的應用程序接管工作主機的工作(包括提供TCP/IP網(wǎng)絡服務、存儲系統(tǒng)的存取等服務)并進行報警,提示管理人員對故障主機進行維修。當維修完畢后,可以根據(jù)RoseHA的設定自動或手動再切換回來,也可以不切換,此時維修好的主機就作為備份機,雙機系統(tǒng)繼續(xù)工作。
RoseHA實現(xiàn)容錯功能的關鍵在于,對客戶端來說主機是透明的,當系統(tǒng)發(fā)生錯誤而進行切換時,即主機的切換在客戶端看來沒有變化,所有基于主機的應用都仍然正常運行。RoseHA采用了虛擬IP地址映射技術來實現(xiàn)此功能??蛻舳送ㄟ^虛擬地址和工作主機通訊,無論系統(tǒng)是否發(fā)生切換,虛擬地址始終指向工作主機。在進行網(wǎng)絡服務時,RoseHA提供一個邏輯的虛擬地址,任何一個客戶端需要請求服務時只需要使用這個虛擬地址。正常運行時,虛擬地址及網(wǎng)絡服務由主服務器提供。當主服務器出現(xiàn)故障時,RoseHA會將虛擬地址轉移到另外一臺服務器的網(wǎng)卡上,繼續(xù)提供網(wǎng)絡服務。切換完成后,在客戶端看來系統(tǒng)并沒有出現(xiàn)故障,網(wǎng)絡服務仍然可以使用。除IP地址外,HA還可以提供虛擬的計算機別名供客戶端訪問。對于數(shù)據(jù)庫服務,當有主服務器出現(xiàn)故障時,另外一臺服務器就會自動接管,同時啟動數(shù)據(jù)庫和應用程序,使用戶數(shù)據(jù)庫可以正常操作。
● 友好的界面
RoseHA 提供了友好直觀的圖形安裝界面和監(jiān)控管理界面。通過直觀而又方便的Java Applet管理界面,用戶可以交互式地對集群系統(tǒng)進行配置、監(jiān)控和管理,并可以利用Applet的網(wǎng)絡特性,通過網(wǎng)絡對系統(tǒng)進行遠程管理,實時地顯示出主機系統(tǒng)及服務的狀態(tài)
● 靈活的Active-Active模式和Active-Standby模式
RoseHA支持Active-Active模式和Active-Standby模式。用戶可指定每臺服務器的作用(active or standby),指定要監(jiān)控的服務和硬件部分,定義指定的服務發(fā)生故障后要采取的進一步行動(如是否重新啟動該服務、允許的最大啟動時間等)。
● 支持多條心跳路徑
可以將網(wǎng)線和RS-232串口線作為RoseHA軟件的心跳路徑。配置多條心跳路徑可以避免系統(tǒng)的單點故障。
● 支持虛擬MAC地址
在網(wǎng)絡環(huán)境中,每個IP與唯一的MAC綁定在一起。而傳統(tǒng)的集群結構下,將致使集群的活動IP在不同時刻綁定不同的MAC地址,導致跨網(wǎng)段通信出現(xiàn)問題。為了使集群軟件更好的支持這種網(wǎng)絡安全級別較高的網(wǎng)絡環(huán)境,RoseHA提供了支持虛擬MAC地址的功能,使集群環(huán)境IP地址實現(xiàn)與唯一MAC地址綁定。
● 自動切換
當系統(tǒng)出現(xiàn)故障時(如:系統(tǒng)宕機、HA進程/應用進程被殺掉、RS-232、SCSI、光纖、網(wǎng)絡線纜斷開),RoseHA 將確定故障原因,并采取相應對策,并將這些應用切換到備份服務器上。而故障服務器中未受影響的應用不會被切換,即不會受任何影響。不需要系統(tǒng)管理員干預。
● 自動檢測
在集群系統(tǒng)的每一臺服務器內(nèi),RoseHA具有兩個核心進程,它們互相監(jiān)控,如果其中一個進程失敗,另一個進程會立即進行恢復,避免了RoseHA自身服務的單點故障。
● 服務器可靠性
在主服務器出現(xiàn)故障(如掉電或宕機)時,另外一臺服務器接管故障服務器上運行的所有的關鍵性應用。
● 網(wǎng)絡可靠性
如果服務器的網(wǎng)絡部分發(fā)生故障,會導致客戶不能連接和訪問到服務器,這同樣是致命的故障。如果該服務器配備了冗余的網(wǎng)絡接口,RoseHA會使用它來恢復網(wǎng)絡連接。在沒有配備冗余的網(wǎng)絡接口,或者所有的網(wǎng)絡接口均出現(xiàn)故障時,HA會將該應用切換到另外一臺服務器上。切換完成后,客戶在短暫的切換過程后能夠繼續(xù)訪問所需的服務。
● 存儲可靠性
需要將應用的全部數(shù)據(jù)存儲在兩臺服務器都能訪問到的共享磁盤中。建議使用磁盤陣列來存儲數(shù)據(jù),這樣可以避免單點故障,而且便于對系統(tǒng)的容量進行擴充。對由Volume Manager軟件管理的磁盤陣列,RoseHA提供了相應的處理程序,以保證磁盤陣列及數(shù)據(jù)的可靠性。
● 應用可靠性
在高可用性系統(tǒng)中可以運行多個應用。每一個應用是作為一個服務而存在的。在服務器中,當某個服務失敗而其它服務正常運行時,RoseHA將處理這個失敗的服務。在將這個服務切換到另一臺服務器上時,該服務器上運行的服務也不會受到影響。對于與網(wǎng)絡不相關的純數(shù)據(jù)應用,只需要切換數(shù)據(jù)存儲和數(shù)據(jù)處理軟件。而對于與網(wǎng)絡相關的客戶機/服務器應用,除了要切換數(shù)據(jù)存儲和數(shù)據(jù)處理軟件外,還需要切換相關的虛擬IP。如果希望兩個服務獨立地進行切換,則此兩個虛擬IP地址不能相同。如果使用了相同的IP地址,在發(fā)生切換時,RoseHA會將所有使用該IP的服務都切換到另外一臺服務器上去。
● 豐富的附加功能
提供不同的針對特定應用的Agent程序,使服務監(jiān)控更切實際,更加有效;提供用于開發(fā)Agent程序的應用程序界面(API),使用者可針對特定的服務編寫Agent程序,執(zhí)行與特定服務相關的狀態(tài)診斷及錯誤恢復工作。