- 相關(guān)推薦
HACMP認證知識:應用程序監視
除了資源組管理以外,HACMP 還可以通過(guò)以下兩種方法之一監視應用程序:
應用程序進(jìn)程監視:使用 RSCT 事件管理功能檢測進(jìn)程是否終止。
應用程序自定義監視:基于您定義的監視方法(程序或腳本)來(lái)監視應用程序的運行狀況。
注意:不能將應用程序進(jìn)程監視用于監視通過(guò) Shell 腳本啟動(dòng)的應用程序,或那些監視進(jìn)程無(wú)法確定應用程序運行狀況的應用程序。
對于監視 Shell 腳本應用程序,必須使用自定義監視方法(例如,Apache Web 服務(wù)器)。
當應用程序監視處于活動(dòng)狀態(tài)時(shí),HACMP 的行為如下:
對于應用程序進(jìn)程監視,一個(gè)內核 hook 將通知 HACMP 集群管理器所監視的進(jìn)程已終止,HACMP 將啟動(dòng)應用程序恢復過(guò)程。
要使恢復操作能夠進(jìn)行,必須提供某種方法來(lái)清理和重新啟動(dòng)應用程序(可以使用為應用程序服務(wù)器定義提供的應用程序啟動(dòng)/停止腳本)。
HACMP 嘗試重新啟動(dòng)應用程序,并等待應用程序穩定指定的時(shí)間,然后發(fā)送通知消息和/或實(shí)際將整個(gè) RG 移動(dòng)到另一個(gè)節點(diǎn)(節點(diǎn)優(yōu)先級列表中的下一個(gè)節點(diǎn))。
對于自定義應用程序監視(自定義方法),除了應用程序清理和重新啟動(dòng)方法以外,還必須提供用于執行定期應用程序測試的程序/腳本。
要規劃進(jìn)程監視器的配置,請檢查以下事項:
驗證該應用程序是否可以使用某個(gè)進(jìn)程監視器進(jìn)行監視。
檢查要監視的進(jìn)程的名稱(chēng)。必須使用準確的進(jìn)程名稱(chēng)來(lái)配置應用程序監視器。
指定擁有進(jìn)程的用戶(hù)名,例如 root。請注意,該進(jìn)程擁有者必須擁有要監視的所有進(jìn)程。
指定要監視的應用程序的實(shí)例數量(進(jìn)程數量)。缺省為一個(gè)實(shí)例。
指定在開(kāi)始監視前的等待時(shí)間(以秒為單位)。
注意:在大多數情況下,此值不應該為零。例如,對于數據庫應用程序,您可能希望將監視延遲到啟動(dòng)腳本和初始數據庫搜索已完成之后。
重新啟動(dòng)數值,表示在采取任何其他操作之前嘗試重新啟動(dòng)應用程序的次數。
在重置重新啟動(dòng)數值前應用程序必須保持穩定的間隔(以秒為單位)。
要在應用程序無(wú)法在重新啟動(dòng)數值內重新啟動(dòng)時(shí)采取的操作。缺省選擇是通知,即運行一個(gè)事件來(lái)向集群通知故障情況。還可以指定故障轉移,在此情況下,包含故障應用程序的資源組將移動(dòng)到對該資源組擁有下一個(gè)最高優(yōu)先級的集群節點(diǎn)。
重新啟動(dòng)方法(如果希望的話(huà))。(如果“Restart Count”不為零,則這是必需的。)
如果計劃建立自定義監視方法,則還要檢查:
是否已指定了要用于檢查指定應用程序的程序/腳本。
關(guān)于運行該監視方法的頻度的輪詢(xún)間隔(以秒為單位)。如果監視器在此間隔內沒(méi)有響應,則認為應用程序出錯,并啟動(dòng)恢復過(guò)程。
在用戶(hù)定義的監視方法未在輪詢(xún)間隔內返回時(shí)用于終止該監視器方法的信號。缺省信號為 SIGKILL。
開(kāi)始監視前的等待時(shí)間(以秒為單位)。例如,對于數據庫應用程序,建議將監視延遲到啟動(dòng)腳本和初始數據庫搜索已完成之后(否則,可能會(huì )認為應用程序出錯并啟動(dòng)恢復過(guò)程)。
重新啟動(dòng)數值,即在采取任何其他操作之前嘗試重新啟動(dòng)應用程序的次數。
在重置重新啟動(dòng)數值前應用程序必須保持穩定的間隔(以秒為單位)。
在應用程序無(wú)法在重新啟動(dòng)數值內重新啟動(dòng)時(shí)采取的操作。
【HACMP認證知識:應用程序監視】相關(guān)文章:
IBM認證知識:HACMP心跳檢測06-01
HACMP的歷史和發(fā)展08-19
SUN認證基本知識08-23
Adobe認證Photoshop冷知識10-12
ibm認證考試知識點(diǎn)08-05
IBM認證--基本知識介紹08-02
Linux認證考試必考知識點(diǎn)09-02