機房應急預案[熱]
在平凡的學(xué)習、工作、生活中,難免會(huì )出現一些事故,為了避免事情愈演愈烈,時(shí)常需要預先編制應急預案。你知道什么樣的應急預案才能切實(shí)地幫助到我們嗎?以下是小編精心整理的機房應急預案,歡迎閱讀,希望大家能夠喜歡。
機房應急預案1
一、為認真貫徹落實(shí)《國務(wù)院關(guān)于特大安全事故行政責任追究的規定》,積極提高我公司重點(diǎn)要害部位特大安全事故應急處理能力,努力減少各類(lèi)特大安全事故所造成的損失,消除火災事故的隱患,保障公司財產(chǎn)和員工的生命安全,特制定本預案。
二、本預案針對我公司通信機房的火災而制定。
移動(dòng)通信機房滅火流程如下:
。ㄒ唬┲蛋嗳藛T發(fā)現機房火情(包括監控中心人員)要立即到現場(chǎng)查看。
。ǘ┤绻莻(gè)別電路盤(pán)著(zhù)火,應拔出著(zhù)火的電路盤(pán),用1211或二氧化碳滅火器將火撲滅。
。ㄈ┠硻C柜幾塊電路盤(pán)及電纜著(zhù)火,應立即拔出著(zhù)火的電路盤(pán),用1211或二氧化碳滅火器噴射滅火劑將火撲滅。
。ㄋ模┤绻麢C房的機架機柜著(zhù)火,值班人員無(wú)力自滅自救時(shí),監控中心應切斷機架機柜電源或樓層電源,關(guān)閉空調,嚴禁開(kāi)窗,及時(shí)向公司安全生產(chǎn)管理領(lǐng)導小組報告。
。ㄎ澹┕景踩a(chǎn)管理領(lǐng)導小組指揮機關(guān)義務(wù)消防隊隊員進(jìn)行滅火,組織值班人員立即撤離現場(chǎng),封閉門(mén)窗,按下區域自動(dòng)滅火按鈕滅火,同時(shí)撥打119報警,大聲呼救,報告公司主管領(lǐng)導或安保值班室,監控室廣播火警。
。┰谙狸牭竭_后,應積極配合,簡(jiǎn)明扼要說(shuō)明著(zhù)
火位置,火勢情況和已采取的補救措施。
。ㄆ撸┯1211或二氧化碳滅火器噴射滅火劑能把火撲滅的,應配合消防隊保護現場(chǎng)和消除隱患,防止再次著(zhù)火。
。ò耍┯1211或二氧化碳滅火器不能把火撲滅時(shí),為防止煙熏引起人員中毒,應組織人員有序疏散,使用相應的滅火器材滅火,盡快將火撲滅。
。ň牛⿷Wo好現場(chǎng),按照事故調查處理辦法執行。
。ㄊ┗馂膱缶娫(huà): 119
三、本預案應注意的特別事項
1、當發(fā)生火災情況,進(jìn)行處理并保證人身安全的同時(shí), 根據設備的`重要性進(jìn)行相應的搶救措施,保證重要設備,特別是直通電話(huà),以及與冀北、華北相應數據的上傳,保證通道暢通。
2、搶救完主要設備,在進(jìn)行次要的設備搶修,待事故處理完畢后,進(jìn)行相應的實(shí)驗,保證設備的運行性,并進(jìn)行設備的可行性分析。
機房應急預案2
中心機房突發(fā)事件應急預案
第一條
機房突發(fā)事件包括網(wǎng)絡(luò )設備或服務(wù)器故障、自然災害(水、火、電等)造成的物理破壞、人為失誤造成的安全事件等等。針對突發(fā)事件的預防措施如下:
1.建立安全、可靠、穩定運行的機房環(huán)境,防火、防盜、防雷電、防水、防靜電、防塵;建立備份電源系統;加強所有人員防火、防盜等基本技能培訓。
2.服務(wù)器采用可靠、穩定的硬件設備,落實(shí)數據備份機制,安裝有效的防病毒軟件,及時(shí)更新升級掃描引擎;加強對局域網(wǎng)內所有用戶(hù)和信息系統管理員的`安全技術(shù)培訓。
第二條
機房漏水應急預案如下:
1.發(fā)生機房漏水時(shí),第一目擊者應立即通知機房管理人員。
2.若空調系統出現滲漏水,機房管理人員應立即安排停用故障空調,清除機房積水,并及時(shí)聯(lián)系設備供應方處理,同時(shí)啟動(dòng)備用空調,必要情況下可臨時(shí)用電扇對服務(wù)器進(jìn)行降溫。3.若為墻體或窗戶(hù)滲漏水,機房管理人員應立即采取有效措施確保機房安全,同時(shí)安排通知辦公室,及時(shí)清除積水,維修墻體或窗戶(hù),消除滲漏水隱患。
第三條
機房火災應急預案如下:
1.完善機房環(huán)境,確保機房具備二氧化碳滅火器;禁止攜帶易燃易爆物品進(jìn)入機房。2.機房管理人員應熟悉機房?jì)炔肯腊踩僮骱鸵巹t,了解消防設備操作原理,掌握消防應急處理步驟、措施和要領(lǐng),懂得滅火的方法,會(huì )撲救初起火災,并定期組織滅火演習。3.一旦發(fā)生火災,迅速切斷機房電源,避免災情的擴散,并迅速撥打物業(yè)管理和119火警電話(huà)。
4.等待消防車(chē)到來(lái)期間,應組織物業(yè)保安或工作人員在保證安全的前提下滅火,應急領(lǐng)導小組應在第一時(shí)間內集中所有二氧化碳滅火器,抓住時(shí)機,盡可能的把火撲滅。
5.配合消防部門(mén)調查事故原因,對造成的損失和起火原因做好記錄,以便進(jìn)行災后總結。
第四條
雷擊事故應急預案如下:
1.遇雷暴天氣,機房管理人員在下班后應及時(shí)關(guān)閉所有服務(wù)器,切斷電源,暫停內部計算機網(wǎng)絡(luò )工作。
2.雷暴天氣結束后,機房管理人員應及時(shí)開(kāi)通服務(wù)器,恢復內部計算機網(wǎng)絡(luò )工作,對設備和數據進(jìn)行檢查。出現故障的,事發(fā)部門(mén)應將故障情況及時(shí)報告機房管理人員。
3.因雷擊造成損失的,機房管理人員應會(huì )同相關(guān)部門(mén)進(jìn)行核實(shí)、報損,并在調查工作結束后一日內書(shū)面報告領(lǐng)導。
第五條
設備防盜被盜或人為損害應急預案如下:
1.機房管理人員每日查看、清點(diǎn)設備并鎖好機房大門(mén)。
2.機房管理人員每日檢查錄像監控服務(wù)器狀態(tài),確保監控畫(huà)面正常,并檢查每日錄像正常性、完整性。
3.發(fā)生設備被盜或人為損害設備情況時(shí),使用者或管理者應立即報告相關(guān)負責人,同時(shí)保護好現場(chǎng)。
4.機房維護人員接報后,通知保安及公安部門(mén),一同核實(shí)審定現場(chǎng)情況,清點(diǎn)被盜物資或盤(pán)查人為損害情況,做好必要的影像記錄和文字記錄。
5.事發(fā)單位和當事人應積極配合公安部門(mén)進(jìn)行調查,并將有關(guān)情況向機房管理人員匯報。
第六條
機房停電應急預案如下:
1.接到停電通知后,機房管理人員應及時(shí)通過(guò)辦公系統、電話(huà)等發(fā)布相關(guān)信息,部署應對具體措施,要求用戶(hù)在停電前停止業(yè)務(wù)、保存數據。
2.機房管理人員每日檢查UPS電源的狀態(tài),確保在突發(fā)停電時(shí),UPS電源能自動(dòng)供應服務(wù)器正常工作半個(gè)小時(shí),保證員工工作的數據及時(shí)保存。
第七條
通信網(wǎng)絡(luò )故障應急預案如下:
1.發(fā)生通信線(xiàn)路中斷、流量異常等故障后,員工應及時(shí)通知機房管理人員。
2.機房管理人員在接到報告后,迅速組織相關(guān)技術(shù)人員檢測故障區域,并作相關(guān)故障處理,必要時(shí)通知通信網(wǎng)絡(luò )運營(yíng)商查清原因;逐步恢復故障區與服務(wù)器的網(wǎng)絡(luò )聯(lián)接,恢復通信網(wǎng)絡(luò ),保證正常運轉。
3.應急處理結束后,機房管理人員應在一日之內提交故障分析報告,以便備案。
第八條
服務(wù)器故障應急預案如下:
1.機房管理人員每日檢查服務(wù)器狀態(tài),檢查郵箱服務(wù)器狀態(tài),確保系統運行的完善。
2.機房管理人員定期備份服務(wù)器數據,并將備份資料刻錄成光盤(pán)或拷貝到移動(dòng)硬盤(pán)。
第九條
1.發(fā)生機房突發(fā)事件后,機房管理人員應采取有效措施開(kāi)展先期處置,恢復信息網(wǎng)絡(luò )正常狀態(tài)。應急處置工作結束后,機房管理人員對事件發(fā)生原因、性質(zhì)、影響、后果、責任及應急處置能力、恢復重建等問(wèn)題進(jìn)行全面調查評估,根據應急處置中暴露出的管理、協(xié)調和技術(shù)問(wèn)題,改進(jìn)和完善預案,實(shí)施針對性演練,總結經(jīng)驗教訓,整改存在隱患,組織恢復正常工作秩序。
機房應急預案3
第一條 機房突發(fā)事件
包括網(wǎng)絡(luò )設備或服務(wù)器故障、自然災害(水、火、電等)造成的物理破壞、人為失誤造成的安全事件等等。 針對突發(fā)事件的'預防措施如下:
建立安全、可靠、穩定運行的機房環(huán)境,防火、防盜、防雷電、防水、防靜電、防塵;建立備份電源系統;加強防火、防盜意識。
第二條 機房漏水應急預案如下:
1、發(fā)生機房漏水時(shí),第一目擊者應立即通知機房管理人員。
2、若空調系統出現滲漏水,機房管理人員應立即安排停用故障空調,清除機房積水,并及時(shí)聯(lián)系設備供應方處理,必要情況下可臨時(shí)用電扇對服務(wù)器進(jìn)行降溫。
3、若為墻體或窗戶(hù)滲漏水,機房管理人員應立即采取有效措施確保機房安全,同時(shí)安排通知工程人員及時(shí)清除積水,維修墻體或窗戶(hù),消除滲漏水隱患。
機房應急預案4
為建立有效防范和處理火災事故的工作機制,防范消防安全事故的發(fā)生,力保消防安全事故發(fā)生時(shí)能夠快速、高效、合理有序地處置,特制定本預案。一.機房火災隱患分析 由于機房?jì)入姎庠O備多,線(xiàn)路復雜,大部分的火災都是電氣火災,引發(fā)電氣火災的主要因素有:
1.電氣線(xiàn)路短路、過(guò)載、接地電阻過(guò)大等引發(fā)火災。 2.由于機房?jì)鹊碾娔X、空調、UPS等設備長(cháng)時(shí)間不間斷運行或設備故障引發(fā) 火災。 3.靜電產(chǎn)生火災。 4.雷電等強電入侵引發(fā)火災。 二.處置程序 1.發(fā)現火情后,迅速切斷電源,利用就近滅火器進(jìn)行滅火,并按照特級事故 通報機制進(jìn)行通報,向領(lǐng)導匯報火災具體情況。
2.迅速組織相關(guān)人員攜帶消防器具趕赴現場(chǎng)滅火,并聽(tīng)從現場(chǎng)指揮人員指揮。
3.如火情較為嚴重,應立即與大廈消防中控取得聯(lián)系,并與之協(xié)商處理辦法 措施,必要時(shí)需要專(zhuān)業(yè)消防滅火的,迅速撥打119。 4.迅速組織相關(guān)人員對重要數據設備進(jìn)行轉移,盡可能保證關(guān)鍵設備安全, 引導人員進(jìn)行疏散。 三.撲救方法 1.電源或線(xiàn)路起火應首先切斷電源,絕不能用水撲救。 2.撲救機房設備時(shí),最好使用氣體(如CO2)滅火器,干粉,泡沫滅火器會(huì )對設 備造成 腐蝕,使損失增大。 四.注意事項
1.一旦機房發(fā)生火災,應遵循以下原則:首先保證人員安全;其次保證關(guān)鍵設 備安全;再保證一般設備安全。 2.火災發(fā)生時(shí),第一發(fā)現人查明起火原因,如因電源引起,應首先切斷電源。
3.火災發(fā)生后應遵循邊救火,邊報警的原則。 五.預防措施
1.設備整改:機房現有的電氣設備和消防設備均有存在不合理之處,需要整改, 消除隱患,F有的配電開(kāi)關(guān)為墻上的半埋式家用配電開(kāi)關(guān),應更換為專(zhuān)業(yè)的. 獨立空氣配電箱,修改配電柜各類(lèi)閘刀和開(kāi)關(guān)的布局,使其具備獨立切換 的功能。 現有的滅火器為干粉滅火器,且維護也已過(guò)期,干粉滅火器雖然 可以有效滅火,但是會(huì )對設備造成腐蝕,損壞設備,應更換為氣體滅火器。
2.每天定時(shí)對機房重要電氣設備和電子設備的溫度進(jìn)行了監控,能夠及時(shí)地發(fā) 現并消除隱患。 3.應組織相關(guān)人員進(jìn)行消防安全教育,學(xué)習消防知識,學(xué)會(huì )正確使用各種滅火器,有計劃的進(jìn)行相關(guān)的消防演習。
機房應急預案5
為更好的應對機房停電此類(lèi)突發(fā)事件,提高處理各類(lèi)停電事件的能力,建立健全可靠的應急機制,最大限度地降低各類(lèi)停電事件對公司各部門(mén)的影響,特制定《杭州博日有限公司機房停電事件應急預案》(以下簡(jiǎn)稱(chēng)預案)。 1.2工作原則
(1)預防為主。立足安全防護,加強預警,重點(diǎn)保護公司重要系統信息,數據安全。 (2)快速反應。發(fā)生突發(fā)事件時(shí),及時(shí)獲取充分而準確的信息,迅速處置,最大程度地減少突發(fā)事件影響。
(4)堅持“統一領(lǐng)導、協(xié)調配合、明確責任、堅守崗位”的原則。 1.3適用范圍
所有機房臨時(shí)停電,突發(fā)停電以及較長(cháng)時(shí)間停電的事件。 2.組織機構及職責
2.1組織機構(聯(lián)系人名單及聯(lián)系方式每半年更新一次)設備計量課主要聯(lián)系人及聯(lián)系方式Helpdesk:分機:XXXX。(7 X 24工作)各主要設備供應商聯(lián)系人及聯(lián)系方式:2.2各組織機構職責
1)設備計量課應盡可能及時(shí)通知所有部門(mén)停電信息,且準備好應急措施。
2).設備計量課應及時(shí)做好停電應急措施,通知各相關(guān)部門(mén)做好重要數據備份,并通知到機房設備供應商,同時(shí)做好拉閘限電的準備。為保障停電期間和恢復供電后機房所有設備正常運行,設備計量課所有相關(guān)人員在此期間必須保持隨時(shí)待命狀態(tài)。
3).機房設備供應商應做好相關(guān)設備技術(shù)支持工作,若是計劃內停電,應提前對機房設備做好停電應急方案,且在停電至恢復供電,所有設備恢復正常期間保持隨時(shí)待命狀態(tài),重要關(guān)鍵設備,須有技術(shù)支持人員現場(chǎng)侯命;突發(fā)臨時(shí)停電應盡可能做好遠程技術(shù)支持工作。
3.設備計量課應急預案
3.1機房長(cháng)時(shí)間停電應急預案
、沤拥介L(cháng)時(shí)間停電通知后,應詢(xún)問(wèn)停電原因及具體停電時(shí)間并及時(shí)通過(guò)郵件發(fā)布或電話(huà)通知停電公告,要求各部門(mén)盡可能在停電前停止業(yè)務(wù)、保存數據,關(guān)閉所有能關(guān)閉的用電設備。 ⑵根據停電時(shí)間長(cháng)短情況,協(xié)同有關(guān)部門(mén)部署應急措施,檢查應急設備是否正常,若時(shí)間條件許可模擬停電測試應急設備性能。
(3)對機房設備用電做好統計,做好拉閘限電預案。
(4)各相關(guān)技術(shù)支持人員部署到位,確保停電期間重要系統和設備運行正常,以及恢復供電后所有系統,設備運行正常。 (5)通知相關(guān)部門(mén),停電期間加強對存在安全隱患的設備及區域的巡查(如電梯間,水房等),保障公司人員和財產(chǎn)安全。
(6)機房管理人員詳細記錄事件原因及此期間采取的應急措施,備案。 3.2機房突發(fā)性臨時(shí)停電應急預案
(1)相關(guān)人員發(fā)現突發(fā)性停電時(shí)應立即報告部門(mén)領(lǐng)導,及時(shí)了解停電原因及停電時(shí)間,并立即檢查機房設備是否運行正常,檢查各系統是否運行正常,同時(shí)查詢(xún)機房設備相關(guān)記錄,計算UPS當前狀況下可供電時(shí)間,并向相關(guān)部門(mén)領(lǐng)導匯報。 (2)告知各業(yè)務(wù)部門(mén)停電相關(guān)信息,判斷停電時(shí)間長(cháng)短做好相應應急措施,提醒各部門(mén)做好數據備份以防萬(wàn)一。
(3)通知相關(guān)部門(mén)檢查存在重大安全隱患的設備運行情況(譬如電梯,水房等),保障公司人員和財產(chǎn)安全。
(4)通知IT部門(mén)機房管理人員及機房設施相關(guān)人員進(jìn)入緊急待命狀態(tài)。
(5)恢復正常后,查明停電原因,記入機房安全管理日志。 4.培訓和演習4.1培訓
IT運維部門(mén)及機房相關(guān)人員每年至少開(kāi)展一次機房停電等突發(fā)事件處理的培訓,提高機房管理人員及其相關(guān)人員的`應急能力。 4.2預案演習
各應急組織機構每年至少安排一次演練,通過(guò)演練發(fā)現應急工作體系和工作機制以及各備用設備,系統存在的問(wèn)題,不斷完善應急預案,提高應急處理能力。
5.附則
5.1預案更新
本預案結合演練和實(shí)施情況,及時(shí)進(jìn)行修訂和完善。 5.2責任與獎懲
各應急機構對在應急事件處置中作出突出貢獻的集體和個(gè)人,提出表?yè)P和獎勵;對玩忽職守,造成不良影響或嚴重后果的,按有關(guān)規定提出處理意見(jiàn),并追究其責任。 5.3制定和解釋
本預案由設備計量課制定并解釋。 5.4本預案實(shí)施或生效時(shí)間
機房應急預案6
第一條 機房突發(fā)事件包括網(wǎng)絡(luò )設備或服務(wù)器故障、自然災害(水、火、電等)造成的物理破壞、人為失誤造成的安全事件等等。 針對突發(fā)事件的預防措施如下: 建立安全、可靠、穩定運行的機房環(huán)境,防火、防盜、防雷電、防水、防靜電、防塵;建立備份電源系統;加強防火、防盜意識。
第二條 機房漏水應急預案如下:
1、發(fā)生機房漏水時(shí),第一目擊者應立即通知機房管理人員。
2、若空調系統出現滲漏水,機房管理人員應立即安排停用故障空調,清除機房積水,并及時(shí)聯(lián)系設備供應方處理,必要情況下可臨時(shí)用電扇對服務(wù)器進(jìn)行降溫。
3、若為墻體或窗戶(hù)滲漏水,機房管理人員應立即采取有效措施確保機房安全,同時(shí)安排通知工程人員及時(shí)清除積水,維修墻體或窗戶(hù),消除滲漏水隱患。
第三條 機房火災應急預案如下:
1、完善機房環(huán)境,確保機房放置滅火器;禁止攜帶易燃易爆物品進(jìn)入機房。
2、機房管理人員應熟悉機房?jì)炔肯腊踩僮骱鸵巹t,了解消防設備操作原理,掌握消防應急處理步驟、措施和要領(lǐng),懂得滅火的'方法,會(huì )撲救初起火源。
3、一旦發(fā)生火災,迅速切斷機房電源,避免災情的擴散,并迅速和保安部聯(lián)系必要時(shí)立即報火警。
第四條 機房停電應急預案如下:
1、接到停電通知后,應及時(shí)通過(guò)辦公系統、電話(huà)等發(fā)布相關(guān)信息,部署應對具體措施,要求在停電前停止業(yè)務(wù)、保存數據。
2、機房管理人員每日檢查UPS電源的狀態(tài),確保在突發(fā)停電時(shí),UPS電源能自動(dòng)供應服務(wù)器正常工作15分鐘以上,保證員工工作的數據及時(shí)保存。
第五條 通信網(wǎng)絡(luò )故障應急預案如下:
1、發(fā)生通信線(xiàn)路中斷、流量異常等故障后,發(fā)現狀況的員工或部門(mén)領(lǐng)導應及時(shí)通知網(wǎng)絡(luò )管理員。 2、網(wǎng)絡(luò )管理員了解情況后,迅速組織檢測故障區域,并作相關(guān)故障處理,逐步恢復故障區與服務(wù)器的網(wǎng)絡(luò )聯(lián)接,恢復通信網(wǎng)絡(luò ),保證正常運轉。
第六條 服務(wù)器故障應急預案如下:
1、機房管理人員每日檢查機房?jì)雀鞣⻊?wù)器狀態(tài)。
2、定期備份數據服務(wù)器數據。并將備份資料拷貝到移動(dòng)設備。服務(wù)器出現嚴重硬件故障時(shí)啟用備用服務(wù)器以保障正常運轉。
機房應急預案7
為確保辦公室機房安全與穩定,以保證正常運行為宗旨,按照“預防為主,積極處置”的原則,本著(zhù)建立一個(gè)有效處置突發(fā)事件,建立統一指揮、職責明確運轉有序、反應迅速處置有力的機房安全體系的目標,特制定本預案。
一、機房日常維護
1、建立健全機房管理制度
。1)在正常工作日內,信息技術(shù)人員負責對機房進(jìn)行監控,主要職責是:巡視網(wǎng)絡(luò )設備及系統的運行情況,發(fā)生異常情況及時(shí)處理,消除網(wǎng)絡(luò )故障隱患。
。2)節假日期間信息技術(shù)人員輪流值班,負責處理有關(guān)異常情況。
。3)機房采取來(lái)人來(lái)訪(fǎng)登記制度,未經(jīng)允許,無(wú)關(guān)人員不得進(jìn)入機房區域。
2、機房?jì)葒栏癫扇》览、防火、防塵、防靜電等措施以及機房入口處24小時(shí)監控錄像等措施。
3、認真做好數據備份工作,定期做一次數據庫完全備份,每月檢查服務(wù)器運行和備份情況。
4、信息技術(shù)人員對機房的'主要網(wǎng)絡(luò )設備(路由器、主干交換機等)進(jìn)行工作時(shí)間內全程監控,發(fā)現異常情況應及時(shí)進(jìn)行處理,確保辦公室網(wǎng)絡(luò )的正常運行。
二、機房突發(fā)事件應急處置方案
1、電源系統應急預案
。1)定期檢查機房供電設備的運行狀況和電路線(xiàn)纜器材情況,當發(fā)生下列突發(fā)事件時(shí),按照以下方案進(jìn)行處置:
。2)當機房發(fā)生市電供電突然停電或是電源異常時(shí)。檢查不間斷電源的電池可供電時(shí)間,確保設備正常運行,如遇到突然斷電,應及時(shí)將空調等設備及時(shí)斷電,預防突然來(lái)電時(shí)瞬間電流過(guò)大導致設備損壞等現象。
。3)當確定停電原因是在本身供電系統范圍內,立即匯報給負責領(lǐng)導,并及時(shí)聯(lián)系相關(guān)維護人員達到現場(chǎng)檢修。
。4)恢復供電后,嚴格按照操作程序逐步恢復機房設備,以防瞬間電流過(guò)大造成設備損壞。
2、網(wǎng)絡(luò )和服務(wù)器絡(luò )系統應急預案
。1)發(fā)生網(wǎng)絡(luò )故障時(shí),首先檢查機房設備情況,確定網(wǎng)絡(luò )故障的原因,然后聯(lián)系網(wǎng)絡(luò )維護人員,及時(shí)處理和排除故障。
。2)當確認原因為短時(shí)間無(wú)法恢復,應該及時(shí)向負責領(lǐng)導匯報,然后再聯(lián)系維護人員,及時(shí)處理故障。
。3)當人為或病毒破壞的故障發(fā)生時(shí),具體按以下順序進(jìn)行:判斷破壞的來(lái)源及性質(zhì),斷開(kāi)影響安全與穩定的信息網(wǎng)絡(luò )設備,斷開(kāi)與破壞來(lái)源的物理網(wǎng)絡(luò )連接,然后再聯(lián)系維護人員,及時(shí)處理故障。
。4)發(fā)生服務(wù)器系統故障后,應立即向相關(guān)領(lǐng)導匯報情況,同時(shí)安排人員將故障服務(wù)器脫離網(wǎng)絡(luò ),保存系統狀態(tài)不變,保護原始數據。
在確認安全的情況下,重新啟動(dòng)故障服務(wù)系統:若重啟系統成功,則檢查數據丟失情況,利用備份數據恢復;若重啟失敗,立即 聯(lián)系相關(guān)維護人員,請求技術(shù)支持,做好技術(shù)處理。
處置結束后,技術(shù)人員應將處理過(guò)程記錄下來(lái),以方便日后對此問(wèn)題的處理。
3、消防和防雷應急預案
。1)上班工作時(shí)間發(fā)生火警,還在機房工作的人員應及時(shí)緊急撤離,并立刻撥打119報警。在確保自身安全的情況下,應盡量使用滅火器進(jìn)行滅火,減少電子設備的損壞。同時(shí)采取關(guān)閉電源總閘等措施,盡量減少可能造成的損失和破壞。
。2)非工作時(shí)間或節假日休息時(shí)間值班人員發(fā)現火情后,要立刻撥打119報警,并立刻通知相關(guān)部門(mén)和領(lǐng)導,做好火災的處置工作。
。3)火情結束之后,機房相關(guān)人員應全體趕赴現場(chǎng),同時(shí)立即聯(lián)系相關(guān)網(wǎng)絡(luò )公司和設備相關(guān)廠(chǎng)家,及時(shí)評估事故損失情況,研討恢復網(wǎng)絡(luò )系統正常運行的最佳解決方案。
。4)遇雷暴天氣或接上級部門(mén)雷暴氣象預警,應關(guān)閉所有服務(wù)器,切斷電源,暫停內部計算機網(wǎng)絡(luò )工作。雷暴天氣結束后,及時(shí)開(kāi)通服務(wù)器,恢復內部計算機網(wǎng)絡(luò )工作。因雷擊造成的損失,應及時(shí)進(jìn)行核實(shí)、報損,并將詳細情況向部門(mén)領(lǐng)導匯報。
4、自然災害和盜搶?xiě)鳖A案
。1)發(fā)生自然災害后,首先應該組織人員撤離現場(chǎng)。當確認災害不會(huì )造成人生傷害后,在回到機房檢查設備,立刻向上級領(lǐng)導匯報,并聯(lián)系相關(guān)網(wǎng)絡(luò )和設備廠(chǎng)家,積極做好災后恢復工作,確保在最短時(shí)間內
恢復機房正常運行。
。2)發(fā)生盜搶事件后,要保護好現場(chǎng)然后報警,并向上級領(lǐng)導匯報情況。待現場(chǎng)處理完畢后,要組織相關(guān)人員估計損毀情況,并聯(lián)系相關(guān)網(wǎng)絡(luò )和設備廠(chǎng)家,積極做好恢復工作。
機房應急預案8
高性能計算技術(shù)及應用水平已成為顯示綜合國力的一種標志。高性能計算機持續不間斷地為用戶(hù)提供高性能計算服務(wù),而運維應急預案是主機運行中處理突發(fā)事件的依據和方法,是主機系統穩定運行的保障。本文簡(jiǎn)要介紹上海超級計算中心主機運維應急預案,供同行參考。
1.主機和運維管理制度簡(jiǎn)介
超級計算機是功能最強、運算速度最快、存儲容量最大的一類(lèi)計算機。目前只有少數國家掌握研發(fā)技術(shù),系統造價(jià)非常昂貴,多用于國家高科技領(lǐng)域和尖端技術(shù)研究,是國家科技發(fā)展水平和綜合國力的重要標志。上海超級計算中心作為上海信息港主體工程之一,國家和上海市政府投資先后引進(jìn)神威-I超級計算機、神威-64P集群計算機、曙光4000A超級計算機系統并投入商業(yè)化運行。
上海超級計算中心自20xx年正式開(kāi)通至今,這些高性能計算機系統已安全、穩定運行七年多時(shí)間,上機用戶(hù)取得了豐碩的科研成果和社會(huì )效益。在這七年中,為保障這些高性能計算機系統安全、穩定、不間斷地運行,技術(shù)支持部在中心引進(jìn)第一臺高性能計算機--神威-I超級計算機系統的同時(shí),建立了機房應急預案、運行記錄、設備運行參數等基礎運維制度,在二期引進(jìn)曙光4000A超級計算機系統過(guò)程中,不斷完善原有運維制度,并針對該主機系統特點(diǎn)編寫(xiě)了大量操作方法和應急預案。
中心自20xx年獲得ISO27001(BS7799)信息安全認證以來(lái),技術(shù)支持部根據其要求規范了文檔體系建設,形成了機房管理制度、應急預案、操作方法、運行情況記錄的四大類(lèi)運維文檔。
正是這些運維管理制度的不斷完善和有效執行,才確保了資產(chǎn)價(jià)值高、服務(wù)對象廣、社會(huì )影響大的中心主機系統安全、穩定運行,保障重點(diǎn)項目、用戶(hù)服務(wù)的連續性。
2.應急預案重要性
上海超級計算中心機房運維管理文檔劃分為機房管理制度、應急預案、操作方法、運行記錄共四大類(lèi)(如圖1所示)。
圖1應急預案分類(lèi)
應急預案在應急系統中起著(zhù)關(guān)鍵作用,它明確了在突發(fā)緊急情況發(fā)生之前、發(fā)生過(guò)程中以及剛剛結束之后,誰(shuí)負責做什么、何時(shí)做,以及相應的策略和資源準備等。它是針對可能發(fā)生的重大事故,按照其影響和后果嚴重程度,在應急準備、響應、操作各個(gè)方面預先做出的詳細安排,是開(kāi)展及時(shí)、有序和有效事故應急工作的行動(dòng)指南。因此,應急預案在這四類(lèi)運維管理文檔中處于最為重要的地位。
3.應急預案分類(lèi)
應急預案按重要性和事件種類(lèi),可以劃分為消防預案、斷電預案、空調預案、其他預案共4種,預案各文檔之間彼此獨立又互為關(guān)聯(lián),具有非常強的可操作性。制定預案的指導原則是盡一切可能,最大限度地確保向用戶(hù)提供的服務(wù)不中斷。在緊急事件發(fā)生的情況下,保證核心設備連續運行,避免存儲數據丟失。在事件處置完成后,能快速恢復高性能計算服務(wù)。
3.1消防預案
消防預案是主機房最重要的應急預案。該類(lèi)預案根據《上海超級計算中心滅火和應急疏散預案》的原則并結合主機房主機設備和消防設備的運行特性而制定。主要由《主機房消防應急預案》和《主機房氣體噴淋消防系統啟動(dòng)撤離及處置應急預案》2個(gè)文檔組成。
消防應急預案:該預案著(zhù)重規范了火警事件發(fā)生后,所有主機維護人員如何根據所屬區域和現場(chǎng)情況,判斷和選擇正確的處理方法,同時(shí)配合中心物業(yè)人員處置,降低事件帶來(lái)的影響。
對于設備發(fā)生煙霧,主機維護人員協(xié)同物業(yè)人員尋找煙霧點(diǎn)予以切斷相關(guān)區域電源;當設備發(fā)生可以控制火情,協(xié)同物業(yè)人員滅火;當主機房發(fā)生火災而無(wú)法控制,應采取施救方法等措施。
氣體噴淋預案:該預案描述主機房氣體噴淋系統啟動(dòng)的響應和確認并具體規定了撤離機房路線(xiàn)、善后處置。
這兩個(gè)預案中,消防應急預案作為消防預案的主體,涉及到如何處理與消防有關(guān)情況的各個(gè)方面。氣體噴淋預案是主機房發(fā)生重大火災時(shí)應對的最終滅火手段和人員撤離引導方法。
3.2斷電預案
斷電預案的重要性?xún)H次于消防預案。該類(lèi)預案根據中心供配電系統實(shí)際情況和各種斷電影響范圍下對主機運行的最小保障要求而制定的。主要由《主機房斷電應急預案》、《曙光4000A超級計算機系統緊急關(guān)機操作方法》、《曙光4000A超級計算機系統雙路斷電關(guān)機操作方法》等多個(gè)文檔組成主機房斷電應急預案:該預案用于斷電情況下,主機維護人員如何與中心物業(yè)部門(mén)聯(lián)系控制主機房供電情況,并且負責對主機系統運行受斷電影響程度做出正確判斷。指導維護人員按影響程度,分別選用預案中對應的操作方法。本預案在所有斷電預案中起指導思想作用。緊急關(guān)機操作方法:該預案制定了主機系統在緊急情況下,最快速度關(guān)機的操作步驟。主要用于發(fā)生煙霧、明火或消防、斷電預案需在數分鐘內關(guān)機斷電的事件。
雙路斷電關(guān)機操作方法:該緊急操作預案主要用于在外界雙路供電全部中斷情況下的操作。
該預案的關(guān)機原則是:根據實(shí)際電力供應考慮操作步驟,寧慢勿快,在時(shí)間允許的情況下,最大程度保證存儲節點(diǎn)、SAN和SCSI存儲設備、工程用戶(hù)的計算節點(diǎn)的運行,盡可能減少關(guān)閉范圍,以確保能在恢復供電的情況下,主機盡快恢復正常運行狀態(tài),減少影響范圍。
3.3空調預案
超級計算機系統在運行中消耗大量電能,在
提供高性能的計算能力同時(shí)產(chǎn)生大量的熱量,必須采用專(zhuān)用空調系統,以保持主機系統適當的溫、濕度、空氣潔凈度等運行環(huán)境需求。因此,專(zhuān)用空調系統與主機系統密切相關(guān),空調預案是主機房必備的應急預案。
制定該預案的原因在于,斷電情況下,空調與主機系統存在互相牽制的現狀。主機和空調系統均為外界雙路供電,主機系統配有UPS不間斷電源系統,而空調系統無(wú)UPS支持。在雙路停電情況下,主機系統可獲得UPS電池組支持運行若干分鐘,空調系統無(wú)UPS支持只能停機。由于在無(wú)空調冷卻情況下,主機系統會(huì )在短時(shí)間內積聚大量熱量導致超過(guò)運行警戒溫度,主機系統在有可供電余量的情況下,仍將被迫關(guān)機。因此,確?照{中斷情況下的主機運行環(huán)境是該預案的制定原則。
預案根據各臺主機配備的空調系統特點(diǎn)制定,由《曙光機房空調系統故障應急預案》和《神威機房空調系統應急預案》2個(gè)文檔組成,這里僅介紹曙光機房空調系統應急預案。
該預案的第一步:考慮增強主機系統散熱效果,采用打開(kāi)主機機柜前后門(mén),和機房周邊木門(mén),在通風(fēng)道上布置有UPS支持的應急風(fēng)扇,形成空氣對流,帶走熱空氣,從而增強主機系統散熱效果,降低升溫速度。
該預案的第二步:在采取上述措施并持續升溫到一定溫度之上的情況下,考慮緊急關(guān)閉部分或全部計算節點(diǎn),減少熱量生成,確保主機系統的核心存儲和網(wǎng)絡(luò )系統不受影響,確?照{系統修復后,主機系統能快速恢復運行。
3.4其他預案
除了固定的三類(lèi)預案之外,技術(shù)支持部還根據主機系統實(shí)際運行中出現的各種意外情況,隨時(shí)制定具有針對性的預案。
如《大樓頂棚坍塌應急操作方法》的制定,就
是由于20xx年1月連續發(fā)生雨雪等災害性天氣,中心大樓頂棚大量積雪且難融化,物業(yè)預計存在情況繼續惡化,有發(fā)生頂棚坍塌事故的可能,一旦發(fā)生將影響一樓主機運行。
針對該突發(fā)的隱患,中心技術(shù)支持部制定應急操作方法,對維護巡查頻度范圍、漏水可能發(fā)生位置、如何處理受漏水影響的主機設備等操作步驟進(jìn)行嚴格界定。即使在最后,中心大樓頂棚經(jīng)受住災害性天氣的考驗,該預案并未發(fā)揮作用,這正體現了應急預案的備而不用的`特點(diǎn)。而且通過(guò)各種意外
情況的迅速分析、應對和實(shí)踐操練,不斷鍛煉主機維護隊伍,使之走向成熟。
4.在實(shí)際案例中,應急預案的作用
在主機系統年復一年的運行中,我們希望這些設備正常穩定運行,應急預案永遠不會(huì )被使用,然而在實(shí)際運行中,總免不了因突發(fā)事件執行應急預案。
而每次突發(fā)事件是檢驗應急預案制定是否科學(xué)、有效的最好證明。
4.1雙路斷電,UPS正常運行案例
20xx年8月某天,因打雷導致供電一路跳閘自動(dòng)換至另一路供電,曙光機房2臺空調掉電。
主機維護人員立即按應急預案操作,電話(huà)通知物業(yè)人員恢復空調運行,恢復過(guò)程中所有空調相繼出現高溫報警,機柜液晶屏平均溫度35度,開(kāi)啟全部曙光機柜前后門(mén),打開(kāi)神威-曙光玻璃門(mén)并調集應急電扇,于12:45恢復正常。
12:50再次出現雙路供電中斷,曙光空調因無(wú)
UPS支撐全部斷電,啟動(dòng)斷電應急預案,開(kāi)啟
5、6號木門(mén),開(kāi)啟神威機房全部空調,布置電扇,將冷氣導入曙光機房,熱量從6號木門(mén)的外部通道排出,選擇性殺除部分作業(yè),至13:05供電恢復,曙光空調開(kāi)始工作,13:20環(huán)境恢復正常。全機在此過(guò)程中,正常運行未停機,只損失了部分不重要的作業(yè)。
4.2單路斷電,UPS失效案例
20xx年8月某天,因低壓配電柜開(kāi)關(guān)至UPS房間X-JM柜電纜發(fā)生相對地短路,造成UPS機組逆變器自身保護動(dòng)作,關(guān)閉UPS機組,導致曙光主機系統失電。
全機掉電后,主機維護人員迅速按應急預案
手工關(guān)閉所有電源開(kāi)關(guān)。10:30恢復供電,溫濕度恢復正常后,全機加電,恢復過(guò)程中修復
storage00
1、00
5、010三個(gè)盤(pán)陣的9個(gè)用戶(hù)文件系統,修復15個(gè)節點(diǎn)加電故障,除cnode00
9、anode029電源
環(huán)境模塊故障,于當日15:10全機系統恢復正常。
由于處置及時(shí),主機受影響范圍很小,在恢復供電后數小時(shí)即成功開(kāi)啟全系統。
5.隨時(shí)保持應急預案的適用性
主機長(cháng)年累月的運行,故障和問(wèn)題的發(fā)生,往往是必然的,也是客觀(guān)、無(wú)法回避的。因此,要求在維護工作中,預先考慮到可能的問(wèn)題和故障,制定完善的應急預案。應急預案不可能包含所有的故障和問(wèn)題,但應根據維護經(jīng)驗,盡可能地設想各種危機情況下的處置措施。做到預想到各種可能的問(wèn)題。
而在形成應急預案后,更重要的是持續地在
運行中加以完善、測試和演練,盡可能模擬實(shí)際情況,做到即使只有1名維護人員在場(chǎng),也能在真正發(fā)生危機時(shí),以最短時(shí)間獨立處置故障。
以目前中心的主機運維工作為例,三年內,僅斷電預案就已根據實(shí)際運行情況的變化,制定并更新了5~6個(gè)版本,針對夏季突發(fā)斷電也有專(zhuān)用預案。這樣的措施,直接保障了20xx年8月突發(fā)斷電事件中的主機連續運行。而20xx年8月的突發(fā)斷電事件中,由于預案在之前剛根據實(shí)際情況進(jìn)行過(guò)演練和修改,主機維護人員僅用半小時(shí)就完成所有應急操作動(dòng)作,整機僅有個(gè)別設備故障,確保了主機設備未因突發(fā)斷電而發(fā)生大范圍損壞現象,恢復供電后直接完成開(kāi)機。
實(shí)踐證明,完善而適用的應急預案能保障向用戶(hù)提供穩定的高性能計算服務(wù)。
6.結束語(yǔ)
完備而適用的應急預案能有效降低主機系統因意外事件發(fā)生帶來(lái)的運行風(fēng)險,對可能發(fā)生的意外來(lái)說(shuō),是一種事前防范措施。但對整個(gè)主機系統產(chǎn)品而言,是一種事后防范措施。如果主機系統生產(chǎn)廠(chǎng)商能把這些防范措施納入整個(gè)系統設計過(guò)程中,使操作方法更加簡(jiǎn)便、更趨于人性化,這將幫助主機維護人員更為妥善處理意外事件,用戶(hù)得到更為穩定的高性能計算服務(wù)。我們相信未來(lái)國產(chǎn)的高性能計算機能做到這一點(diǎn),期待著(zhù)這一天早日到來(lái)。
。閹椭私,特在附錄中節選部分雙路斷電關(guān)機預案內容)
附錄:《曙光4000A超級計算機系統雙路斷電關(guān)機操作方法》(省略具體操作步驟)
曙光4000A超級計算機系統雙路斷電關(guān)機操作方法
注意:
1、本方法專(zhuān)用于主機房發(fā)生雙路同時(shí)斷電緊急操作使用。(包括單線(xiàn)斷電切換失。。
2、本方法作為《曙光-4000A超級計算機系統緊急關(guān)機操作方法》(SSCS(TS)-XXXX-XXXX-XXXX)的附件。
1.斷電確認及操作:
主機房?jì)纫坏┌l(fā)現斷電,并接物業(yè)明確通知為雙路斷電,首先執行如下操作(即確保節點(diǎn)溫度):
1.1打開(kāi)機房門(mén)便于散熱,..
1.2機房通道上布置應急風(fēng)扇加強冷熱空氣對流,夏季:應急風(fēng)扇布置..;冬季:應急風(fēng)扇布置..,使曙光
機房的溫度盡量降低。
1.3打開(kāi)所有機柜前、后門(mén)。
1.4密切注意機房節點(diǎn)平均溫度(專(zhuān)指各機柜液晶面板所示之環(huán)境溫度值)。
2.緊急關(guān)機條件確認:
在完成上述操作后,密切觀(guān)察主機房環(huán)境。一旦有如下任何一個(gè)條件滿(mǎn)足:
2.1自斷電發(fā)生起,已達到XX分鐘仍未恢復供電;
2.2采取上述緊急通風(fēng)措施,節點(diǎn)溫度持續上升,超過(guò)XX℃;
可認定為緊急斷電事件,即刻按下列緊急關(guān)機操作方法進(jìn)行操作。
3.緊急關(guān)機操作步驟:
注意事項:
3.1..
3.2關(guān)機操作的全過(guò)程中,注意隨時(shí)保持和物業(yè)的通訊聯(lián)系。除根據情況隨時(shí)聯(lián)絡(luò )外,應嚴格保證每XX分鐘與物
業(yè)聯(lián)系一次,詢(xún)問(wèn)UPS可支撐時(shí)間及恢復供電可能。(分機、手機、對講機等)
3.3應理解關(guān)機原則為:根據實(shí)際電力供應考慮操作步驟,寧慢勿快,在時(shí)間允許的情況下,最大程度保證X排節
點(diǎn)、存儲節點(diǎn)、SAN和SCSI存儲設備的運行,盡可能減少關(guān)閉范圍,以確;謴。
第一級操作:(首先執行)關(guān)閉主機系統外圍設備..
第二級操作:(完成上述操作后,當再次發(fā)現UPS電池低于XX分鐘或節點(diǎn)平均溫度超過(guò)XX℃,任一條件滿(mǎn)足,執行如下操作)
關(guān)閉非重要用戶(hù)計算節點(diǎn)(ABC組)..
第三級操作:(完成上述操作后,當再次發(fā)現UPS電池低于XX分鐘或節點(diǎn)平均溫度超過(guò)XX℃,任一條件滿(mǎn)足,執行如下操作)
關(guān)閉所有用戶(hù)計算節點(diǎn)(D組)..
第四級操作:(完成上述操作后,當再次發(fā)現UPS電池低于XX分鐘或節點(diǎn)平均溫度超過(guò)XX℃,任一條件滿(mǎn)足,執行如下操作)
關(guān)閉SAN存儲設備和LSF數據庫服務(wù)器..
第五級操作:(完成上述操作后,當再次發(fā)現UPS電池低于XX分鐘或節點(diǎn)平均溫度超過(guò)XX℃,任一條件滿(mǎn)足,完成關(guān)機操作)
關(guān)閉SCSI磁盤(pán)陣列和所有存儲節點(diǎn)..
特別關(guān)注:
1.如時(shí)間非常緊急,UPS電池低于XX分鐘:
直接執行關(guān)機腳本:..
此腳本可分別將計算節點(diǎn)、接入節點(diǎn)、存儲節點(diǎn)進(jìn)行關(guān)閉。
2.如時(shí)間極其緊急,UPS電池低于XX分鐘,可按《曙光-4000A超級計算機系統緊急關(guān)機操作方法》(SSCS(TS)-XXXX-XXXX-XXXX),直接拉閘操作。
。ㄉ鲜龆䝼(gè)方法僅用于突發(fā)情況,非極其必要情況下嚴禁使用,應使用前列方法操作)
3.如遇主機失電(如關(guān)機操作不及已掉電或突發(fā)自動(dòng)掉電)應關(guān)閉所涉范圍所有設備電閘開(kāi)關(guān)。..
機房應急預案9
機房消防安全工作極為重要,一旦發(fā)生火災,將直接影響大廈內設備正常運行,并對人身安全和經(jīng)濟財產(chǎn)造成巨大的損失。為防范消防安全事故發(fā)生,保證消防安全事故發(fā)生時(shí)能夠快速、高效、合理有序地處置,特制定本預案。
一、電氣火災的主要因素
1、電氣線(xiàn)路短路、過(guò)載、接地電阻過(guò)大等引發(fā)火災。
2、由于機房?jì)仍O備長(cháng)時(shí)間不間斷運行或設備故障引發(fā)火災。
3、靜電產(chǎn)生火災。
4、雷電等強電入侵引發(fā)火災。
二、處置程序
1、發(fā)現火情后,迅速切斷電源,利用就近滅火器進(jìn)行滅火,并按照特級事故通報機制進(jìn)行通報,向領(lǐng)導匯報火災具體情況。
2、迅速組織相關(guān)人員攜帶消防器具趕赴現場(chǎng)滅火,并聽(tīng)從現場(chǎng)指揮人員指揮。
3、如火情較為嚴重,應立即與大廈消防中控取得聯(lián)系,并與之協(xié)商處理辦法措施,必要時(shí)需要專(zhuān)業(yè)消防滅火的,迅速請示領(lǐng)導撥打119。
三、注意事項
1、一旦機房發(fā)生火災,應遵循以下原則:首先保證人員安全;其次保證關(guān)鍵設備安全;再保證一般設備安全;救火過(guò)程中應邊救火,邊報警。
2、火災發(fā)生時(shí),第一發(fā)現人查明起火原因,如因電源引起,應首先切斷電源。
四、預防措施
1、對機房?jì)入姎庠O備定期檢查。發(fā)現存在問(wèn)題的設備及時(shí)維修,消除安全隱患。
2、每天定時(shí)對機房重要電氣設備和電子設備的溫度進(jìn)行了監控,能夠及時(shí)地發(fā)現并消除隱患。
3、應組織相關(guān)人員進(jìn)行消防安全教育,學(xué)習消防知識,學(xué)會(huì )正確使用各種滅火器,有計劃的`進(jìn)行相關(guān)的消防演習。
機房應急預案10
第一章 總則
第一條 為規范我所網(wǎng)絡(luò )中心機房設備管理,提高處理機房突發(fā)事件的能力,形成科學(xué)、有效、反應迅速的應急工作機制,確保重要計算機信息系統的實(shí)體安全、運行安全和數據安全,最大限度地減少突發(fā)事件造成的危害,根據《中華人民共和國計算機信息系統安全保護條例》、《信息化建設員工遵循守則》及《企業(yè)信息安全管理制度》等相關(guān)管理規定等,制定《網(wǎng)絡(luò )中心機房應急預案及管理辦法》(以下簡(jiǎn)稱(chēng)管理辦法)。
第二條 本文件適用于有計劃性、有預防性地管理我所的網(wǎng)絡(luò )中心機房以及發(fā)生和可能發(fā)生的與機房有關(guān)的突發(fā)事件。
第三條 信管部負責編制、修訂網(wǎng)絡(luò )中心機房管理辦法及所轄范圍內突發(fā)機房事件應急預案。
周期性或即時(shí)性地向局域網(wǎng)用戶(hù)發(fā)布系統安全警示;對異常流量來(lái)源進(jìn)行監控,并妥善處理各種異常情況。及時(shí)組織專(zhuān)業(yè)技術(shù)人員對所轄范圍內機房突發(fā)事件進(jìn)行應急處置;負責調查和處理機房突發(fā)事件,及時(shí)上報并按照相關(guān)規定作好善后工作。
第二章 中心機房管理辦法
第四條 機房?jì)鹊乃性O備需要定期保養,應指定人員做維護、清潔工作,做到兩天一收拾,一周一打掃;嚴禁將各種食物、飲用品帶入機房,在機房?jì)冉刮鼰煛?/p>
第五條 計算機設備維修工作由專(zhuān)門(mén)人員進(jìn)行,管理人員應把設備的檢修情況記錄在相應的設備卡上,以便統一歸檔管理。如發(fā)現機房設備故障應及時(shí)向上級領(lǐng)導報告,并負責計算機及外設的日常維護與排除故障,在遇到設備保修范圍內的故障時(shí),應及時(shí)催促供應單位上門(mén)或將機器送修;
第六條 系統管理人員必須嚴格遵守有關(guān)機房、設備及系統運行管理規定,不得在機房?jì)葟氖屡c系統管理、運行維護、系統安裝和調測等無(wú)關(guān)的工作;
第七條 如其他人員需使用機房?jì)仍O備應向機房負責人提交申請,經(jīng)主管人員審核簽字后,將書(shū)面申請提交信管部存檔后方可借用機房?jì)鹊脑O備;
第八條 做好防火、防雨、防濕、防盜工作,注意用電安全;機房?jì)鹊沫h(huán)境要每周檢查溫度、濕度、電力系統、是否滿(mǎn)足機房相關(guān)的標準要求;
第九條 系統管理人員應定時(shí)對機房供電系統及其他運行中的系統、設備進(jìn)行巡視和檢查,建立檔案,做好系統日志。要對發(fā)生的故障以及排除故障情況做好詳細記錄;機房管理人員每日檢查UPS電源的狀態(tài),確保在突發(fā)停電時(shí),UPS電源能自動(dòng)供應機房設備正常工作半個(gè)小時(shí),保證機房設備的數據及時(shí)保存。
第十條 要統一管理機房?jì)鹊脑O備,計算機及其相關(guān)設備的驅動(dòng)程序、保修卡等隨機文件與資料要保存完整。要明確專(zhuān)人負責計算機文檔、信息化等資料的保管,要做到資料齊全,存放安全;
第十一條 機房?jì)鹊慕粨Q機和服務(wù)器系辦公自動(dòng)化的關(guān)鍵設備,任何人不得自行配置或更改系統參數;
第十二條 要做好機房的安全工作,對服務(wù)器的各種帳戶(hù)、密碼嚴格保密。對網(wǎng)絡(luò )運行理,設備維修維護、系統或設備安裝等進(jìn)入機房,必須由機房管理人員陪同進(jìn)入,做好登記,并配合項目的實(shí)施。
第十七條 進(jìn)入機房的設備應在進(jìn)入機房前拆除外包裝,以保證機房環(huán)境的清潔和安全。
第十八條 嚴禁攜帶易燃、易爆、易腐蝕等危險性物品進(jìn)入機房。
第三章 機房用電管理規定
第十九條 機房?jì)忍峁┑腢PS電源只允許為主機、服務(wù)器、網(wǎng)絡(luò )及存儲等核心設備供電,嚴禁安插其他設備,增加UPS電源供電負荷。
第二十條 嚴禁擅自切斷供電系統,確因工作需要斷電時(shí),首先應做好相應準備工作,經(jīng)部門(mén)領(lǐng)導批準,然后給所有部門(mén)發(fā)放斷電通知,最后方可實(shí)施。
第二十一條 機房?jì)劝惭b用電設備或有用電需求的項目時(shí),必須經(jīng)過(guò)專(zhuān)業(yè)人員或設備提供商的安裝工程師進(jìn)行現場(chǎng)勘查,經(jīng)確認在滿(mǎn)足或符合要求后工程才能實(shí)施。
第四章 機房施工管理規定
第二十二條 任何進(jìn)入機房的施工,施工單位必須指明施工管理人員。
第二十三條 施工人員進(jìn)入機房,必須遵守機房有關(guān)管理規定,不得攜帶與施工無(wú)關(guān)的物品進(jìn)入機房,并自覺(jué)接受保安人員或機房管理人員的管理、監督和檢查。
第二十四條 施工人員未經(jīng)許可不得進(jìn)入非指定工作區域,施工前須布置適當的防護設施;施工人員在現場(chǎng)嚴禁吸煙,不得在機房的任何地方坐臥,飲食,或從事與施工無(wú)關(guān)的事情。
第二十五條 施工人員在施工過(guò)程中不得擅自動(dòng)用機房設施和設備,如因施工管理不善造成機房設施、財產(chǎn)及其他一切經(jīng)濟損失,施工單位必須承擔責任并負責賠償。
第五章 機房安全管理規定
第二十六條 進(jìn)入機房的人員必須遵守《機房出入管理規定》以及有關(guān)規章制度。
第二十七條 機房?jì)鹊脑O備、工具及相關(guān)資料應存放在指定地點(diǎn),未經(jīng)許可不得私自帶出機房。
第二十八條 機房?jì)葒澜鼰,嚴禁存放易燃、易爆、易腐蝕等危險性物品,嚴禁動(dòng)用明火;禁止在電器設備上放置紙張等其它雜物;不得存放與系統運行維護和管理無(wú)關(guān)的設備、物品和資料。
第二十九條 機房管理人員或保安巡檢員應熟悉機房環(huán)境以及安全通道的位置,應懂得防火知識,滅火常識,熟悉機房消防設施的使用方法,具有及時(shí)發(fā)現火災隱患的能力。
第三十條 未經(jīng)批準,不得擅自對網(wǎng)路拓撲結構、連接方式進(jìn)行修改或拆接,如需作拆接或修改,需經(jīng)信管部經(jīng)理同意后方可進(jìn)行,并把修改情況記錄在案,未經(jīng)允許,機房管理人員、保安人員不得動(dòng)用機房?jì)鹊挠嬎銠C網(wǎng)絡(luò )設備,線(xiàn)路等。
第六章 中心機房突發(fā)事件應急預案
第三十一條 機房突發(fā)事件包括網(wǎng)絡(luò )設備或服務(wù)器故障、自然災害(水、火、電等)造成的物理破壞、人為失誤造成的`安全事件等等。 針對突發(fā)事件的預防措施如下:
1、建立安全、可靠、穩定運行的機房環(huán)境,防火、防盜、防雷電、防水、防靜電、防塵;建立備份電源系統;加強所有人員防火、防盜等基本技能培訓。
2、服務(wù)器采用可靠、穩定的硬件設備,落實(shí)數據備份機制,安裝有效的防病毒軟件,及時(shí)更新升級掃描引擎;加強對局域網(wǎng)內所有用戶(hù)和信息系統管理員的安全技術(shù)培訓。
第三十二條 機房漏水應急預案如下:
1、發(fā)生機房漏水時(shí),第一目擊者應立即通知機房管理人員。
2、若空調系統出現滲漏水,機房管理人員應立即安排停用故障空調,清除機房積水,并及時(shí)聯(lián)系設備供應方處理,同時(shí)啟動(dòng)備用空調,必要情況下可臨時(shí)用電扇對服務(wù)器進(jìn)行降溫。
3、若為墻體或窗戶(hù)滲漏水,機房管理人員應立即采取有效措施確保機房安全,同時(shí)安排通知辦公室,及時(shí)清除積水,維修墻體或窗戶(hù),消除滲漏水隱患。
第三十三條 機房火災應急預案如下:
1、完善機房環(huán)境,確保機房FM200自動(dòng)滅火系統工作正常,設置為滅火系統為自動(dòng)狀態(tài)。
禁止攜帶易燃易爆物品進(jìn)入機房。
2、機房管理人員應熟悉機房?jì)炔肯老到y安全操作和規則,了解機房?jì)菷M200滅火消防設備操作原理,掌握消防應急處理步驟、措施和要領(lǐng),懂得滅火的方法,會(huì )撲救初起火災,并定期組織滅火演習。
3、一旦發(fā)生火情,要迅速切斷電源(電源已和消防系統聯(lián)動(dòng)),利用機房專(zhuān)用滅火系統滅火,使用氣體滅火系統,要保證機房?jì)人腥藛T全部撤離現場(chǎng),方可放氣滅火(緊急情況采用手動(dòng)啟動(dòng),見(jiàn)氣體滅火系統操作手冊);如機房氣體滅火系統失效,在保證人員安全的情況下要立即使用備用手持式滅火器手動(dòng)滅火,同時(shí)以最快的方式向主管領(lǐng)導匯報,盡快增加援助人員協(xié)力救火,并迅速撥打物業(yè)管理和119火警電話(huà)。
4、等待消防車(chē)到來(lái)期間,應組織物業(yè)保安或工作人員在保證安全的前提下滅火,應急領(lǐng)導小組應在第一時(shí)間內集中所有可用滅火器,抓住時(shí)機,盡可能的把火撲滅。
5、配合消防部門(mén)調查事故原因,對造成的損失和起火原因做好記錄,以便進(jìn)行災后總結。
第三十四條 雷擊事故應急預案如下:
1、遇雷暴天氣,機房管理人員在下班后應及時(shí)關(guān)閉所有服務(wù)器,切斷電源,暫停內部計算機網(wǎng)絡(luò )工作。
2、雷暴天氣結束后,機房管理人員應及時(shí)開(kāi)通服務(wù)器,恢復內部計算機網(wǎng)絡(luò )工作,對設備和數據進(jìn)行檢查。出現故障的,事發(fā)部門(mén)應將故障情況及時(shí)報告信管部。
3、因雷擊造成損失的,機房管理人員應會(huì )同相關(guān)部門(mén)進(jìn)行核實(shí)、報損,并在調查工作結束后一日內書(shū)面報告領(lǐng)導。
第三十五條 設備防盜被盜或人為損害應急預案如下:
1、機房管理人員每日查看、清點(diǎn)設備并鎖好機房大門(mén)。
2、機房管理人員每日檢查錄像監控服務(wù)器狀態(tài),確保監控畫(huà)面正常,并檢查每日錄像正常性、完整性。
3、發(fā)生設備被盜或人為損害設備情況時(shí),使用者或管理者應立即報告信管部負責人,同時(shí)保護好現場(chǎng)。
4、信管部接報后,通知保安及公安部門(mén),一同核實(shí)審定現場(chǎng)情況,清點(diǎn)被盜物資或盤(pán)查人為損害情況,做好必要的影像記錄和文字記錄。
5、事發(fā)單位和當事人應積極配合公安部門(mén)進(jìn)行調查,并將有關(guān)情況向信管部匯報。
第三十六條 機房停電應急預案如下:
接到停電通知后,信管部應及時(shí)通過(guò)辦公系統 、電話(huà)等發(fā)布相關(guān)信息,部署應對具體措施,要求涉及到的工作人員在停電前停止業(yè)務(wù)、保存數據。
1、確認電力可能恢復的時(shí)間,立即通知中心機房電源維護負責人和中心機房各設備的負責人到達現場(chǎng),做好各機房停電準備。
如果確認機房停電的時(shí)間為短時(shí)間停電,立即可以恢復供電的情況(如15分鐘以?xún),根據UPS電池使用周期和壽命,電池后備時(shí)間將會(huì )減少,應根據現場(chǎng)實(shí)際情況,留出機房設備正常關(guān)機時(shí)間),可以在UPS正常供電的時(shí)間內,應密切觀(guān)察UPS帶負載時(shí)間,等到電力恢復,期間如UPS剩余時(shí)間低于50%(應滿(mǎn)足機房設備正常關(guān)機時(shí)間),機房負責人應立即嚴格按操作手冊停掉機房?jì)鹊乃性O備(包括各應用服務(wù)器、存儲、核心交換機和路由期等設備的電源,以及機房輔助設備的電源,最后關(guān)閉UPS(見(jiàn)UPS操作手冊),等待電力恢復,電力恢復供電后轉第七條執行。
如果不能確認恢復供電時(shí)間,立即匯報給機房電源維護負責人和中心機房各設備的負責任到達現場(chǎng)。做好各設備的電源停電準備,嚴格按操作手冊停掉機房?jì)鹊乃性O備(包括各應用服務(wù)器、存儲、核心交換機和路由期等設備的電源,以及機房輔助設備的電源,最后關(guān)閉UPS(見(jiàn)UPS操作手冊),等待電力恢復,電力恢復供電后轉第4條執行。
2、機房維護負責人將停電的電源柜總空開(kāi)和分空開(kāi)的狀態(tài)處于斷開(kāi)狀態(tài),關(guān)閉順序應為,先關(guān)閉回路小開(kāi)關(guān),再關(guān)閉總開(kāi)關(guān)(UPS關(guān)閉后,應先關(guān)閉UPS輸出回路開(kāi)關(guān),再關(guān)閉UPS輸出總開(kāi)關(guān),接著(zhù)關(guān)閉UPS輸入開(kāi)關(guān))并向主管領(lǐng)導匯報。
3、將掉電的所有的設備電源狀態(tài)處于下電狀態(tài),以防止電源柜加電對設備的沖擊。
4、電力室恢復供電后,先不要急于給電源柜加電,等待10-20分鐘后,再開(kāi)始給電源柜加電,以防止供電不穩或再次掉電。
5、供電正常后,確定設備處于下電狀態(tài)后,打開(kāi)電力柜的總控開(kāi),開(kāi)啟UPS的市電輸入開(kāi)關(guān),開(kāi)啟UPS(見(jiàn)UPS操作)。
6、根據設備加電順序,啟動(dòng)分路空開(kāi)。
7、設備加電順序,網(wǎng)絡(luò )設備正常后再給服務(wù)器、存儲等設備加電開(kāi)機。(以上各設備務(wù)必按操作手冊的啟動(dòng)順序上電)。
8、設備啟動(dòng)正常后,開(kāi)始啟動(dòng)數據庫。
9、數據庫啟動(dòng)正常后,開(kāi)始啟動(dòng)中間件服務(wù)器。
10、中間件服務(wù)器正常后,啟動(dòng)應用程序。
第三十七條 通信網(wǎng)絡(luò )故障應急預案如下:
1、發(fā)生通信線(xiàn)路中斷、流量異常等故障后,員工應及時(shí)通知信管部人員。
2、信管部在接到報告后,迅速組織相關(guān)技術(shù)人員檢測故障區域,并作相關(guān)故障處理,必要時(shí)通知通信網(wǎng)絡(luò )運營(yíng)商查清原因;逐步恢復故障區與服務(wù)器的網(wǎng)絡(luò )聯(lián)接,恢復通信網(wǎng)絡(luò ),保證正常運轉。
3、應急處理結束后,信管部應在一日之內提交故障分析報告,以便備案。
第三十八條 服務(wù)器故障應急預案如下:
1、機房管理人員每日檢查機房設備工作狀態(tài),確保系統運行的完善。
2、機房管理人員定期備份數據和資料,并將備份資料刻錄成光盤(pán)或拷貝到移動(dòng)硬盤(pán)。
第三十九條 發(fā)生機房突發(fā)事件后,信管部應采取有效措施開(kāi)展先期處置,恢復信息網(wǎng)絡(luò )正常狀態(tài)。應急處置工作結束后,信管部對事件發(fā)生原因、性質(zhì)、影響、后果、責任及應急處置能力、恢復重建等問(wèn)題進(jìn)行全面調查評估,根據應急處置中暴露出的管理、協(xié)調和技術(shù)問(wèn)題,改進(jìn)和完善預案,實(shí)施針對性演練,總結經(jīng)驗教訓,整改存在隱患,組織恢復正常工作秩序。
第七章 附則
第四十條 信管部會(huì )結合信息網(wǎng)絡(luò )快速發(fā)展和經(jīng)濟社會(huì )發(fā)展狀況,配合相關(guān)法律法規的制定、修改和完善,適時(shí)修訂管理辦法。
第四十一條 本文件由信息管理部制定并負責解釋。
第四十二條 本文件經(jīng)批準后發(fā)布實(shí)施。
20xx年05月10日
上海市xx信管部
機房應急預案11
計算機機房作為所有業(yè)務(wù)、應用系統的核心,一旦計算機機房發(fā)生突發(fā)事件,將對單位的數據等造成嚴重損失。為此,特制訂機房突發(fā)事件應急預案。
一、機房突發(fā)事件定義
機房突發(fā)事件是指由特殊原因引發(fā)威脅機房安全并且不能通過(guò)日常維護手段解決的事件。比如,火災、漏電、斷電等非人為或者人為的事件,重大突發(fā)事件發(fā)生后,應立即組織現場(chǎng)救護或臨時(shí)處置,控制事態(tài)發(fā)展,最大限度地減少損失和影響。
二、機構和職責
機房突發(fā)事件應急小組單位領(lǐng)導:
機房突發(fā)事件應急小組部門(mén)領(lǐng)導:
機房突發(fā)事件應急小組成員:
各責任人職責:
應急小組單位領(lǐng)導:負責單位層面及范圍內的決策與領(lǐng)導。
應急小組部門(mén)領(lǐng)導:負責部門(mén)層面及范圍內的決策與領(lǐng)導并組織實(shí)施突發(fā)事件預案。
應急小組成員:按崗位職責分工,聽(tīng)從指揮,服從安排全力以赴解決突發(fā)事件。
三、突發(fā)事件報警
應區分原因在第一時(shí)間報警。
自然災害(火災),撥打火警電話(huà):119人為事件(非法盜取、攻擊等)撥打匪警電話(huà):110人員傷亡,撥打急救電話(huà):120其他時(shí)間(斷電等),撥打值班電話(huà):
四、突發(fā)事件處理
突發(fā)事件發(fā)生后,應立即啟動(dòng)應急預案。
1、失火、漏水:
視事件的緊急程度,應急小組成員要在領(lǐng)導的指揮下,有組織、有順序的備份數據、關(guān)閉服務(wù)器的電源;組織人力轉移設備。如果自動(dòng)設備未能正常啟動(dòng),應在組長(cháng)安排下首先切斷機房的水、電路,組織人力采用滅火器等滅火設備人工滅火,同時(shí)要在第一時(shí)間報警。
2、斷電:
在城電斷電的情況下,機房的備用電力將發(fā)揮作用,電力供應最長(cháng)可持續4小時(shí)。由于機房空調沒(méi)有備用電力,如確認是供電局斷電,應立即聯(lián)系發(fā)電機發(fā)電;如果不是供電局斷電,而是由于辦公樓電力線(xiàn)路故障引起的.斷電,應立即通知電工查找原因,盡快排出故障。如果無(wú)法盡快恢復供電,在電力延續期間,應盡快結束未執行完畢的任務(wù),如無(wú)法完成需及時(shí)備份數據,同時(shí)應關(guān)閉所有非必須服務(wù)器,盡量不讓機房溫度過(guò)高,保證網(wǎng)絡(luò )設備的正常運行,以便保障集中在單位的應用系統能正常使用。
五、恢復生產(chǎn)
突發(fā)事件結束后,有關(guān)人員應首先對現場(chǎng)進(jìn)行清理,匯總損失情況并上報各級領(lǐng)導。緊急召開(kāi)專(zhuān)項會(huì )議分析損失情況,制定數據恢復計劃。設備損失的要及時(shí)更換設備,保證恢復計劃的順利進(jìn)行。
恢復生產(chǎn)后,系統管理員應對各系統進(jìn)行自查,上報書(shū)面報告,并由部門(mén)領(lǐng)導匯總后上報單位領(lǐng)導。
機房管理員在恢復生產(chǎn)后要及時(shí)檢查各項維持系統,如UPS、滅火器、漏水、漏電探測器等是否正常運行,應及時(shí)更換受損的元器件,補充滅火器的填充物。
機房應急預案12
機房是我單位的重要場(chǎng)所,重要儀器、設備相對集中,一旦發(fā)生事故,會(huì )造成嚴重后果 。為此特制定本應急預案。
一、觸電
。1) 一旦發(fā)生觸電事故,應迅速安全切斷電源,切忌直接接觸觸電者。
。2) 即刻撥打緊急電話(huà)120并通知相關(guān)領(lǐng)導,同時(shí)開(kāi)展現場(chǎng)應急救護 。
二、火災
1、報警程序:
即刻通知領(lǐng)導及相關(guān)部門(mén),根據火情大小如需報警立即就近用電話(huà)或手機報告消防中心(電話(huà)119).。
2、組織實(shí)施:
機房管理員一旦發(fā)現火情后,應即刻切斷電源,并使用滅火器撲救起火設備。
三、空調漏水
若空調系統出現滲漏水,應立即安排停用故障空調,清除機房積水,并及時(shí)聯(lián)系設備供應方處理,同時(shí)臨時(shí)用電扇進(jìn)行降溫。
四、設備發(fā)生被盜或人為損害事件
。 1)發(fā)生設備被盜或人為損害設備情況時(shí),使用者或管理者應立即報告中心負責人,同時(shí)保護好現場(chǎng)。
。 2)中心負責人接報后,通知保衛處,一同核實(shí)審定現場(chǎng)情況,清點(diǎn)被盜物資或盤(pán)查人為損害情況,做好必要的影像記錄和文字記錄。
。 3)當事人應當積極配合公安部門(mén)進(jìn)行調查, 并將有關(guān)情況向領(lǐng)導匯報。
五、機房停電
。1)接到長(cháng)時(shí)間停電通知后,應及時(shí)發(fā)布相關(guān)信息,部署應對具體措施。
。2)如遇臨時(shí)停電,且停電時(shí)間在3小時(shí)之內,管理員要檢查UPS是否正常工作,以確保機房設備的.正常運行。。
六、網(wǎng)絡(luò )故障
。1)發(fā)生通信線(xiàn)路中斷、路由故障、流量異常等故障后,網(wǎng)絡(luò )管理員應及時(shí)查清通信網(wǎng)絡(luò )故障位置,隔離故障區域,組織相關(guān)技術(shù)人員檢測故障區域,逐步恢復故障區與服務(wù)器的網(wǎng)絡(luò )聯(lián)接,恢復通信網(wǎng)絡(luò ),保證正常運轉。
。2) 事態(tài)或后果嚴重的,應及時(shí)報告領(lǐng)導并請求協(xié)助解決。
七、不良信息和病毒事件
。1)發(fā)現不良信息或網(wǎng)絡(luò )病毒時(shí),管理員應立即斷開(kāi)網(wǎng)線(xiàn),終止不良信息或網(wǎng)絡(luò )病毒傳播,并報告。
。2)中心負責技術(shù)人員應采取隔離網(wǎng)絡(luò )等措施,及時(shí)殺毒或清除不良信息,并追查不良信息來(lái)源。
。3)事態(tài)或后果嚴重的,應及時(shí)報告相關(guān)領(lǐng)導以及相關(guān)部門(mén)。
八、服務(wù)器軟件系統故障
。1)發(fā)生服務(wù)器軟件系統故障后,在確認安全的情況下,重新啟動(dòng)故障服務(wù)器系統;重啟系統成功,則檢查數據丟失情況,利用備份數據恢復;
。2)若重啟失敗,應立即安排備份服務(wù)器啟用,并請求技術(shù)人員支援,作好技術(shù)處理。
九、注意事項:
第一、機房管理員要加強日常監控,及時(shí)處理、消除及上報安全隱患。
第二、備齊安全相關(guān)裝備。
第三、及時(shí)做好備份。
機房應急預案13
第一條:機房意外停電后,首先確定停電的范圍以及受影響的設備范圍。
第二條:確認停電的范圍為本公司或本機房,應立即聯(lián)系工機科電話(huà)匯報。估算電力可能恢復的'時(shí)間,并通知直接上級。
第三條:如果確認停電的時(shí)間在1個(gè)小時(shí)內,可以在UPS正常供電的時(shí)間內,等到電力恢復。如果不能確認在2個(gè)小時(shí)內恢復供電,需及時(shí)到達現場(chǎng)。做好各設備的電源停電準備。在UPS供電達1.5個(gè)小時(shí)后,嚴格按操作手冊停掉存儲和各應用服務(wù)器的電源,最后停核心交換機和路由期。等待電力恢復,電力恢復供電后轉第七條執行。如果確認停電的范圍僅在于本機房電源故障,立即匯報給機房電源維護負責人。
第四條:機房維護負責人將掉電的電源柜總空開(kāi)和分空開(kāi)的狀態(tài)處于下電狀態(tài)。并向直接領(lǐng)導匯報,馬上聯(lián)系相關(guān)廠(chǎng)家,如有可能請廠(chǎng)家立即到現場(chǎng)支持。第五條:將掉電的所有的設備電源狀態(tài)處于下電狀態(tài),以防止電源柜加電對設備的沖擊。
第六條:等各廠(chǎng)家和相關(guān)的人員到齊后,商議設備恢復時(shí)因注意的事項,并形成相關(guān)文檔。
第七條:電力室恢復供電后,先不要急于給電源柜加電,等待10—20分鐘后,再開(kāi)始給電源柜加電,以防止供電不穩或再次掉電。
第八條:供電正常后,確定設備處于下電狀態(tài)后,打開(kāi)電力柜的總控開(kāi)。第九條:根據設備加電順序,啟動(dòng)分項空開(kāi)。第十條:設備加電順序,網(wǎng)絡(luò )交換類(lèi)設備正常后再給磁盤(pán)陣列柜加電,存儲狀態(tài)檢查正常后,啟動(dòng)主機(以上各設備務(wù)必按操作手冊的啟動(dòng)順序上電)。第十一條:設備啟動(dòng)正常后,開(kāi)始啟動(dòng)數據庫。第十二條:數據庫啟動(dòng)正常后,開(kāi)始啟動(dòng)中間件服務(wù)器。第十三條:中間件服務(wù)器正常后,啟動(dòng)應用程序。
第十四條:機房設備進(jìn)行全面點(diǎn)檢,確認所有設備運行和服務(wù)正常。
機房應急預案14
由于機房?jì)炔坑秒娫O備多,供電線(xiàn)路復雜,電器設備連續運轉,導致線(xiàn)路設備發(fā)熱量大,甚至出現線(xiàn)路設備提前老化,極易發(fā)生供電線(xiàn)路和電氣設備起火現象,任何人員一旦發(fā)現火情,要沉著(zhù)冷靜視火情情況進(jìn)行操作:
1:“先斷電,后滅火”是撲滅電氣火災的基本原則,在切斷電源時(shí)要根據現場(chǎng)火勢、著(zhù)火設備進(jìn)行判斷,考慮重要負荷、消防電源的影響以及配電系統回路的分布,防止火災未救,人員先被電擊或灼傷。如果發(fā)現機柜內設備出現內部打火、冒煙但沒(méi)有明火出現時(shí),要立即拔掉該設備的電源插頭,并把該設備拿離機柜,防止危害其他設備;發(fā)現局部輕微著(zhù)火不危機其他設備的情況下,要立即斷開(kāi)該設備電源,并組織人員利用就近消防器材進(jìn)行滅火,防止火勢蔓延擴大,并向領(lǐng)導報告;發(fā)現設備火勢大危機整個(gè)機柜但不危機人員生命還能控制時(shí),立即對應機柜編號,斷開(kāi)整個(gè)機柜電源,并組織人員使用氣體滅火器進(jìn)行撲火,發(fā)現UPS電池組著(zhù)火時(shí)先斷開(kāi)電池組箱體上的控制開(kāi)關(guān),必要時(shí)再斷開(kāi)電源室控制UPS的總斷路器,用氣體滅火器滅火,如果火勢大不能控制應立即向負責人匯報、撥打119報警,根據情況切斷機房總電源再進(jìn)行組織滅火。
2:組織實(shí)施:在消防車(chē)來(lái)之前,先盡力使用現有消防設備將火勢控制在最小范圍。 消防車(chē)來(lái)之后,值班人員配合消防專(zhuān)業(yè)人員撲救或作好輔助工作。 迅速組織人員逃生,原則是“先救人,后救物”, 及時(shí)安全地疏散人員和財產(chǎn)轉移;饎荽髸r(shí)可用滅火器邊噴邊撤退,確保人員安全。
3:注意事項:發(fā)現火災撥打火警電話(huà)119報警時(shí)要講清詳細地址、起火部位、著(zhù)火物質(zhì)、火勢大小、報警人姓名電話(huà)、并派人到路口迎候消防車(chē);馂氖鹿适滓囊粭l是保護人員安全,撲救要在確保人員不受傷害的前提下進(jìn)行。 發(fā)現火災時(shí)應掌握的`原則是邊救火,邊報警。人員在逃生時(shí)應掌握正確的逃離方法。救火時(shí)不要冒然開(kāi)窗,以免空氣對流,加速火勢蔓延。
4:滅火器材:電氣火災隱患存在具有一定的隱蔽性,它的發(fā)生來(lái)得快具有突發(fā)性,促成火災發(fā)生的原因受多因素影響而且各因素之間具有關(guān)聯(lián)性,火災形成后的分解物中有毒氣,容易蔓延,即使斷電也可能有殘留電壓存在,所以撲滅電氣火災應用氣體滅火器,“二氧化碳”滅火器主要適用于撲滅貴重設備、檔案資料、電氣設備和其他一般物質(zhì)的初期火災。不導電,電壓超過(guò)600v時(shí),應切斷電源;“1211”滅火器是一種具有高效、低毒、腐蝕性小、滅火后不留痕跡、不導電、使用安全、儲存期長(cháng)的新型優(yōu)良滅火劑,特別適用于撲滅油類(lèi)、電氣設備、精密儀器及一般有機溶劑的火災;
值班人員應經(jīng)常開(kāi)展事故預想、安全活動(dòng)討論、學(xué)習消防知識、模擬消防演練等多種形式的活動(dòng),增強對火災事故處理方法的認識,在火災事故發(fā)生時(shí)能做到頭腦清晰、有條不紊,提高火災事故處理的效率。同時(shí)還要對已發(fā)生的火災事故的原因進(jìn)行認真分析,調查處理,做到四不放過(guò):
。1)事故原因不查清不放過(guò);
。2)事故責任者得不到處理不放過(guò);
(3)整改措施不落實(shí)不放過(guò);
。4)教訓不吸取不放過(guò),預防火災事故再次發(fā)生。
機房應急預案15
核心機房電力的保障一直是維護體系的頭等重要事項,通過(guò)實(shí)施應急發(fā)電演練,建立了可靠的應急預案機制,最大限度的降低電源中斷對網(wǎng)絡(luò )傳輸質(zhì)量的影響,F分享核心機房電源中斷應急預案,希望分公司盡快建立一套統一指揮、職責明確、反應迅速、處置有力的機房安全保障機制。
組織架構:
責任領(lǐng)導、工程維護、網(wǎng)絡(luò )監控、網(wǎng)絡(luò )運維、質(zhì)量管理等相關(guān)人員。
機房電源系統說(shuō)明:
1、機房電力是兩路三相四線(xiàn)制供電,進(jìn)線(xiàn)線(xiàn)纜規格為:RVV50*4+16*1銅芯護套線(xiàn)。
2、機房電源系統采用三級防雷系統,三級防雷分別位于電源進(jìn)線(xiàn)端、UPS輸入前端。
3、機房現有兩臺60KVA-UPS電源,均處于正常運行狀態(tài)。
4、機房現有設備機柜已編號,均通過(guò)UPS電源和市電供電,每個(gè)機柜有獨立的20A空氣開(kāi)關(guān)?照{、墻壁插座開(kāi)關(guān)、應急燈、照明等都是單獨空開(kāi)接市電。
5、運行中的UPS電源所帶負荷,在逆變運行狀態(tài)下能正常工作約4小時(shí)(已經(jīng)過(guò)UPS放電測試)。
一、核心機房電源中斷預案
1、在接到停電通知的情況下:
1)計劃性停電通知要確保綜合部、工維機房管理部對口人接到通知(提前將對口聯(lián)系人備案在物業(yè)處),機房管理員接到計劃停電通知后,升級到調度中心進(jìn)行信息發(fā)送,同步進(jìn)行郵件通知相應應急小組成員。并與負責組長(cháng)及責任領(lǐng)導電話(huà)告知,確保已經(jīng)接收到本次停電的時(shí)間及可能發(fā)生的情況。
2)維部進(jìn)行發(fā)電應急預案小組成員通知,提前做好機房發(fā)電預案要求的準備工作,將相應的發(fā)電機、連接線(xiàn)、人員安排到位,各司其職,隨時(shí)待命現場(chǎng),做發(fā)電準備工作。確保停電時(shí)刻的電力安全及機房用電的保障措施,提前調度安排好相應人員做好保障用電的措施。
3)計劃停電時(shí)間開(kāi)始后,馬上啟動(dòng)應急發(fā)電操作,按照機房發(fā)電操作步驟實(shí)施階梯供電的步驟,恢復市電保障。并進(jìn)行現場(chǎng)值守及設備工作確認,確保全部正常后電話(huà)告知調度中心及維護體系領(lǐng)導。
2、在沒(méi)有接到任何通知,突然發(fā)生停電的情況下:
確認停電線(xiàn)路,停電時(shí)刻,停電時(shí)間等要素,啟動(dòng)核心機房發(fā)電應急預案。
1)值班網(wǎng)管工作流程:
、胖蛋嗑W(wǎng)管監控到核心機房停電,第一時(shí)間告知工維部、網(wǎng)絡(luò )部、運維部應急小組組長(cháng)。信息傳達到工維部機房管理員(一主一備),告知停電開(kāi)始時(shí)間。
要求在停電5分鐘內將消息傳達到調度中心,各應急小組組長(cháng)。如無(wú)法聯(lián)系上,進(jìn)行升級到責任領(lǐng)導-工維部經(jīng)理經(jīng)理處。
、凭W(wǎng)管將停電信息電話(huà)傳達后,進(jìn)行調度派單,確保全部的應急小組成員都收到本次故障停電的信息。然后進(jìn)行機房中設備的檢查,包括:UPS設備主機、各核心設備、匯聚設備、服務(wù)器、語(yǔ)音系統等。檢查是否受影響。同時(shí)啟動(dòng)機房降溫措施(降溫方案:初步為加裝抽排風(fēng)設備、增加大風(fēng)扇排風(fēng)形成熱量流動(dòng)降溫)
、菍(shí)時(shí)監控設備及UPS工作情況,包括:電量下降情況,設備工作正常情況,每15分鐘通報一次電量情況。
2)運維部應急工作流程:
、胚\維應急同事接到故障通告后,第一時(shí)間往停電現場(chǎng)趕,到現場(chǎng)配合網(wǎng)管/工維部門(mén)進(jìn)行設備儀器的檢查、客服語(yǔ)音系統的保障,應急發(fā)電的協(xié)助。
、片F場(chǎng)配合進(jìn)行機房降溫散熱措施實(shí)施,實(shí)時(shí)檢查網(wǎng)絡(luò )設備的工作情況。
3)運營(yíng)質(zhì)量管理應急工作流程:
、耪{度中心值班人員接到網(wǎng)管監控調度信息后,第一時(shí)間將故障信息記錄并發(fā)故障通告到相關(guān)應急成員,并電話(huà)通知各應急小組組長(cháng)是否知悉。
、七M(jìn)行客服調度系統的設備工作運行系統檢查,特別語(yǔ)音系統級坐席電腦,是否有問(wèn)題,如發(fā)現工作系統有異常,及時(shí)與運維應急小組成員溝通,進(jìn)行檢查處理。
、菍(shí)時(shí)關(guān)注故障工單流程進(jìn)度登記,配合應急小組進(jìn)行人員調度通告。
4)工維部應急工作流程:
、艡C房管理員第一時(shí)間往停電現場(chǎng)趕,同時(shí)進(jìn)行電話(huà)溝通供電公司、物業(yè)方等,咨詢(xún)停電原因,是屬于計劃性還是突發(fā)性停電,預計停電時(shí)長(cháng),將咨詢(xún)清楚的`結果反饋到應急小組成員中,電話(huà)聯(lián)系物業(yè)溝通好需要發(fā)電需求申請。
、乒ぞS應急小組組長(cháng)接到時(shí)間后第一時(shí)間往停電現場(chǎng)趕,同時(shí)進(jìn)行發(fā)電應急小組成員調度,安排第一時(shí)間到場(chǎng)工作開(kāi)展,并升級通報告知主管領(lǐng)導,對口集團維護中心上報信息。
、枪ぞS應急小組成員接到停電時(shí)間后第一時(shí)間往停電現場(chǎng)趕,要求30分鐘內必須到場(chǎng)(住機房附近的人員往現場(chǎng)去,較遠同事可以進(jìn)行打車(chē)往現場(chǎng)去),先行到處同事配合網(wǎng)管、運維同事啟動(dòng)做好應急發(fā)電前的準備:連接線(xiàn)布放、接續、發(fā)電機發(fā)電前檢測油/電/水路檢查,確保正常。確保一切就緒后,確認可以進(jìn)行發(fā)電操作后,按照發(fā)電操作流程進(jìn)行發(fā)電恢復市電。
、染W(wǎng)管將監控到停電的相應信息及級別同步發(fā)送到運營(yíng)質(zhì)量管理部調度崗,由調度崗將相應信息進(jìn)行工維、運維、網(wǎng)絡(luò )關(guān)聯(lián)同事進(jìn)行信息告知,同時(shí)報工維主管領(lǐng)導知悉。
5)應急機房發(fā)電操作流程:
、艡C房用電系統包括四方面:空調制冷、主/備UPS主機、照明系統、客服調度系統。
、瓢l(fā)電前考慮4方面系統設備用電功率情況,為保障發(fā)電機帶動(dòng)的正常,不能進(jìn)行同步供電,要區分優(yōu)先恢復的步驟實(shí)施,確認發(fā)電機的工作正常。在發(fā)電前將需要供電的“空調制冷、主/備UPS主機、照明系統、客服調度系統”的市電輸入主開(kāi)關(guān)關(guān)閉。防止同步啟動(dòng)時(shí)發(fā)電機的無(wú)法供電保證。
、菃(dòng)發(fā)電機,檢測發(fā)電輸出電流通斷,待發(fā)電機運行穩定后。
第一步啟動(dòng)空調制冷系統的市電輸入開(kāi)關(guān),運維應急小組成員重新啟動(dòng)空調主機(空調因為市電恢復后需要重新啟動(dòng))觀(guān)察空調制冷工作是否正常。
第二步啟動(dòng)主UPS設備的市電輸入開(kāi)關(guān),觀(guān)察發(fā)電機運行穩定情況,主UPS主機工作穩定情況,網(wǎng)絡(luò )設備的工作正常與否。
第三步啟動(dòng)客服系統的市電輸入開(kāi)關(guān),包括(客服坐席電腦、UPS設備、空調制冷等),觀(guān)察發(fā)電機運行穩定情況,設備恢復工作情況。
第四步啟動(dòng)備UPS設備、市電照明的市電輸入開(kāi)關(guān),觀(guān)察發(fā)電機運行穩定情況,備UPS主機工作穩定情況,網(wǎng)絡(luò )設備的工作正常與否。
、劝l(fā)電機啟動(dòng),市電輸入正常后,網(wǎng)管將降溫系統的抽排風(fēng)設備關(guān)閉,與運維同事進(jìn)行所有設備的運行進(jìn)行全面的檢查,確保設備已經(jīng)是運行正常。
、砂l(fā)電機發(fā)起市電正常后,工維應急小組安排專(zhuān)人現場(chǎng)值守,及時(shí)關(guān)注發(fā)電機油量情況,同時(shí)與油品供應商確認油品配送要求及時(shí)間要求,并實(shí)時(shí)與供電部門(mén)確認市電恢復時(shí)間。
6)停電過(guò)程中突發(fā)事項預防:
、啪W(wǎng)管在停電時(shí)進(jìn)行機房確認運行中的UPS工作組、設備組工作狀態(tài)。主/備UPS工作切換是否正常,在市電中斷時(shí)UPS是否已經(jīng)開(kāi)始進(jìn)行供電保護。
、浦蛋嗑W(wǎng)管對機房中的所有設備進(jìn)行全面檢查,確保所有的設備已經(jīng)是有主備供電,市電中斷后UPS已經(jīng)正常保障設備工作。同時(shí)對機房的溫度進(jìn)行觀(guān)察,溫度是否突然升高。
、峭k姾,UPS處于逆變工作狀態(tài),當班人員要每隔15分鐘觀(guān)察一次UPS的蓄電池容量、帶負荷情況、機房環(huán)境溫度,盡量使蓄電池容量大于60%,帶負荷小于85%(因為已經(jīng)有自購發(fā)電機應急,盡快要求短時(shí)間發(fā)起電,減少UPS的放電過(guò)度)。
、劝l(fā)現機房環(huán)境溫度大于26℃。當以上指標不能保證時(shí),要及時(shí)向機房管理員匯報,同時(shí)上報責任領(lǐng)導知悉,網(wǎng)管預案小組成員經(jīng)過(guò)慎重討論,適時(shí)采取關(guān)閉不必要網(wǎng)絡(luò )的網(wǎng)絡(luò )設備、加強通風(fēng)降溫等措施盡量延長(cháng)關(guān)鍵設備運行時(shí)間。
【機房應急預案】相關(guān)文章:
【經(jīng)典】機房應急預案02-10
機房應急預案12-24
機房應急預案【熱門(mén)】02-10
機房網(wǎng)絡(luò )應急預案08-30
機房火災的應急預案10-28
機房火災應急預案03-06
CT機房 應急預案03-28
[推薦]機房火災應急預案08-29
機房的應急預案(精選15篇)09-13
機房應急預案2篇(精品)12-25