上海飛睿帶您了解機房監控的新特點(diǎn)
完善的機房監控系統應該具備三大特點(diǎn):能夠實(shí)現從設備運行情況到機柜微環(huán)境再到機房整體環(huán)境這樣多層次的監控;能夠有豐富的閾值設置以監測出危機的存在,并能有豐富的預警方式和預警流程保證相關(guān)人員能夠收到警訊,達到預警的目的;具備網(wǎng)絡(luò )化、智能化,能夠隨時(shí)隨地通過(guò)網(wǎng)絡(luò )查看機房?jì)鹊那闆r。
然而,傳統機房環(huán)境監控是把重點(diǎn)放在對機房整體環(huán)境、空調及配電柜的監控上,而忽視了對設備內部的監控。另外,傳統機房環(huán)境監控系統也缺少豐富的閾值、預警方式和預警流程設置,不能在真正意義上實(shí)現預警功能。
機房監控的三大新特點(diǎn)
機房監控的三大特點(diǎn)
對設備內部進(jìn)行監控
機房監控的目的在于保護機房?jì)菼T系統的正常、有效運行,在事故發(fā)生之前偵測出潛在危機,并通過(guò)各種方式將警情信息發(fā)送給相關(guān)人員及時(shí)進(jìn)行處理。因此,機房監控的核心應該是對IT系統運行狀態(tài)的監控,而最直接有效的監控應該是直接對IT設備運行狀態(tài)進(jìn)行監控。
IT設備內部的運行環(huán)境,例如服務(wù)器內風(fēng)扇轉速與CPU溫度等是最直接、最迅速影響IT設備正常運行的因素。有時(shí)候即使機房?jì)瓤照{運轉正常,機房整體環(huán)境參數值也在預設范圍內,但某服務(wù)器卻因為某種原因出現服務(wù)器內風(fēng)扇的轉速不正常、CPU過(guò)熱。如果只監控機房整體環(huán)境,此時(shí)機房的管理人員是不會(huì )得到這種危險信息的,整個(gè)系統就會(huì )因為該服務(wù)器潛在危機沒(méi)有得到及時(shí)處理而意外癱瘓。
多層次的機房監控
完善的機房監控系統應該是能夠實(shí)現對從設備運行情況到機柜微環(huán)境再到機房整體環(huán)境這樣多層次的監控,并能重點(diǎn)實(shí)現對設備內部的監控。
空調機的運行是為了降低機房?jì)鹊臏囟龋箼C房?jì)鹊恼w溫濕度保持在一個(gè)合適的范圍內,機房各個(gè)點(diǎn)的溫度參數值是不同的。空調機出風(fēng)口的溫度值不能說(shuō)明機房的整體溫度和機柜微環(huán)境溫度,空調的正常運行不能說(shuō)明設備就能正常運行。因此對空調的監控不能代表甚至取代對設備的監控。
漏水監測系統是為了監測機房?jì)仁欠裼新┧苑乐挂蚵┧绊懺O備的正常運行。線(xiàn)式探測器是成線(xiàn)型布置在機房可能漏水的最低處,而實(shí)際上點(diǎn)式漏水探測器同樣可以反映機房的漏水情況且比線(xiàn)式探測器經(jīng)濟實(shí)惠、安裝方便、維護簡(jiǎn)單。
機房?jì)仍O備由于非常重要,一般都是采用UPS供電,并且UPS是雙供電,只要對UPS進(jìn)行監控就能確保設備正常供電并且能反映市電的情況。因此,對電源的有效監控是在不增加任何投資的情況下通過(guò)協(xié)議實(shí)現對UPS的監控,通過(guò)監控其電壓、電流、電池使用情況、市電情況來(lái)確保設備的正常運行。
機房監控的預警功能
報警是報告事件的發(fā)生,是在故障或危害發(fā)生之后向管理人員發(fā)送警訊,及時(shí)地發(fā)送警訊可以縮短故障修復時(shí)間,最大程度地保障系統運行。但故障還是不可避免地發(fā)生了,影響了系統的正常運行。
預警則是在故障或危害發(fā)生之前向管理人員報告潛在危機,提示相關(guān)人員進(jìn)行處理,是事前的,可以防止事故的發(fā)生。有效的預警可以增加系統平均無(wú)故障工作時(shí)間,并可以根據危機情況自動(dòng)延伸到報警。
預警與報警的區別就在于它是事前預防性報警,機房監控系統只有具有良好的預警功能才能偵測出潛在危機并分層次逐步擴大警訊發(fā)送范圍,有效地防止事故的發(fā)生,將損失降低到最小。越來(lái)越多的機房管理人員也開(kāi)始意識到預警的重要性,因此機房監控系統必須有預警功能。