加強(qiáng)數(shù)據(jù)中心運(yùn)營的4種方式
在當(dāng)今互聯(lián)的社會中,數(shù)據(jù)中心需要不斷突破機(jī)器學(xué)習(xí)的界限,以避免在競爭中落后或不堪重負(fù)。以下是機(jī)器學(xué)習(xí)可用于加強(qiáng)數(shù)據(jù)中心運(yùn)營的4種方式:
(1)最大限度地提高能源效率
全球數(shù)據(jù)中心的能耗占到全球能源使用量的1%。這聽起來可能是一個很小的數(shù)字,但即使是運(yùn)營效率的適度提高,也會節(jié)約顯著的成本,并阻止數(shù)以百萬噸計的二氧化碳排放到大氣中。好消息是能源管理是最容易實施機(jī)器學(xué)習(xí)的領(lǐng)域之一。例如,谷歌公司使用DeepMind節(jié)省了約30%的能源,顯著減少了管理費(fèi)用。
(2)準(zhǔn)確的容量規(guī)劃
為了滿足日益增長的工作量,數(shù)據(jù)中心管理人員必須提前準(zhǔn)確預(yù)測對計算資源的需求。這些預(yù)測需要實時更新,以反映環(huán)境條件的任何變化。使用高級機(jī)器學(xué)習(xí)算法構(gòu)建的預(yù)測模型可以處理PB級的大量數(shù)據(jù),并智能地預(yù)測容量和性能利用率。這一規(guī)劃有助于數(shù)據(jù)中心避免任何可能導(dǎo)致停機(jī)和影響運(yùn)營的資源短缺。
(3)更快的風(fēng)險分析
機(jī)器學(xué)習(xí)可以被訓(xùn)練成比人類更快更準(zhǔn)確地檢測異常。數(shù)據(jù)中心工作人員可能會花費(fèi)很長時間來發(fā)現(xiàn)某些東西,更糟糕的情況是完全忽略了異常情況。例如,一些數(shù)據(jù)中心管理即服務(wù)(DMaaS)程序可以分析來自關(guān)鍵數(shù)據(jù)中心設(shè)備(如電源管理和冷卻系統(tǒng))的性能數(shù)據(jù),并預(yù)測它們何時可能發(fā)生故障。通過提前通知數(shù)據(jù)中心設(shè)備管理人員即將發(fā)生的故障,機(jī)器學(xué)習(xí)技術(shù)可以將停機(jī)時間降至最低。
(4)抵御網(wǎng)絡(luò)攻擊的能力
防御分布式拒絕服務(wù)(DDoS)攻擊需要快速檢測和低誤報率。這些檢測方法大致分為兩類:基于特征的和基于異常的?;谔卣鞯臋z測在一般流量中具有已知特征,并被廣泛實施和使用。基于異常的檢測超出正常流量模式。機(jī)器學(xué)習(xí)回歸模型可用于識別流量異常的類型,有助于最大程度地減少誤報。