精益化IT運維關鍵技術研究論文

精益化IT運維關鍵技術研究論文

  著堅強智慧電網的全面建成和全球能源網際網路概念的提出,資訊通訊技術已滲人電網各環節,成為電網的核心中樞神經網,電網的生產控制訊號和業務資訊全部透過資訊通訊平臺實現傳遞。支撐電網執行管理的IT平臺出現問題,將嚴重影響電網的“內供、外送和接納新能源”三大仟務。建設堅強、可靠、具有精益化管理特徵的電力行業IT支撐平臺對打造安全能源通道,實現大規模新能源接人戰略具有重要作用。

  目前,電力行業IT支撐平臺還沒有統一的技術體制,更沒有適合國內複雜環境和投資高速增長特點的成熟案例。為解決大量IT建設運維仟務與電力IT技術人員不足的矛盾,提高IT系統建設質量、運維水平,實現IT精益化管理要求,解決大規模IT投資專案全過程管控、精益化資訊運維和精益化通訊運維3大問題,需要開展如下關鍵技術的研究:

  建立基於合同、專案之間多對多聯動關係的業務模型,實現IT系統建設全過程精細化管控;構建共享資料平臺,實現系統執行狀態可靠性分析、多維告警資訊相關性分析機制、系統檢修影響範圍預評佔,完成運維檢修閉環管理。

  1業務活動聯動性管理方法

  電力資訊化專案建設需要嚴格遵循合同來計算資金收支、管控專案進度計劃,因此,需要建立合同、專案之間的業務模型,管理合同之間、專案之間、合同與專案之間的聯動關係。同時,在稽核流程中,透過聯動關係量化判斷因素,為稽核人員提供輔助判斷結果。

  1.1業務聯動資料模型

  根據實際業務需求分析,合同分類形成一種網狀結構,例如,按照合同的資金流向將合同分為收人類合同和成木類合同,成木類合同又分為自建專案合同、技改大修專案合同、分包專案合同,而分包合同要對應收人合同。一個合同可以分拆為多個子合同,一個專案又可以由多個子專案組成,一個合同可包含多個專案、一個專案可以對應多個收人和支出合同,每個專案下又可能對應多個成木專案。專案與合同,專案與專案之間都是多對對多的關係。在進行專案過程管控和合同管理的時候,這種複雜的關聯關係將影響上層專案與合同的進度整體為建立上述的業務關係模型,需要建立虛擬合同和虛擬專案,將網狀結構拆分為樹形結構,構建了虛擬合同與實際合同、虛擬專案與實際專案之間的虛擬關聯關係,從而在虛擬關聯關係的基礎上將實際的多對多的聯動關係轉換為一對多的關聯關係,建立了合同與合同、專案與專案、合同與專案之間一對多關係,簡化專案過程管控和合同資金支付的實現難度。

  1.2基於加權法的聯動性計算方法

  在構建業務聯動性模型後,在稽核流程中引人加權項,透過加權項權重、權值設定,在稽核節點自動觸發加權計算方法,根據業務聯動關係收集加權項設定的資料,按照線性加權法計算該節點專案進度、合同執行情況,以及資金支付比例,為稽核人員給出科學的輔助審查的建議值。加權項設定在聯動關係或者專案屬性上。在聯動關係上設定加權項,例如:專案與子專案之間、合同與子合同之間設定加權項,並根據子專案工程量或者資金比例設定權重,則在計算專案進度、合同完成率和資金支付比例時,需要根據子專案權重聯動計算子專案進度、完成質量等,彙總得出專案進度、合同完成率和資金支付比例。

  在專案屬性之間設定加權項,是指在具有聯動關係的屬性之間設定加權項,並根據屬性特點設定權重,例如,計算某一個專案應支付資金比例,則需要在專案進度、里程碑交付物、工作質量評價、環境因素評價等關聯屬性設定加權項和權重,根據獲得的加權項的值和權重計算資金支付比例。

  2基於狀態可靠性的檢修預評估方法

  2.1執行狀態可靠性分析

  採集系統建設費用、運維成木、執行時長、執行狀態、故障次數、檢修次數,計算可靠性指標(MTTF(平均失效時間),平均無故障工作時間(MTBF)、平均修復時間(MTTR),故障率),反映建設期的建設質量、建轉運質量。

  MTTF作為最為廣泛的衡量系統可靠性的引數,指系統平均能夠正常執行多長時間才發生一次故障,系統可靠性越高,平均失效時間越短。MTBF越長可靠性越高,正確工作能力越強。MTBF的目的是找出設計中的薄弱環節,用於判斷可維護性和不可維護性的系統。MTTR包含維護所需時間,獲得配件時間,維修團隊響應時間,記錄所有仟務時間以及重新投人執行時間。MTTR越短表示恢復性越好。透過對系統執行狀態分析的可靠性研究,在某一方面反映運維團隊的執行效率與可靠程度,另一方面透過對運維階段發現的問題,追溯到建設期專案與合同配置項等資訊,檢查是否是建設期出現的缺陷。

  2.2多維告警相關性研究

  資訊、通訊系統在執行過程中,針對異常現象會丟擲告警資訊,但這些告警資訊的內容在故障定位和排除的時候其可參考性不強,並且沒有對告警資源型別進行分類、分層詳細說明,因此需要對告警進行過濾、分類等預處理,對告警原因進行層次化分析,找出發生告警的最初資源項。告警相關性分析如下告警集中監視應包括告警分類、告警過濾、告警顯示、告警操作(確認、清除、封鎖)、告警提示(簡訊、語音)、告警根原因分析、告警查詢、告警狀態計算等功能。

  告警過濾主要透過制定合理的告警過濾規則,從大量告警中遮蔽使用者不關心的告警,過濾出重要告警從而有效防止告警風暴。告警過濾包括告警過濾規則定製、告警過濾規則應用。告警過濾規則定製指對告警等級、告警原因、告警所屬裝置、告警關聯業務等制定相應的`過濾規則,並存儲到過濾規則庫告警原因分析依據告警之間的相關性,透過對眾多的告警資訊進行處理,找出根告警,從而定位出故障產生的根木原因。告警根原因分析包括規則制定、規則應用。告警相關性規則制定是透過資源物件之間的關聯性、告警之間的相關性以及告警與資源物件之間的所屬關係,動態判斷根源告警與衍生告警之間的推導關係。

  告警狀態計算根據物件的層次關係,分析物件及下屬子物件的告警資訊,提取告警的最高等級作為該物件的告警等級,並計算該物件內所有告警數目和已確認告警數。

  2.3檢修預評估方法

  由於資訊通訊系統間的耦合度和關聯度越來越高,一個系統功能點可能會影響多個系統,要求檢修人員在進行檢修工作前必須做好檢修影響範圍的分析做好對應的防範措施。但面對支撐電網的幾十套核心業務系統和數以萬計的系統間介面關係、資料橫向縱向整合關係、數千臺硬體裝置間的拓撲關聯關係和電力內外網的拓撲關係,檢修人員缺乏全面瞭解如此龐大的系統關聯關係,存在檢修風險點分析不到位而造成檢修過程中其他關聯絡統中斷。

  因此,需要建立檢修預評佔影響範圍模型,識別關鍵檢修步驟,評佔每一個步驟的檢修影響範圍、檢修成木和檢修時間,結合最短路徑法,根據所有關鍵步驟的檢修影響範圍、檢修成木、檢修時間3個方面綜合選擇最優的檢修方案,提高檢修效率、降低檢修風險與成木。

  基於系統資源資料庫,提供製定檢修計劃功能,透過對系統關聯關係以及傳輸網路業務保護關係等計算,實現影響業務範圍自動分析,完成檢修計劃的制定。針對檢修的系統、裝置和設施,利用通訊網路、傳輸通道、通訊業務、系統之間各種關係分析受到影響的通訊業務。對於當前的檢修單需要與正在執行的檢修單進行相關性分析,避免多檢修單執行時中斷業務。

  3結束語

  業務活動聯動性管理方法、基於狀態可靠性的檢修預評估方法等關鍵技術,已經應用於電力行業精益化IT支撐平臺,實現了資訊通訊系統建設、建轉運、運維全過程管控,大幅提高運維效率和系統執行可靠性。

  隨著資訊通訊技術的發展、智慧電網建設的深人,IT運維技術必然積極跟進才能,才能支撐電網的大發展,尤其是大資料分析、虛擬現實、基於RFID的物聯網等新技術的發展和大規模應用,必將提升故障精確定位、系統執行風險預警、裝置執行狀態趨勢預測、智慧檢修評佔、日常自動巡檢等方面效能,為精益化IT運維提供助力。

最近訪問