任重
(國核電力規劃設計研究院有限公司,北京 海淀 100095)
輸變電工程實質上是有關輸電線路以及變壓器安裝方面的建設工程。它的數據量非常龐大,包含整個輸變電工程領域相關方面的所有數據。主要針對工程預期設計、全面規劃、可行性研究、具體實施、完工總結等各個方面的所有數據,進行全面收集、拆分、合并、研究,最后做進一步的管理、處理、存儲、遷移、使用等。
輸變電工程數據的種類。輸變電工程是整個電力系統的一部分,也是最關鍵的一部分。它的主要種類包括工程信息、地理信息、資源信息、設備信息、經濟信息等。值得注意的是,數據信息的獲取和分類極其重要,一要獲取高質量的、完整的、準確的一手信息,二必須通過數據的屬性、類別、結構、模式等方面進行分類細化,對今后的數據存儲十分重要。
輸變電工程數據的特點。輸變電工程數據由于來源方式廣泛,導致其十分多元化和異構化。也就是說,數據的內容多數普遍具有共享性,深入挖掘細化即可增加數據本身的價值和效果,具有可處理可操作的性質。數據根據特性又可以分為結構化數據和非結構化數據,前者一般包含運行數據、二維表結構數據,而后者一般以視頻、圖像、數學模型等,形式多樣化,需要更多存儲空間,對后續存儲管理要求更高。
輸變電工程數據的作用和影響。輸變電工程數據很重要,一旦儲存不慎,輕則影響整個電力系統或者信息系統的運作和發展,重則涉及到信息資源的安全和建設,因此在實際的數據存儲管理操作工作中必須嚴謹和慎重。
輸變電工程數據多,形式繁瑣,原因在于它全部來自各個工程項目。如果工程項目是輸變電工程數據存儲管理的基本單元,那么數據單元和數據包就是工程項目的組成部分。三者的關系就如同圖1展示的范圍大小,即工程項目的范圍大于數據包的范圍,而數據包的范圍則大于數據單元的范圍。

圖1 輸變電工程數據工程項目范圍比較圖
輸變電工程數據相當于我們的聯合國,而每一個工程項目則是屬于聯合國的每一個國家,具有其本身的獨立性和完整性,相互之間不影響卻又獨立并列存在。而工程項目的內部則像國家內部分有行政、軍事、經濟等部分一樣,它根據項目性質或工作環節的區別進行劃分,彼此之間緊密聯系相互影響。因此進行數據存儲的時候,所有工程項目存儲器可按照工程項目的屬性進行分類細分,細分清楚后全部并列至總體儲存器當中,從而實現總體存儲數據中包含分層存儲數據的架構。
三維設計模型存儲模式。在信息化逐漸成為數據存儲管理常態的基礎上,三維模型是最能直接體現出輸變電工程數據存儲模式的一種表現手段。通過收集幾何屬性、層次數據、結構關聯等數據,建立相關的工程模型、幾何模型、物理模型和組合模型單元進行集中管理,設置好一一對應的連帶關系。在此模式中,獲取到的每個GIM模型文件實質上可作為一個數據包,成為三維模型的一部分。
文檔資料數據存儲模式。文檔數據是輸變電工程數據最基礎的數據相關體,它貫穿了整個工程從開始到結束的全過程。不管是最初的設計階段,還是中間的施工落實階段和最后的竣工階段,所有的線路和數據都可按照內容和類型進行重新組織分類,形成它自身的存儲模式。在此模式中數據包是在存儲管理中獲取的每一套文件,文件可以是設計圖紙、勘測報告、概算書等。
本文將以沈陽工業大學學報第41卷第6期2019年11月刊登的一篇論文《基于層級設計的輸變電工程數據存儲架構》中的實驗數據作為分析對象,進行輸變電工程數據分層數據架構設計研究分析。
本次實驗的存儲中心數據標準存儲單元包括128GB內存的服務器、2顆8核CPU和1TB硬盤,通過建立了10組不同參數的存儲中心進行仿真測試。由圖可見,第二列的存儲中心數和第四列的數據集數從第1組到第10組是逐步增加的,也就是說在數據集數增加的前提下,存儲中心數也是同步上漲的,兩者是共同增長的關系。這說明了在數據管理中,分層數據存儲中心得到了充分運用(如表1)。
接下來觀察圖2的數據,圖2是一張坐標曲線圖,橫向的X軸是反映數據量/MB,數量從最低100MB增長至最高900MB,豎向的Y軸是反映任務用時/s,數值從0s到60000s。對比表1后明顯可以看出,“任務用時/s”指的是數據遷移前后的存儲數據執行相同任務的使用時間。

圖2 數據遷移前后任務使用時間比較

表1 存儲中心配置參數
從整體來看,實線和虛線的線條趨勢都是明顯上漲的,說明隨著數據量不斷增加,遷移前數據比遷移后數據在執行同一個任務時,使用時間多。
眾所周知,輸變電工程數據特性眾多,數量巨大,模式多樣性,結構迥異,更新換代快,在此基礎上要做好輸變電工程數據存儲工作實屬不易。經本文探討,設想按照輸變電工程數據的特點進行分類,主要分成工程地理信息數據、三維設計模型數據和文檔資料數據三大類,再分別以工程項目、數據包、數據單元的模式進行分層儲存,結合實際情況探討了一種數據存儲新模式。
實踐表明,分層數據存儲架構在總體數據存儲模式中是有積極作用的。在數據量不斷增加的情況下,分層數據存儲模式在數據存儲整體環境中運用自如。同時,在數據進行遷移的任務使用時間對比下,可以看出在相同的數據量下,遷移后的數據在執行同一個任務使用的時間比遷移前的數據少。在此基礎上,我們繼續把三類輸變電工程數據細分為結構化數據和非結構化數據后,明顯可以看出結構化數據在數據量增長的情況下,數據所需用時低于非結構化數據。
由此可見,根據輸變電工程數據的特點分別進行數據存儲處理,在不同的存儲架構里能有效提高數據存儲效率,優化工程存儲空間,節省出更大的空間容納數據。同時,重要的輸變電工程數據得到了安全儲存,完整性沒有受到破壞,海量輸變電工程數據存儲問題得到了有效解決,在輸變電工程系統和總體電力系統方面都體現了極其重要的意義。