劉曉偉,劉科學(xué),謝楓,王莉,鞏冬梅
(國網(wǎng)冀北電力有限公司營銷服務(wù)中心(計(jì)量中心),北京 100045)
隨著電網(wǎng)企業(yè)的不斷壯大,在日常運(yùn)營活動(dòng)中,運(yùn)營商每天將獲取海量的文本數(shù)據(jù),這些文本數(shù)據(jù)涉及機(jī)械、電子、信息等多個(gè)領(lǐng)域,種類多樣,數(shù)量龐雜,缺乏規(guī)范的整合處理操作。為此,不少研究學(xué)者針對(duì)工單標(biāo)簽數(shù)據(jù)的特點(diǎn)對(duì)其進(jìn)行自動(dòng)分類標(biāo)注操作,提升這些數(shù)據(jù)的分辨率,便于高效地識(shí)別[1-2]。
由于工單標(biāo)簽數(shù)據(jù)自動(dòng)分類標(biāo)注系統(tǒng)在數(shù)據(jù)操作的過程中需獲取完整的工單標(biāo)簽數(shù)據(jù)信息,并不斷審核系統(tǒng)內(nèi)部的操作空間結(jié)構(gòu),因此,在操作的同時(shí)需調(diào)整系統(tǒng)硬件元件與軟件程序間的結(jié)構(gòu)關(guān)系,管理硬件與軟件的數(shù)據(jù)存儲(chǔ)方式[3-4]。目前的研究選用數(shù)據(jù)分類的方式整合工單標(biāo)簽數(shù)據(jù)信息,簡(jiǎn)化操作步驟,縮減操作所需的數(shù)據(jù)數(shù)量,避免了復(fù)雜的系統(tǒng)操作。
傳統(tǒng)基于文本挖掘技術(shù)的工單標(biāo)簽數(shù)據(jù)自動(dòng)分類標(biāo)注系統(tǒng),利用文本挖掘方式對(duì)工單標(biāo)簽數(shù)據(jù)進(jìn)行深度挖掘,在掌控系統(tǒng)數(shù)據(jù)的基礎(chǔ)上執(zhí)行數(shù)據(jù)挖掘命令,有效緩解操作系統(tǒng)的內(nèi)部壓力,并調(diào)整自動(dòng)分類標(biāo)注系統(tǒng)的內(nèi)部結(jié)構(gòu),具有良好的操作性[5]。傳統(tǒng)基于預(yù)訓(xùn)練BERT模型的工單標(biāo)簽數(shù)據(jù)自動(dòng)分類標(biāo)注系統(tǒng)根據(jù)標(biāo)準(zhǔn)模型管理操作中產(chǎn)生的操作問題,訓(xùn)練基礎(chǔ)數(shù)據(jù),并調(diào)節(jié)基礎(chǔ)數(shù)據(jù)的傳輸方式,獲取準(zhǔn)確率較高的基礎(chǔ)數(shù)據(jù)信息,確保數(shù)據(jù)的良好傳輸,提升自動(dòng)分類標(biāo)注的操作效率。但傳統(tǒng)系統(tǒng)在實(shí)際操作中將產(chǎn)生一系列的數(shù)據(jù)操控問題,對(duì)于部分隱藏?cái)?shù)據(jù)的查找能力有限,無法獲取隱藏?cái)?shù)據(jù)的信息資源,導(dǎo)致最終獲取的結(jié)果精準(zhǔn)率較低[6]。為此,針對(duì)上述問題,文中提出一種新的基于語義分割的工單標(biāo)簽數(shù)據(jù)自動(dòng)分類標(biāo)注系統(tǒng)。
文中利用語義分割的數(shù)據(jù)識(shí)別性能調(diào)整內(nèi)部系統(tǒng)硬件元件的關(guān)系,并結(jié)合相關(guān)的硬件結(jié)構(gòu)將工單標(biāo)簽數(shù)據(jù)錄入基礎(chǔ)空間中,執(zhí)行硬件系統(tǒng)操作指令,并構(gòu)建指令傳導(dǎo)圖,如圖1所示。

圖1 指令傳導(dǎo)圖
選用內(nèi)部存儲(chǔ)性能較高的數(shù)據(jù)存儲(chǔ)器作為工單標(biāo)簽數(shù)據(jù)的基礎(chǔ)存儲(chǔ)元件,以實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)存儲(chǔ)。該存儲(chǔ)器具有較強(qiáng)的工作效率,內(nèi)部連接口連接分類單元芯片,將數(shù)據(jù)分類功能與存儲(chǔ)功能隔離,避免相應(yīng)功能的碰撞,減少外部數(shù)據(jù)因素的影響。該存儲(chǔ)器的內(nèi)部容量為2 GB,能夠確保數(shù)據(jù)的完整性存儲(chǔ),并在存儲(chǔ)的同時(shí)可進(jìn)行存儲(chǔ)通道拓展操作,轉(zhuǎn)變數(shù)據(jù)的存儲(chǔ)模式,構(gòu)建良好的數(shù)據(jù)存儲(chǔ)環(huán)境[7-8]。
在實(shí)現(xiàn)對(duì)數(shù)據(jù)的存儲(chǔ)后,利用數(shù)據(jù)傳導(dǎo)器將工單標(biāo)簽數(shù)據(jù)進(jìn)行精準(zhǔn)傳導(dǎo)操作,文中數(shù)據(jù)傳導(dǎo)器可在較為復(fù)雜的數(shù)據(jù)操作環(huán)境下使用,能夠在傳導(dǎo)命令下達(dá)的同時(shí)進(jìn)行數(shù)據(jù)分析,減少數(shù)據(jù)操作失誤,并隨時(shí)進(jìn)行數(shù)據(jù)分類操作,轉(zhuǎn)化數(shù)據(jù)類型,內(nèi)部設(shè)有記憶芯片,可對(duì)傳導(dǎo)的數(shù)據(jù)進(jìn)行數(shù)據(jù)記憶,提升數(shù)據(jù)操作的可靠性[9]。
語義分割作為計(jì)算機(jī)算法的基本任務(wù),需要將數(shù)據(jù)分為不同的語義可解釋類別進(jìn)行輸入,并利用這些類別特征執(zhí)行數(shù)據(jù)操作指令,文中在系統(tǒng)接收層輸入數(shù)據(jù)組,調(diào)整數(shù)據(jù)組內(nèi)部的數(shù)據(jù)信息,確保數(shù)據(jù)信息的完整性[10]。利用梯度下降算法進(jìn)行數(shù)據(jù)學(xué)習(xí),并訓(xùn)練基礎(chǔ)數(shù)據(jù)的操作性能,擴(kuò)展數(shù)據(jù)操作范圍,便利數(shù)據(jù)的基礎(chǔ)操作[11-12]。
標(biāo)定特征數(shù)據(jù),并設(shè)置數(shù)據(jù)標(biāo)定公式[13-14]:

式中,F(xiàn)m(x)為標(biāo)定結(jié)果參數(shù),F(xiàn)(m-1)(x)表示內(nèi)部維度特征數(shù)據(jù)參數(shù),βm表示內(nèi)部整合條件參數(shù),h為相關(guān)度匹配數(shù)據(jù),x表示基礎(chǔ)標(biāo)定函數(shù),α表示內(nèi)部相關(guān)性分析指數(shù),m為標(biāo)定條件參數(shù)。經(jīng)過以上數(shù)據(jù)操作后,管理標(biāo)定的數(shù)據(jù)信息。將標(biāo)定的數(shù)據(jù)信息完整存儲(chǔ)于相應(yīng)的操作空間中,等待空間軟件平臺(tái)處理[15]。
在實(shí)現(xiàn)平臺(tái)處理后,執(zhí)行系統(tǒng)軟件操作命令。輸入基礎(chǔ)工單文本數(shù)據(jù),在內(nèi)部平臺(tái)中進(jìn)行文本預(yù)測(cè)處理操作,并構(gòu)建預(yù)處理公式:

式中,T表示預(yù)處理結(jié)果參數(shù),S表示軟件系統(tǒng)操作指令,k表示內(nèi)部平臺(tái)操作規(guī)則,l表示空間軟件處理信息任務(wù)。
由此獲取預(yù)處理數(shù)據(jù),并根據(jù)預(yù)處理數(shù)據(jù)構(gòu)建數(shù)據(jù)調(diào)節(jié)模型,取得較為精準(zhǔn)的操作數(shù)據(jù)[16],并執(zhí)行數(shù)據(jù)訓(xùn)練指令,下達(dá)訓(xùn)練任務(wù),對(duì)文本數(shù)據(jù)進(jìn)行效果評(píng)估。調(diào)節(jié)中心軟件的平臺(tái)信息,在評(píng)估結(jié)果中查找自動(dòng)分類標(biāo)注性能,并將此性能結(jié)果作為操作的最終結(jié)果,由此實(shí)現(xiàn)對(duì)工單標(biāo)簽數(shù)據(jù)的自動(dòng)分類標(biāo)注系統(tǒng)設(shè)計(jì),并構(gòu)建分類標(biāo)注流程,如圖2所示。

圖2 分類標(biāo)注流程圖
文中將研究的系統(tǒng)數(shù)據(jù)進(jìn)行整理,控制整理界面信息數(shù)據(jù),管理不同空間結(jié)構(gòu)的數(shù)據(jù)信息,時(shí)刻分配系統(tǒng)的分類標(biāo)注項(xiàng)目,按照分類標(biāo)注結(jié)果整合操作數(shù)據(jù),獲取相應(yīng)的實(shí)驗(yàn)研究參數(shù),并構(gòu)建實(shí)驗(yàn)參數(shù)表,如表1所示。

表1 實(shí)驗(yàn)參數(shù)1
在表1中,選用代表性較強(qiáng)的實(shí)驗(yàn)操作數(shù)據(jù),按照系統(tǒng)功能管理的標(biāo)準(zhǔn)查詢分類標(biāo)注界面,匹配界面信息,構(gòu)建較為寬廣的界面結(jié)構(gòu),執(zhí)行內(nèi)部操控指令,將實(shí)驗(yàn)參數(shù)空間數(shù)據(jù)與內(nèi)部系統(tǒng)界面數(shù)據(jù)相結(jié)合,并監(jiān)控?cái)?shù)據(jù)界面信息,掌握不同的信息功能。根據(jù)信息功能系統(tǒng)分析自動(dòng)分類標(biāo)注結(jié)果數(shù)據(jù)追蹤結(jié)果數(shù)據(jù)位置,將位置數(shù)據(jù)與條件數(shù)據(jù)相結(jié)合,審核此刻的結(jié)合數(shù)據(jù)信息,查找結(jié)合數(shù)據(jù)信息與內(nèi)部自動(dòng)分類標(biāo)注信息的相似性。分類數(shù)據(jù)信息,將數(shù)據(jù)按可能性進(jìn)行排序,并構(gòu)建數(shù)據(jù)信息分布式表示,如圖3所示。

圖3 數(shù)據(jù)信息分布式表示圖
按照相似性順序排列自動(dòng)分類標(biāo)注數(shù)據(jù)結(jié)果,執(zhí)行結(jié)果數(shù)據(jù)。標(biāo)準(zhǔn)化控制整合的實(shí)驗(yàn)信息,采用所設(shè)計(jì)系統(tǒng)與基于文本挖掘技術(shù)的標(biāo)注系統(tǒng)、基于預(yù)訓(xùn)練BERT模型的標(biāo)注系統(tǒng)對(duì)自動(dòng)分類標(biāo)注參數(shù)進(jìn)行查詢,整合查詢信息,獲取完整的實(shí)驗(yàn)結(jié)果數(shù)據(jù),3種方法的自動(dòng)分類標(biāo)注準(zhǔn)確率對(duì)比結(jié)果如圖4所示。

圖4 自動(dòng)分類標(biāo)注精準(zhǔn)率對(duì)比圖
根據(jù)圖4可以分析出,文中基于語義分割的工單標(biāo)簽數(shù)據(jù)自動(dòng)分類標(biāo)注系統(tǒng)的自動(dòng)分類標(biāo)注精準(zhǔn)率均高于兩種傳統(tǒng)自動(dòng)分類標(biāo)注系統(tǒng)。基于文本挖掘技術(shù)標(biāo)注系統(tǒng)的自動(dòng)分類標(biāo)注精準(zhǔn)率較高,基于預(yù)訓(xùn)練BERT模型標(biāo)注系統(tǒng)的自動(dòng)分類標(biāo)注精準(zhǔn)率較低。由于文中系統(tǒng)在設(shè)計(jì)過程中調(diào)整了系統(tǒng)的設(shè)計(jì)范圍,并查詢整體自動(dòng)分類標(biāo)注的數(shù)據(jù)信息,調(diào)配自動(dòng)分類標(biāo)注系統(tǒng)信息,并緩和硬件與軟件系統(tǒng)間的操作矛盾,強(qiáng)化外部系統(tǒng)管理性能,因此具有較強(qiáng)的數(shù)據(jù)操控性,收集的初始數(shù)據(jù)精準(zhǔn)程度較高,其最終的自動(dòng)分類標(biāo)注精準(zhǔn)率較高。傳統(tǒng)基于文本挖掘技術(shù)的標(biāo)注系統(tǒng)利用文本挖掘的優(yōu)勢(shì)進(jìn)行數(shù)據(jù)挖掘,同時(shí)匹配功能信息查詢不同區(qū)域的數(shù)據(jù)狀況,對(duì)工單標(biāo)簽數(shù)據(jù)的了解程度較深,能夠達(dá)到良好的數(shù)據(jù)操作效果,并及時(shí)控制數(shù)據(jù)的流向,具有較高的自動(dòng)分類標(biāo)注精準(zhǔn)率。傳統(tǒng)基于預(yù)訓(xùn)練BERT模型標(biāo)注系統(tǒng)雖完善了系統(tǒng)的內(nèi)部結(jié)構(gòu),但對(duì)于外部數(shù)據(jù)分析的力度較小,無法掌控工單標(biāo)簽數(shù)據(jù)的基礎(chǔ)性能,且操作投入較大,消耗高,導(dǎo)致其最終研究過程中的數(shù)據(jù)產(chǎn)生一定的偏差,自動(dòng)分類標(biāo)注精準(zhǔn)率較低。
在實(shí)現(xiàn)以上實(shí)驗(yàn)操作后,對(duì)實(shí)驗(yàn)過程中將產(chǎn)生的數(shù)據(jù)轉(zhuǎn)化因素進(jìn)行監(jiān)控,時(shí)刻保持實(shí)驗(yàn)操作的正常狀態(tài)。標(biāo)定基礎(chǔ)信息數(shù)據(jù),將工單標(biāo)簽數(shù)據(jù)整合至一個(gè)密閉的操作空間中,避免無關(guān)數(shù)據(jù)的侵入與影響,并構(gòu)建網(wǎng)絡(luò)模型結(jié)構(gòu)圖,如圖5所示。

圖5 網(wǎng)絡(luò)模型結(jié)構(gòu)圖
整理操作的數(shù)據(jù)信息,并按照獲取的信息內(nèi)容提升操作的技術(shù)性。構(gòu)建網(wǎng)絡(luò)監(jiān)管模式,將硬件平臺(tái)信息全部錄入平臺(tái)系統(tǒng)中,便于后續(xù)實(shí)驗(yàn)操作辨識(shí),并設(shè)置實(shí)驗(yàn)參數(shù),如表2所示。

表2 實(shí)驗(yàn)參數(shù)2
收集不同區(qū)域的工單標(biāo)簽數(shù)據(jù)信息,將數(shù)據(jù)信息的分類標(biāo)準(zhǔn)添加至操作應(yīng)用程序中,緩解應(yīng)用程序的內(nèi)部壓力。縮減操作所需步驟,將操作時(shí)間控制在系統(tǒng)操作允許范圍內(nèi),并標(biāo)定范圍信息。利用標(biāo)定的范圍信息管理工單標(biāo)簽數(shù)據(jù)的自動(dòng)分類標(biāo)注模式,對(duì)比3種系統(tǒng)的數(shù)據(jù)分類標(biāo)注時(shí)間,如圖6所示。
由圖6可知,傳統(tǒng)基于文本挖掘技術(shù)標(biāo)注系統(tǒng)的數(shù)據(jù)分類標(biāo)注時(shí)間較長(zhǎng),傳統(tǒng)基于預(yù)訓(xùn)練BERT模型標(biāo)注系統(tǒng)的數(shù)據(jù)分類標(biāo)注時(shí)間較短,文中基于語義分割的工單標(biāo)簽數(shù)據(jù)自動(dòng)分類標(biāo)注系統(tǒng)的分類標(biāo)注時(shí)間均短于其他兩種傳統(tǒng)系統(tǒng)。

圖6 數(shù)據(jù)分類標(biāo)注時(shí)間對(duì)比圖
造成此種差異的原因在于文中系統(tǒng)設(shè)計(jì)在數(shù)據(jù)收集的初級(jí)階段構(gòu)建了信息管理空間站,標(biāo)定了收集的工單數(shù)據(jù)信息。同時(shí),管理不同位置的數(shù)據(jù)信息狀態(tài),加強(qiáng)對(duì)信息數(shù)據(jù)的集中處理力度,獲取了良好的操作效果,完善了內(nèi)部系統(tǒng)機(jī)制,減少了不必要的操作浪費(fèi),縮減操作所需時(shí)間與分類標(biāo)注時(shí)間。傳統(tǒng)基于預(yù)訓(xùn)練BERT模型標(biāo)注系統(tǒng)能夠利用預(yù)訓(xùn)練BERT模型對(duì)不同平臺(tái)的工單標(biāo)簽數(shù)據(jù)進(jìn)行程序訓(xùn)練,在數(shù)據(jù)管理的同時(shí)及時(shí)控制外側(cè)信息的錄入,具有良好的數(shù)據(jù)系統(tǒng)操作性,能夠更好地符合數(shù)據(jù)分類標(biāo)注的標(biāo)準(zhǔn),降低了操作的困難程度,由此縮短了其分類標(biāo)注時(shí)間。傳統(tǒng)基于文本挖掘技術(shù)標(biāo)注系統(tǒng)雖配置了一系列文本挖掘協(xié)議,但對(duì)于工單標(biāo)簽數(shù)據(jù)的調(diào)整力度較小,造成工單標(biāo)簽數(shù)據(jù)無法得到系統(tǒng)的有效傳輸,在傳輸途中將產(chǎn)生不可避免的操作危機(jī),導(dǎo)致其最終的分類標(biāo)注時(shí)間較長(zhǎng)。
文中在傳統(tǒng)工單標(biāo)簽數(shù)據(jù)自動(dòng)分類標(biāo)注系統(tǒng)的基礎(chǔ)上設(shè)計(jì)了一種新的基于語義分割的工單標(biāo)簽數(shù)據(jù)自動(dòng)分類標(biāo)注系統(tǒng),該系統(tǒng)不斷調(diào)節(jié)系統(tǒng)軟件與硬件間的操作關(guān)系,轉(zhuǎn)變操作條件,并提升操作過程中的工單標(biāo)簽數(shù)據(jù)的數(shù)據(jù)收集精準(zhǔn)度,獲取可靠的操作數(shù)據(jù),縮減操作所需時(shí)長(zhǎng)。實(shí)驗(yàn)結(jié)果表明,文中系統(tǒng)的自動(dòng)分類標(biāo)注效果明顯優(yōu)于傳統(tǒng)系統(tǒng)。