費建章 王甲甲 李可
摘? 要:文章針對電力企業文檔編制存在效率較低、準確性不足等問題,從不同角度深入分析了文檔自動編制技術研究的必要性和重要性,結合電力系統的特點和公司經營需求,應用人工智能技術,實現電力文檔的自動編制,不僅能減少重復性工作,提升公司的經營管理效率,也能面向社會推廣,具有重大的經濟和社會意義。
關鍵詞:電力企業;機器學習;人工智能;文檔編制
中圖分類號:U231 ? ? ? 文獻標志碼:A? ? ? ? ?文章編號:2095-2945(2020)34-0133-02
Abstract: Aiming at the problems of low efficiency and lack of accuracy in document compilation in electric power enterprises, this paper deeply analyzes the necessity and importance of automatic document compilation technology from different angles. Based on the characteristics of power system and the business needs of the company, the application of artificial intelligence technology can realize the automatic compilation of electric power documents, which can not only reduce repetitive work and improve the management efficiency of the company, but will also be popularized to the society. It is of great economic and social significance.
Keywords: electric power enterprise; machine learning; artificial intelligence; document compilation
1 背景
國家電網公司(以下簡稱“公司”)作為全球最大的公用事業企業,隨著體量的不斷增大,公司每年要處理海量的文檔(如發文、收文、通知、會議管理等),但目前電力文檔,例如OA系統中的公告、通知和請示,調度和運檢業務中的工單票據,巡檢業務中的巡檢報告等,仍主要依賴個人經驗撰寫,大量重復性和主觀性工作導致文檔編制存在效率較低、準確性不足等問題。
近年來,隨著機器學習算法的突破,人工智能技術引起了企業和政府的高度關注[1]。2017年7月,國務院印發《新一代人工智能發展規劃》(國發[2017]35號),將人工智能提升到國家戰略層面。8月,公司積極響應國務院號召,繼續加大在人工智能領域的相關投入,形成《國家電網公司人工智能專項規劃》。基于機器學習的新聞文檔的自動寫作已經有初步應用[2],如何結合電力系統特點和公司經營需求,應用人工智能技術,實現電力文檔的自動編制,不僅能減少重復性工作,提升公司的經營管理效率,也能面向社會推廣,提高公司核心競爭力,打造品牌效應[3]。
2 必要性分析
從目前公司所屬各單位的研究、應用情況來看,文檔編制過程中存在以下亟待解決的問題:
2.1 人工設計的模板無法滿足種類繁多的文檔需求
公司辦公過程產生的海量文檔往往是動態變化的,而非簡單的關鍵詞移植。人工設計的模板在種類繁多、版本迭代頻繁的電力業務場景下,容易存在結構不規范或者內容冗余、遺漏、甚至錯誤的缺陷,從而對工作造成影響。
2.2 人工撰寫效率低下,重復性工作較多
當前公司海量的文檔大部分由工作人員來撰寫,重復性工作較多,例如會議記錄等編制工作量較大的文檔仍需由員工手動編撰,缺乏語音轉寫等智能輔助手段。在人工智能相關技術快速發展的今天,傳統的文檔編制工作方式無法提高公司的辦公效率,對公司達成建設智能化、現代化一流特大型央企的目標無法起到積極的作用。
2.3 缺乏智能化編制輔助手段,文檔質量把控能力不足
在文檔編制過程中,全程由人工進行操作,文檔質量取決于業務人員的素質水平,缺乏智能化的格式檢查、病句自動矯正、錯別字預警等輔助編制手段,編寫效率較低,文檔無法做到標準化,文檔質量把控能力不足。
3 研究內容
針對公司經營管理智能化面臨的新需求與挑戰,以電力文檔智能編制為核心目標,從理論研究出發,攻克適應業務需求的智能文檔自動編制關鍵技術,研發智能文檔自動編制系統,并在實際業務場景中進行驗證。
3.1 研究面向電力業務領域語料庫構建方法,實現電力專業語料庫的快速構建
通過研究知識點發現、句式庫優化、詞庫優化、詞語優化等多層級語料構建技術,建立電力文檔語料庫,為文檔智能編制提供語料素材及編制約束規范。同時形成面向電力業務領域的語料選取規范、語料庫組織規范,為后續語料庫構的快速構建奠定良好的基礎。
3.2 研究基于遞歸神經網絡語言模型的電力文檔模板生成技術,實現多類型文檔模板的自動生成
通過研究基于深度學習和信息抽取技術,研究電力文檔模板的自動生成技術與基于遞歸神經網絡的文檔語言關聯技術,構建電力文檔模板的生成算法模型,實現了公文、通知、公告、運檢工單等多種類型文檔的模板自動生成。
3.3 研究基于全序列深度神經網絡的語音轉寫方法,實現多場景電力業務下會議、匯報的語音識別和轉寫
基于全序列深度神經網絡,提出一種聲學模型+口語化和篇章級語言模型的語音轉寫模型,基于收集到的電力相關的語音語料和文本語料,訓練優化聲學模型、語言模型,提高智能語音的識別率。
3.4 綜合應用語義檢索、理解、分析以及文本摘要技術,實現電力文檔的自動組稿、撰稿
基于推理機制的語義理解分析模型、RNN語義檢索模型以及文本摘要技術,構建知識本體網絡和電力詞庫。對公文、工單文本數據進行充分理解,完成殘缺意圖關鍵語義抽取、語義理解和語義摘要,實現公文、工單票據和巡檢報告等電力文檔智能組稿和撰稿。
4 預期效果
本項目將語音識別和自然語言處理等人工智能技術引入公司電力文檔編制業務中,構建電力行業語料庫并自動進行文檔模板生成,利用相關技術手段在文檔編制業務中對采集的語音進行轉寫,同時對轉寫文本進行分析、理解和摘要等處理分析,實現電力文檔智能組稿和撰稿,提高了公司的智能化水平。主要改善或提升體現在以下幾個方面:
4.1 提高文檔編制效率,節省工作時間
研究基于自然語言處理技術,針對公司在電力生產、企業經營管理中產生的各類文檔數據,構建面向電力業務特性的文檔語料庫,并基于遞歸神經網絡語言模型的文檔語言關聯技術,分析公司電力文檔寫作規范,自動生成相應的文檔模板,減少重復性文檔編寫工作,提高文檔編制的效率。
4.2 實現智能語音轉寫,提升辦公效率
研究基于深度學習的語音轉寫技術,結合電力專業的語音數據構建語音語料庫,實現電網在會議、匯報等不同業務場景下的語音轉寫功能,提升電力文檔記錄的準確性和業務流程中文檔處理的效率。
4.3 實現文檔自動編寫,降低工作復雜性
研究基于深度學習技術的語義理解、檢索、分析技術,實現公文、工單票據及巡檢報告等類型的電力文檔自動組稿和撰稿,減少重復性文字編寫及格式合規審查工作,降低電力文檔撰寫的復雜性。
5 結束語
本項目開展基于機器學習的智能文檔自動編制關鍵技術研究,通過研究自然語言處理技術、基于深度神經網絡的語音轉寫技術和智能化自動組稿和撰稿技術,研發智能文檔自動編制系統,實現公文模板自動生成和高效標準化的公文自動編制,減少重復性文字編寫工作,提高辦公人員工作效率。
本項目相關研究成果一方面可直接應用于電力文檔編寫工作中,例如OA系統中的公告、通知和請示,調度和運檢業務中的工單票據,巡檢業務中的巡檢報告等。另一方面,本項目成果可通過對模板庫及語料庫的擴展,適應不同行業領域的需求,可在政府、事業單位以及各類企業進行推廣,對不同類型的文檔進行自動編制,減少重復性工作,減輕工作人員工作量,提高辦公效率。
參考文獻:
[1]王晴.電力企業非結構化數據管理平臺的研究與設計[D].吉林:吉林大學軟件學院,2016:1-66.
[2]高發琪,陳永生.城軌交通運行圖自動編制及優化系統的研究[J].微型機與應用,2012,15:3-5.
[3]買哈鋪熱提·外力,趙夢原,艾斯卡爾·艾木都拉.基于關鍵詞的維吾爾單文檔自動文摘技術研究[J].計算機工程與應用,2015,51(16):130-135.