999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數字孿生黃河知識平臺建設初探

2025-09-02 00:00:00祝賓皓夏潤亮李濤吳丹丁昱凱李冰
人民黃河 2025年8期

關鍵詞:知識平臺;大語言模型;知識圖譜;歷史場景匹配;數字孿生黃河中圖分類號:TP393;TV882.1 文獻標志碼:A doi:10.3969/j.issn.1000-1379.2025.08.007引用格式:,,,等.數字孿生黃河知識平臺建設初探[J].人民黃河,2025,47(8):32-38.

Preliminary Study on the Construction of the Digital Twin Yellow River Knowledge Platform

ZHU Binhao 1,2,3 , XIA Runliang4,LI Tao1,2.3,WU Dan 1,2,3 , DING Yukai 4 , LI Bing 1,2,3 ( (1.YellowRiver InstituteofHydraulicResearch,YRCC,Zhengzhou4503,China;.YelowRiverLaboratory,Zhengzhou40003, China;3.Engineering Technology Research Center of Henan Province Smart Water Conservancy, Zhengzhou 450o03,China; 4.Information Center,Ministry ofWaterResources,Beijing1OOo53,China)

Abstract:Inordertoimprovethefcencyandintellgencelevelofwateresoucesbusinessdecision-makinginthYelloRiverBasi, thisstudyitroducedlargelanguagemodel(LLM)andknowledgegraphtechnologytobuilddigitaltwinYellwRiverknowledgeplatfor. Aiingattheisuoftatickolegestorage,sutabilttrocssustrucueddataindaicusinseiosoftdiioal knowledgegraphs,awaterconservancyknowedgequestionansweringmechanismandmodelcaling mechanismbasedonLLMwerepro posed,andfuctiossucsuntfistantfloopretio“fourpr”santsstocaleatngndodgee trievalweredvelopd.Aweighedstatisticaladaptivedistacecalulatiotodaproosdtduceteisusfdimensialfer encesandetrvauiteferceiulti-atrutesilitatngPrctalalicatiosowstattlafosigfatl theresponsespeedoffdctroldecisiosandteacuracyofhistcalseemating.Thauacyofhdroloalodelcalse from 43% to 72% ,andthedistance domainiscompressed from50o.00-410o.00 to0.48-0.72,providing eficientandreliable knowledge service support for business decision-making in the Yellow River Basin.

Keywords:knowledge platform;LargeLanguageModel;knowledgegraph;historicalscene matching;digitaltwinYellowRiver

0 引言

隨著計算機科學技術的發展,新一批人工智能技術為黃河流域精準決策提供了支撐。當前,知識平臺的表現形式以圖譜為主,旨在實現知識的抽取、存儲和查詢,進而支持業務決策。盡管知識圖譜在一定程度上解決了信息孤島問題,并通過結構化形式整合了大量專業知識,但在實際應用中仍然面臨一些挑戰。一方面,基于知識圖譜的業務功能往往側重于知識存儲靜態化和簡單查詢,不能有機結合現有系統,難以應對復雜多變的實際業務場景;另一方面,傳統的知識圖譜在處理非結構化數據、理解上下文語境以及生成高質量文本等方面能力有限。近年來,大語言模型(LLM)

的發展為知識管理和業務決策帶來了革命性變化。這類模型通過對海量文本數據的學習,具備強大的語言理解和生成能力,有望與現有數字孿生平臺深度耦合,處理各種復雜的自然語言[1-4]

筆者針對黃河流域水利業務決策的需求及難點,結合大語言模型和知識圖譜,提出水利知識問答機制和水利模型調用機制,構建數字孿生黃河知識平臺,研發文檔辦公助手、防洪“四預”助手、歷史場景匹配、知識檢索等功能,以期為流域水利日常業務工作和應急決策提供高質量知識服務,提升業務信息化水平

1平臺建設架構

數字孿生黃河知識平臺的建設面向流域水利核心業務問題,基于水利大模型[5-6]的通用框架,按照“ 1+ 7+X ”模式打造標準統一、接口規范、具有黃河特色的知識平臺。該平臺核心是集水利信息智能處理、知識資源高效運營及場景化智慧應用為一體的綜合性智能體系。通過知識引擎向流域重要業務應用提供規則、歷史場景和專家經驗等知識支撐,全面支撐和提升9 2+N′′ 智能業務的研判精準化和決策科學化;推動物理流域與數字孿生流域的深度融合,實現業務流程自動化,提升流域管理的整體效能;借助持續學習與進化機制,確保知識平臺能夠隨業務需求和技術進步不斷自我完善,保持服務的前瞻性和領先性;確保平臺的高可用性和用戶友好性,使專業人員和公眾都能便捷地獲取所需信息與服務。數字李生黃河知識平臺架構如圖1所示。

圖1數字孿生黃河知識平臺架構 Fig.1 Architecture of Digital Twin Yellow River Knowledge Platform

平臺架構設計分為需求分析、關鍵技術和功能研發。該平臺采用Langchain-LLM-Embedding范式,搭建私域知識庫,將大語言模型部署在黃河超算中心高性能計算集群,建設能夠快速響應的知識庫問答模型。建立歷史場景庫、專家經驗庫、業務規則庫和調度方案庫,基于此構建“實體(屬性)-關系-實體(屬性)”的多種知識關聯模式,開發基于歷史場景特征值的多屬性相似度匹配模塊,建設可為防汛決策提供歷史知識的業務應用模型。基于大語言模型和知識圖譜建設,研發文檔辦公助手、防洪“四預”助手、歷史場景匹配等功能,形成一套完整的知識處理和應用框架

2關鍵技術研究

2.1 LLM原理

LLM通常基于Transformer構建,Transformer采用編碼器-解碼器(Encoder-Decoder)結構,輸入數據經過多層編碼器之后輸出到每層解碼器,進而計算注意力。Transformer結構如圖2所示

圖2Transformer結構Fig.2Transformer Architecture

Transformer運行流程如下:首先,通過單詞嵌人算法將輸入句子轉換為向量,使用位置編碼獲取單詞位置向量,兩者相加獲得模型輸入;其次,將單詞位置向量矩陣傳人編碼器,經過多頭注意力層,進人前饋神經網絡,將輸出傳遞到下一個編碼器;再次,經過 N 個編碼器后得到句子所有單詞的編碼信息矩陣,將矩陣分別傳遞到6個解碼器,此時解碼器的輸人來自編碼器的輸出和前一個解碼器的輸出,矩陣在每個編碼器中依次經過遮掩多頭注意力層、多頭注意力層、前饋神經網絡;最后,解碼器的輸出通過線性層(Linear)之后,由Softmax層轉化為概率作為最終輸出。

位置編碼 P 表達式為

Ps,2i=sin(s/100002i/d

Ps,2i+1=cos(s/100002i/d

式中: s 為單詞在句子中的位置, d 為位置編碼的維度,2i 為位置編碼偶數維度, 2i+1 為位置編碼奇數維度

注意力 A 計算公式如下:

式中: 為查詢矩陣; K 為鍵矩陣; V 為值矩陣;Softmax為歸一化指數函數,用于計算注意力權重,加權聚合V 為縮放點積因子,用于防止梯度消失。

2.2 基于LLM的水利知識問答機制

為了簡化業務人員對日常大量文檔的處理工作,發揮大語言模型在自然語言交互和文檔處理領域的優勢,研究基于LLM的水利知識問答機制,引入Langchain-LLM-Embedding范式,實現基于私域知識庫的文檔問答功能,用戶新建個人知識庫并上傳相關文檔后,可以借助大語言模型的自然語言交互能力進行多輪水利知識問答。

知識庫問答模型是基于大語言模型和嵌人向量研發的,它由本地文檔加載器、文本分割器、文本塊、提問向量生成、向量相似度排序和回答等組成。這種結構的優點是能夠有效處理大量非結構化文本信息,并通過向量表示和相似度計算找到最佳答案;同時大語言模型的參與使得回答質量更高,可以從全局視角考慮問題,而不是局限于單個文本塊內容。知識庫問答模型旨在提供一個高效、準確的問答服務,以滿足用戶對黃河流域水利相關知識的需求。知識庫問答模型的技術路線如圖3所示。

圖3知識庫問答模型的技術路線Fig.3Technical Roadmap for KnowledgeBaseQuestion AnsweringModel向量相似度 s 計算公式為

式中: ν12 為向量 ν1 和 ν2 的點積; 分別為向量 ν1 和 ν2 的長度; S(ν1,ν2) 取值范圍[-1,1],值越接近1表示兩個向量越相似。

2.3考慮LLM微調的水利模型調用機制

水利模型的計算結果是水利知識的重要來源之一,高效能的水利模型可有效促進知識平臺與模型平臺的耦合[7]。為此,建設考慮LLM微調的水利模型調用機制,引入 P -Tuning技術對 chatglm3-6b 大語言模型進行微調,大語言模型可以在多輪對話中明確用戶的模型調用需求,隨后調用水利模型并返回計算結果。chatglm3-6b大語言模型微調的重點在于多輪對話數據集的構建,這一過程按流程“用戶提問一大語言模型推薦模型調用參數一用戶提出調整需求一大語言模型修改模型調用參數一用戶確認”進行數據采集,保證數據集的多樣化。

以水文預報模型調用為例,調用機制如圖4所示。這種調用機制充分發揮了知識平臺的自然語言交互能力和模型平臺的精準計算能力,實現跨平臺的有效聯動和資源共享,提升知識處理的效率,拓寬知識來源的范圍。

圖4模型調用機制 Fig.4Model Invocation Mechanism

2.4考慮知識關聯的業務知識推理體系

知識圖譜通過結構化方式組織和存儲知識,使得分散在不同文檔、數據庫和系統中的信息得以集中管理和利用,并且能夠清晰地表示水利實體之間的關系。為建立黃河流域知識圖譜庫,基于 0wen2-72b-int4 大語言模型挖掘歷史大洪水事件典型時空屬性及特征指標,構建防汛歷史場景庫;將“ 58?777?882?8 4 96?8 等典型場次洪水處置、安全事件處置的經驗數字化、結構化,構建專家經驗庫。為保證大語言模型抽取知識的效果,引入思維鏈(CoT)技術,按照以下步驟構建提示詞模版:1)告知大語言模型需要對一段水利相關的文本作知識抽取,給出知識的結構模版[“實體(屬性)-關系-實體(屬性)”]和對知識抽取結果的要求(符合事實、結構準確);2)給出“輸人文本—知識抽取結果”的具體示例;3)告知大語言模型在輸出結果之前,對知識抽取結果的知識邏輯和知識結構作檢查。

在對文本資料進行切片處理后,將上述步驟構建的提示詞模版一并提交至大語言模型,可得到符合知識邏輯和知識結構的結構化文本,最終將結構化文本存入圖數據庫[8-11] 。

業務知識推理體系建設主要分為兩部分:一是構建“實體(屬性)-關系-實體(屬性)”的多種知識關聯模式,例如,通過構建“花園口水文站-1977年洪水特征值-洪峰流量”知識關聯模式,得到花園口水文站1977年洪水的洪峰流量,再結合正則表達式可以對某流域任一站點在任一年份的任一特征值進行查詢;二是基于知識關聯模式完成多屬性相似度匹配,即根據多個預設特征值的權重和數值對歷史場景庫中某站點的歷史洪水記錄進行多屬性相似度匹配,并根據相似度返回最相似的前5個歷史洪水的記錄,借助對應的知識關聯模式,將當前的防洪工程運用情況和受災情況一起展示出來,可為防汛減災決策工作提供快速、可靠的歷史防汛知識。

傳統的多屬性相似度匹配方法一般基于歐氏距離進行屬性間距計算,但這種方法未考慮各屬性量綱間差異、極值干擾的影響,故提出一種考慮量綱影響、歷史統計數據、大偏差屬性支配效應的加權統計自適應距離計算方法,公式為

式中: D(X,Y) 為加權統計自適應距離, xi,Yi 分別為兩個場景屬性 i 的值, wi 為屬性 i 的預設權重, ??μi 為屬性i 的歷史數據均值, αi 為屬性 χi 的尺度調節因子(默認取 μi ), δ 為全局平滑系數(取 0.1~0.3 。

3 知識平臺功能研發

3.1 防洪“四預”助手

針對水文模型調用對話數據集進行微調,聯動模型平臺研發防洪“四預”助手。以水文模型調用對話數據集構建為例,首先確定水文模型調用工具的參數,主要包括模型分類、時段、區域等,并附加這些參數的描述,使 chatglm3-6b 大語言模型理解該工具。然后使用提示詞模版,如“我需要進行水文計算”“我要對潼關站作預報”,時段如“明天”“2023年4月6日至5月5日”,區域如“三花間(三門峽至花園口區間)”“小花間(小浪底至花園口區間)”。最終得到1300條訓練對話數據集和500條測試對話數據集。利用P-Tuning技術進行多組參數方案微調,最終采用參數方案如下:" 1 。經測試,微調后的chatglm3-6b大語言模型的水文模型調用準確率由43% 提升至 72% ,為防洪“四預”助手的穩定使用提供了保障。

防洪“四預”助手的推出旨在解決水利專業人員在日常工作中面臨的復雜問題,特別是涉及大量數據處理和模型分析的任務。在水文學研究和應用中,經常需要頻繁地調用各種水文模型來進行預測、模擬和評估,但這些過程通常繁瑣且耗時。有了防洪“四預”助手之后,用戶可以借助自然語言與平臺進行交互,輕松調用水文模型進行數據分析、水情模擬等操作,應用界面如圖5所示

(a)展示武陟預測流量

(b)展示小浪底出庫流量

(c)總結模型調用情況

圖5防洪“四預”助手功能應用界面 Fig.5Application Interface of Flood Prevention “Four Pre” Assistant Function

利用防洪“四預”助手,用戶可以直接提問“預測武陟明天的流量過程,并對小浪底作調度”,助手能夠理解這一請求,并調用相應的水文模型和調度模型來生成預測結果。這樣不僅大大簡化了模型調用過程,提高了工作效率,而且使得非專業人員也能便捷地利用多種水文模型。隨著用戶持續使用和反饋,平臺收集這些對話數據用于迭代更新,不斷提升防洪“四預”助手的理解能力和模型調用的準確性,確保能夠更好地滿足不斷變化的業務需求和技術挑戰。

3.2 歷史場景匹配

為了應對水利行業面臨的復雜挑戰,知識平臺借助“實體(屬性)-關系-實體(屬性)\"的知識關聯模式和多屬性相似度匹配能力,提出加權統計自適應距離計算方法,并據此研發了歷史場景匹配功能。預設洪水總量為20.00億 m3 、權重為1,洪峰流量為 11300m3/s 、權重為1,輸沙總量為6.54億 t? 權重為 1,β 取0.2。歐氏距離和加權統計自適應距離計算結果見表1。

表1歐氏距離和加權統計自適應距離計算結果

Tab.1 EuclideanDistanceandWeightedStatistical

由表1可知,傳統歐氏距離法在多屬性相似度匹配中容易受量綱差異與單一屬性較大值干擾,如潼關站的歐氏距離(4100.00)被洪峰流量(偏差達4100m3/s )主導,而加權統計自適應距離(0.72)則通過引入歷史均值與尺度調節因子,結合全局平滑系數抑制極值影響,使輸沙總量(偏差1.3億t)和洪水總量(偏差0.88億 m3 )的協同效應得以體現。此外,相較于各情景下歐氏距離跨度達 3600(500.00~4100.00) ,加權統計自適應距離減小至 0.48~0.72 ,排序邏輯更符合決策者對于相似度百分比的認知,避免數值量綱差異導致的誤判,顯著提升了水利歷史場景匹配的合理性與科學性。

歷史場景匹配功能的開發旨在幫助水利工作者在應對突發性事件或需要作出重要決策的情況下,能夠迅速找到與當前場景相似的歷史案例作為參考,獲取豐富的水沙特征數據資料、歷史災情以及防洪工程運用措施。用戶只需要輸入當前場景關鍵要素的預設值(如所在流域、洪峰流量、輸沙總量等)和權重,平臺就能通過各種知識關聯模式和多屬性相似度匹配算法,在歷史場景庫中找出最相關的案例(界面如圖6所示),大幅度提升工作效率,讓用戶能夠在短時間內獲得有價值的信息,從而作出更為合理的決策

(a)1977年花園口站洪峰信息

(b)1977年花園口站災情信息

(c)1977年花園口站防洪工程運用信息

圖6歷史場景匹配功能應用界面

Fig.6Application Interface forHistorical Scene MatchingFunctior

3.3知識檢索和知識視窗

為了進一步提升知識管理和應用水平,數字孿生黃河知識平臺在知識圖譜基礎上增加了知識檢索、知識視窗等功能。這些功能的開發旨在幫助用戶更高效地訪問、分析和理解知識圖譜中的豐富信息。在日常辦公中,這些功能可極大地簡化信息查找和分析過程,應用界面見圖7。例如,通過知識檢索功能,用戶可以搜索特定實體及其相關聯信息,無論是想要了解某一水利工程的相關特性還是特定水文事件的影響范圍,都能快速得到答案。知識視窗功能進一步將復雜的數據轉換為直觀的可視化界面,使用戶能夠自定義關系鏈長度,得到實體間的關系網絡及其關聯知識。隨著時間推移,平臺會根據用戶的反饋和使用情況持續優化這些功能,引入更先進的算法和技術,以提高檢索的準確性和統計的全面性。

(a)對小浪底站進行搜索

(b)選擇關系鏈類型

(c)自定義關系鏈長度

圖7知識檢索和知識視窗功能應用界面 Fig.7Knowledge Retrieval and Knowledge Window FunctionApplicationInterface

3.4 文檔辦公助手

基于知識庫問答模型和大語言模型上下文理解能力研發文檔辦公助手,旨在通過自動化和智能化手段提升日常辦公效率。通過文檔辦公助手,用戶可以上傳相關的專業文檔,讓大語言模型針對這些文檔進行數據分析、報告總結或會議摘要等操作,并且用戶可以不斷地向大模型提出修改要求,直到滿意。例如,“總結提煉2024年全國水利工作會議要點,形成摘要”“概述2024年黃河防汛情況”“自動生成黃河數字孿生水利建設的發言稿,重點總結建設現狀”。用戶提出辦公需求時,只需要上傳文檔并提出具體要求(包括主要工作內容、寫作格式、語言風格),文檔辦公助手就能根據上下文理解能力快速生成對應內容,若用戶認為不能滿足要求,還可以進一步提出細化要求,直到滿意。具體應用界面如圖8所示。文檔辦公助手還具備持續學習和自我迭代的能力,能夠根據用戶的反饋和使用情況不斷完善自身性能,確保滿足不斷變化的業務需求。

此外,考慮到不同用戶間數據的私密性和安全性,對用戶權限進行了控制,普通用戶僅可對私人知識庫進行文件新增、使用和刪除操作,而對其他用戶的私人知識庫沒有訪問和使用權限,對于公共知識庫也只有使用權限。界面如圖9所示。

圖9 用戶操作權限界面

Fig.9User Operation PermissionInterface

4結束語

通過整合大語言模型與知識圖譜技術,構建數字孿生黃河知識平臺,解決了傳統知識平臺在動態業務場景中的局限性。具體而言,建立基于LLM的水利知識問答機制,研發文檔辦公助手,通過私域知識庫與多屬性相似度匹配,實現高質量的自然語言交互與知識檢索,大幅提升辦公效率;提出考慮LLM微調的水利模型調用方法,將模型調用準確率由 43% 提升至72% ;提出加權統計自適應距離計算方法,優化歷史場景匹配邏輯,相較傳統歐氏距離法,距離域由 500.00~ 4100.00減小至 0.48~0.72 。該平臺能夠有效支撐復雜水利場景的快速決策,可為黃河流域數字孿生建設與業務智能化轉型提供技術范式與實踐參考。

參考文獻:

[1] SMIRNOVA A,CUDRE-MAUROUX P.Relation ExtractionUsing Distant Supervision: A Survey[J].ACM ComputingSurveys,2018,51(5) :1-35.

[2]RAFFEL C,SHAZEERN,ROBERTSA,et al.Exploring theLimitsof Transfer Learning with a Unified Text-to-TextTransformer[J]. Journal of Machine Learning Research,2020,21(140) :1-67.

[3]QIU XP,SUN TX,XU YG,et al.Pre-Trained Models forNatural Language Processing: A Survey[J].Science ChinaTechnological Sciences,2020,63(10) :1872-1897.

[4] BAUERP,STEVENSB,HAZELEGERW.ADigitalTwinofEarth for the Green Transition[J].Nature Climate Change,2021,11(2) :80-83.

[5] 錢峰,成建國,夏潤亮,等.水利大模型的建設思路、構建框架與應用場景初探[J].中國水利,2024(9):9-19.

[6] 錢峰,夏潤亮.數字孿生水利賦能水利新質生產力發展框架研究[J].中國水利,2024(8):6-10,5.

[7] 夏潤亮,李濤,李珂,等.多模型云服務平臺構建研究與應用實踐[J].中國防汛抗旱,2022,32(3):52-56,60.

[8] 馮鈞,呂志鵬,范振東,等.基于大語言模型輔助的防洪調度規則標簽設計方法[J].水利學報,2024,55(8):920-930.

[9] 楊陽蕊,朱亞萍,劉雪梅,等.水利工程文本中搶險實體和關系的智能分析與提取[J].水利學報,2023,54(7):818-828.

[10] 朱浩,趙紅莉,段浩,等.水利多領域知識圖譜關聯融合方法研究[J].人民黃河,2025,47(3):123-129,134.

[11] 賈賀,劉輝,卜新魁,等.基于知識圖譜的泵站運行方案智能推薦與優化[J].人民黃河,2024,46(4):125-130.

【責任編輯栗銘】

主站蜘蛛池模板: 在线a视频免费观看| 精品国产三级在线观看| 中文字幕 欧美日韩| 天天摸夜夜操| 亚欧成人无码AV在线播放| 她的性爱视频| 中文字幕一区二区人妻电影| 精品国产香蕉伊思人在线| 日韩小视频在线观看| 久久中文字幕不卡一二区| 在线免费看黄的网站| 国产十八禁在线观看免费| 99精品福利视频| 天天综合网色| 精品视频在线一区| 制服丝袜一区二区三区在线| 亚洲高清在线播放| 麻豆精品在线播放| 不卡无码h在线观看| 国产女人18水真多毛片18精品 | 热99re99首页精品亚洲五月天| 这里只有精品在线播放| 欧美日韩在线第一页| 人人爽人人爽人人片| julia中文字幕久久亚洲| 国产成人精品一区二区| 久久香蕉国产线看观看精品蕉| 久久国产精品娇妻素人| 国产在线观看成人91| 色有码无码视频| 思思热精品在线8| 无码区日韩专区免费系列| 18黑白丝水手服自慰喷水网站| 狠狠干综合| 在线一级毛片| 日韩欧美综合在线制服| 久草国产在线观看| 成年人国产网站| 久操中文在线| a欧美在线| 欧美一区精品| 亚洲视频在线观看免费视频| 好久久免费视频高清| 欧美精品伊人久久| 亚洲天堂啪啪| 国产视频自拍一区| 亚洲国产欧美中日韩成人综合视频| 精品成人免费自拍视频| 亚洲无线国产观看| 欧美日韩综合网| 亚洲二区视频| 伊人久久婷婷五月综合97色| 欧美日韩亚洲综合在线观看| 久草视频一区| 91日本在线观看亚洲精品| 免费一级无码在线网站| 欧美国产精品不卡在线观看| 国产成年女人特黄特色大片免费| 午夜精品国产自在| 91精品国产无线乱码在线| 亚洲第一视频网| 亚洲国产精品VA在线看黑人| 91久久夜色精品国产网站 | www中文字幕在线观看| 欧美性天天| 免费啪啪网址| 一级高清毛片免费a级高清毛片| JIZZ亚洲国产| 久久久久免费看成人影片 | 国产精品观看视频免费完整版| 亚洲国产清纯| 强奷白丝美女在线观看| 亚洲男人的天堂网| 亚洲精品免费网站| 激情综合网激情综合| 蜜臀AVWWW国产天堂| 囯产av无码片毛片一级| 婷婷五月在线| 欧美亚洲国产视频| 沈阳少妇高潮在线| 一级毛片中文字幕| 欧美成人第一页|