李得原

摘 要 為了提升作物生長模型的運算速度,MPI并行算法由于自身所具有的優越性而被廣泛地應用。基于此,對MPI并行計算的農作物生長環境的數據展開分析。首先,概述MPI并行計算方法,然后分析MPI并行算法在農作物生長環境的數據應用情況。
關鍵詞 MPI;并行算法;農作物;生長環境;數據
中圖分類號:TP301.6 文獻標志碼:B DOI:10.19415/j.cnki.1673-890x.2017.30.063
最近幾年,作物模型的地區性運用需求持續性遞增,被廣泛地運用在地區性生產力預測與預警、氣候改變走向研究中。作物模型在地區性的運用過程中,需與氣象模型、生態環境模型以及GIS等主要技術相整合,同時受到地點、參量以及時段等多種因素的共同作用,一般會出現模型運算量的劇增,模型驅動式變量的數據量變多以及運算時間偏長等問題[1],因而,如何借助分布式計算環境來增強作物模型在多個時間段、多個地點以及多個尺度環境的運算性能,是作物模型范圍內急需解決的一個難題。而MPI則是其中重要的計算工具,本文正是據此來對農作物生長環境的數據展開分析。
1 MPI并行計算法概述
MPI并行計算法是一類根據信息傳輸的并行式編程技術。傳輸消息接口是一類編程接口標準,而非具體化的編程語言。換言之,MPI界定了一組具備可移植性編程接口[2]。此計算方法具備PVM的大多數優點之外,同時還擁有如下的特征:第一,實現途徑多樣,且適用于數類研發工具與基礎性的研發語言;第二,有效地對消息緩存區加以管理;第三,在數類并行計算機系統結構中有效地運作;第四,開展異步通信程序,無論是發送還是接收過程,完全可以和運算重疊展開;第五,異步實施時,對于運用者的其他軟件并不會導致后果;第六,是完全能夠移植的標準式平臺。
2 MPI并行算法在農作物生長環境的數據應用分析
MPI并行算法的前提條件是對子模型組分進行并行式處理,把運算任務區分成主從聯系,并行處理的粒度并不大,然而運算數據對應的通信時間則較長。因此,本文所確定的方案為把并行處理的粒度提升至子模型層面,即把生長模型的運算任務當作一個任務項目,試圖將其區分成一系列能夠并行實施的子任務,即{T1,T2,T3,…Tp|P表示子任務的數目},使得任務運算完成之后,確保Ti任務能夠馬上開始相同的運算速度,據此達到提升運算速度的目的。Ti+1任務的構成主要是數個子模型組分的運算關系式,即{M1,M2,M3,…Mx|X表示的是子模型組分運算的關系式數},x大小主要決定于子模型組分內部的數據依賴式聯系。在作物生長相關的模型內,Dev子模型的計算方法所涉及到的函數式無需其他公式輸出的數據,即能夠視作T1任務;Biomass計算方法公式與Parition計算方法公式的數據互相之間存在著依賴性,能夠被一同視作T2任務;Orgmake計算方法公式充分地依賴其他4個子模型的運算結果,即能夠視作T3任務。據此為原則,獲取子模型層的并行調度方案A,并表示成A方案。
因為分配的處理器不同,對應的運算任務及其量也存在著差異,從而會導致部分處理器和其他處理器率先完成任務之后處于空閑的狀態。因而,能夠通過盡量地在處理器之間均衡地配置運算的任務,從而達到負載均衡的狀態,也就是讓全部的處理器均可以持續性地實施上述任務,提升處理器使用的效率?;谟嬎惴椒ˋ的前提下,檢測串行模式環境中農作物生長的模擬流程,對比不同子模型運算方法關系式的實施時間比,目的在于達到靜態負載的均衡狀態。設置了單個單機上串行流程的檢測實驗:即通過農作物大麥1個生長季所對應的氣溫數據當作模型驅動式變量,檢測得到Dev子模型的運作時間是1s,具體的運算時間見表1。
基于表1的相關數據分析可以發現,各子模型計算方法的公式對應的實施時間差別顯著。其中,Biomass與Parition計算方法公式的輸入和輸出的數據相耦合,2個計算方法公式的運行時間比比值是20,遠遠地超出Dev計算方法公式的計算時間。在以上提及的流水線式并行計算方法A項目內,若把DEV子模型計算任務單獨視為一項任務,必然導致其所在的處理器完成計算任務后,不得不等待執行數據傳輸操作,使得處理器長時間處于空閑的狀態。出于維持各個處理器內部的負載均衡目的,把Dev計算方法的公式與Biomass甚至是Parition計算方法公式合成一項運算的任務,從而獲取優化之后處理的子模型層并行式優化調度的方案B,并表示成B方案。
另外,方案A與方案B采納的是數據平均分割法,即把各個運算的節點根據實施一樣的任務,不同的僅僅為數據。同時用年作為單位來配置輸入的數據,每一個運算的節點處(PC)通過平均的方式分配若干年份的相關數據[3],同時將它們依次展開完善的模擬運算,節點內部所采納的是流水線式的并行計算方法。根據最后的運算結果可知,B方案優于A方案。
3 結語
并行程序主要是通過互聯網環境時開展多處理器計算資源的一種有效性方式。以往的并行運算主要借助于高昂的高性能服務器方式,最終實現高成本的目的。在最近幾年中,PC級微處理器的性能日益提升,同時高速互聯網日益成熟和推廣,從而替在廉價數核的PC級集群環境中,借助于高速與低成本的方式為并行運算提供了良好的條件。當下,并行計算方法已廣泛地運用在地質勘察、分子動力學、氣象預報以及虛擬性植物等研究范圍中,從而在一定程度上提高了科學運算的效率。
參考文獻
[1]王萃寒,趙晨,許小剛,等.分布式并行計算環境[J].計算機科學,2013,30(10):252-261.
[2]姜海燕,朱艷,湯亮,等.基于本體的作物系統模擬框架構建研究[J]中國農業科學,2015,42(4):1207-1214.
[3]嚴美春,曹衛星,羅衛紅,等.小麥地上部器官建成模擬模型的研究[J].作物學報,2011,27(2):222-229.
(責任編輯:趙中正)endprint