楊 華,姜海燕 ,趙空暖,錢崢遠
(南京農業大學人工智能學院,南京 210095)
作物生長模擬模型(以下簡稱“作物模型”)是作物精確栽培技術研究的重要工具,可以動態模擬不同品種在生長發育生理過程中與環境變量間的定量關系[1]。由于建模人員對作物生理生態過程認識不足,無法考慮全部的限制因子,導致模型存在一定的不確定性[2],會使使用者對模型預測結果不信任并影響應用效果[3]。這一因素限制了作物模型的大規模推廣,因此在應用時有必要進行不確定性優化。按照來源,作物模型的不確定性可分為結構不確定性、參數取值不確定性、數據不確定性以及主觀的不確定性[4-5]。模型不確定性優化方法亦是圍繞上述幾個方面展開,主要分為參數不確定性優化、模型結構不確定性優化及綜合的不確定性優化[6]。其中參數不確定性優化是作物生長模型應用的核心環節。作物模型參數主要是指品種參數,雖然模型自身提供了參數的參考值,但部分參數隨生態點地理位置及作物品種等變化而變化[7],因此,在應用模型時先要對這部分參數進行優化并驗證,提升其在某一地區的適用性。
校正作物模型品種參數的常用方法是基于統計理論的,主要包括廣義似然不確定性估計(generalized likelihood uncertainty estimation,GLUE)方法和馬爾科夫鏈蒙特卡羅(Markov chain Monte Carlo,MCMC)方法[8-9]。GLUE 方法存在計算時消耗資源過大,運行周期較長的問題,而且只考慮了參數的先驗分布,未將樣本信息先驗分布以似然函數(likelihood function,LF)形式化,這可能低估了模型的不確定性,導致參數校正結果及不確定度(uncertainty ratio,UR)分析時造成偏差[10]。而MCMC 方法充分利用了樣本信息先驗分布,并將其用LF 表示,結合參數先驗信息,以概率密度核函數的形式來表示模型參數分布[11],并能夠量化參數不確定性,因此成為不確定條件下作物模型參數校正的主流方法。黃健熙等[12-13]利用MCMC 對WOFOST、ORYZA 系列等模型進行參數標定,均取得良好效果。WALLACH 等[14-17]采用MCMC 進行模型不確定性量化和分析,為模型本地化應用提供參考,TAN 等[18]初步比較了GLUE 和MCMC 方法對參數校正結果的影響,發現MCMC 方法一定程度上優于GLUE。
利用MCMC 方法對模型參數校正的關鍵是LF 形式設計,LF 代表了模型殘差的分布特點,大部分作物模型研究中都是將LF 設為高斯正態似然函數(gaussian likelihood function,GLF)形式[19],GLF 要求模型殘差的方差恒定,然而作物模型殘差具有異方差性,即模型在可控制變量條件下具有變化的方差,這種變化的方差是由觀測數據的不確定性和模型本身的復雜性造成的[20]。有研究表明,在農業觀測數據中,由于測量手段、測量人員主觀性和環境因素影響,關鍵物候期和產量等測量值隨年份變化而波動較大,會導致模型殘差平穩性較差和離散程度較大,從而導致異方差性[21]。這會給參數校正的結果帶來偏差,影響作物模型的應用。
本研究以RiceGrow 和Oryza2000 水稻物侯期模型為研究對象,以中國南方地區早、中、晚3 種不同熟性的水稻品種栽培試驗數據為基礎,通過引入變異系數(coefficient of variation,CV)變換的高斯似然函(GLF with CV transformation,GLF-CV)和引入BC(Box-Cox)變換的高斯似然函數(GLF with BC transformation,GLFBC)對觀測數據和模型結構造成的異方差進行特征描述,并以參數后驗分布UR 和模型預測UR 為評價標準進行不同LF 下參數校正結果比較,以期為利用MCMC 方法進行水稻生長模型參數校正的LF 選擇提供參考,同時也為作物生長模型本地化應用提供指導。
研究數據集選取中國廣東省肇慶市高要區2004—2009 年、江蘇省泰州市興化市2001—2004 年、安徽省六安市1991—2004 年3 個南方地區水稻種植生態點的早熟(雪花粘)、中熟(武育粳3 號)、晚熟(汕優63 號)水稻品種各年份的田間試驗資料,品種和栽培信息見表1。其中,雪花粘的播種期范圍為3 月7—13 日,成熟期范圍為7 月8—15 日左右;武育粳3 號播種期范圍為5 月4—13 日左右,成熟期范圍為10 月8—15 日左右;汕優63 號播種期范圍為4 月18—25 日左右,成熟期范圍為9 月3—15 日左右。

表1 不同熟性水稻品種種植地點和年份Table 1 Planting place and year of rice varieties with different maturity
氣象數據來源:高要、興化、六安3 個地點各年份氣象數據均來源于國家氣象局氣象中心,基礎氣象數據包括日最高溫度(℃)、日最低溫度(℃),日照時數(h/d)和降雨量(mm)。
研究采用2 個非線性程度不同的物侯期模擬模型,分別是由南京農業大學國家信息農業工程技術中心研制的RiceGrow 物候期模型[22]和由國際水稻研究所及荷蘭瓦格寧根大學聯合開發的Oryza2000 物候期模型[23-24]。各模型敏感性品種參數描述及范圍如表2 所示。
1.3.1 貝葉斯統計推斷
對于水稻物侯期模型的驅動數據、模型品種參數和模型輸出,公式描述為
其中yi代表模型第i個試驗輸出關鍵物候期(如拔節期、成熟期等)儒歷天數(confucian calendar days,CCD)。為第i個驅動數據,如氣象數據、土壤數據和田間管理數據等,θ為模型品種參數,εi為模型殘差,根據貝葉斯公式,模型參數的后驗分布為
式中p(yi|θ,xi)為模型殘差εi先驗分布。本研究中用實際關鍵物候期與模型模擬值CCD 之間差值的LF 表示,p(θ)為模型參數θ的先驗分布。
1.3.2 MCMC 參數校正框架
在作物模型領域,MCMC 方法是基于貝葉斯推理的參數后驗分布估計中最有效的方法。該方法進行模型參數估算的基本思想是產生1 個馬爾科夫鏈,以目標分布為平穩分布,目標分布一般為p(yi|θ,xi),根據馬爾科夫理論,1 個馬爾科夫鏈從任意初值出發,都會收斂到平穩分布。MCMC 方法的目的是在構造1 個馬爾可夫鏈的基礎上生成參數集的樣本,通過參數集的平穩分布即可求出每個參數的后驗分布[25]。框架見圖1。首先設定品種參數先驗分布、模型約束目標變量殘差的LF 和MCMC采樣算法,從參數先驗分布中選擇參數值進行初始化,初始化值確定依據具體的MCMC 采樣算法而定。在田間管理數據、土壤數據和氣象數據等驅動下,運行生長模型得到約束目標變量值,將此值與LF 進行符合程度比較,并依據符合程度構造參數的馬爾科夫鏈,經過蒙特卡羅采樣,獲取新的參數值,重新代入模型運行,依次循環,當達到馬爾科夫收斂條件或設置的指定馬爾科夫鏈個數時,停止計算,此時獲得參數的后驗分布。

圖1 基于MCMC 方法的作物模型參數校正框架Fig.1 Parameter correction framework of crop model based on Markov chain Monte Carlo (MCMC) method
1.3.3 品種參數先驗分布
模型參數的先驗分布對用MCMC 方法進行參數后驗分布估計影響不大,一般設為均勻分布,參數先驗均勻分布的范圍見表2。
1.3.4 模型殘差先驗分布
模型殘差是模型模擬值和實測值之間的差值,從統計學的角度來看其服從一定的先驗分布。模型殘差的先驗分布可用概率密度函數來表示,概率密度函數是一種關于模型殘差特征的假設,而LF 是以概率密度函數中各參數為變量的函數,MCMC 方法通過不斷采樣模型參數值,使模型殘差的分布符合這個LF,因此LF 的形式對參數校正的結果影響較大,關于LF 形式的討論具體見1.4。
1.3.5 約束目標變量
由于不同模型在物候期模擬上存在一定差異,且不同水稻品種的物候期試驗數據在年份上不完全相同,因此,RiceGrow 物候期模型中,雪花粘品種選擇出苗、拔節期、抽穗期和成熟期作為目標變量,武育粳3 號品種選擇拔節期、抽穗期和成熟期作為目標變量,汕優63 號品種選擇出苗、拔節期、抽穗期和成熟期作為目標變量;在Oryza2000 物候期模型中,3 個品種均選擇孕穗期、抽穗期和成熟期作為目標變量。
1.3.6 MCMC 采樣方法
研究采用仿射不變馬爾科夫鏈蒙特卡洛集成采樣算法(ensemble sampling for affine-invariant MCMC,EMCEE),該算法由GOODMAN 提出,并由FOREMAN等用python 工具實現[26]。它引入了仿射不變性采樣器,相對于傳統的MCMC 方法能產生更多的獨立樣本,自相關時間更短,且利用多個CPU 內核,提高了計算并行性。目前已經在Nature 和Science 等期刊上有關天體物理學文獻中被使用[27-28],但是還未被應用于作物模型中。源碼見https://github.com/dfm/emcee。
在EMCEE 算法中,有以下參數需要設置:
1)參數維度。依據模型參數而定,本研究中RiceGrow 與Oryza2000 物候期模型帶校正品種參數均為5 個,參數維度設置為5。
2)并行馬爾科夫鏈初始條數。EMCEE 算法采用多條并行馬爾科夫鏈進行采樣,并行的馬爾科夫鏈初始條數一般是參數維度的4~6 倍[27],本研究中取6 倍,即30。
3)參數初始值。1 條馬爾科夫鏈需要1 組參數值,品種參數初始值的維度等于初始馬爾科夫鏈條數,依據步驟2),本研究中取30。每1 組的參數初始值由參數先驗分布區間上均勻采樣而來。
4)馬爾科夫鏈長度。馬爾科夫鏈長度為初始馬爾科夫鏈達到穩定時的條數,在EMCEE 算法中作為收斂條件,一般依據經驗設定,本研究中設為1 000。
1.4.1 GLF
GLF 不考慮模型殘差的異方差性,其分布服從均值為0,方差為常數的正態高斯分布。并可用概率密度函數表示為
式中σ為標準差,各關鍵物候服從以觀測日期CCD 為期望的高斯分布。為了使值穩定、函數形式簡單、計算方便,所有概率密度的計算均通過取對數形式計算。模型殘差εi為
各關鍵物候期觀測值聯合GLF 為
式中n為關鍵物侯期個數,是第i個關鍵物侯期儒歷天數模型模擬值,Si是第i個關鍵物侯期儒歷天數模型模擬值,Oi是第i個關鍵物侯期儒歷天數觀測值。本研究中標準差σ取Oi的1%。
1.4.2 GLF-CV
在實際物侯期觀測中,即使觀測方法和觀測設備相同,不同水稻品種歷年關鍵物候期觀測值的方差也并不恒定,這是模型殘差異方差性重要來源之一。
本研究中,汕優63 號品種成熟期的觀測數據出現較多異常值,且中位數分布在上、下四分位數之外,說明該物候期觀測數據離散程度較大。受不同年份季節氣候的影響,同一水稻品種關鍵物侯期觀測值的方差和均值隨年份變化而變化,因此在使用GLF 時可能存在偏差。
平穩性和離散程度是數據異方差性是否存在的直接反映,一般用變異系數CV 表示,雖然水稻物候期觀測數據的方差會隨年份變化,但方差和均值的比值在理想情況下應該接近恒定的值[29],本研究引入CV 來對模型殘差的異方差性進行修正。CV 定義為方差和均值的比值,可得修正后的各關鍵物候期聯合GLF-CV:
CV 根據每個關鍵物候期的歷年觀測值確定,將觀測值變化的方差轉為恒定的CV 值與均值的乘積,一定程度上達到修正模型殘差異方差性的作用。
1.4.3 GLF-BC
水稻物候期模型的非線性、不連續、非凸的特點[6]也是模型殘差異方差性的重要來源。為了同時考慮模型結構和觀測數據帶來的異方差性,本研究引入GLF-BC進行改善。
GLF-BC 的思想是BC 變換,它是統計學中一種通過數學變換手段改善數據異方差性的有效方法,主要特點是引入一個參數,通過數據本身估計該參數進而確定應采取的數據變換形式,通過BC 變換可以將模型殘差轉化為獨立相同分布的特性[30]。BC 變換的一般形式為
式中λ是變換參數,y是模型模擬或觀察到的結果。經過BC 變換后,模型的殘差表示為
將式(5)中的εi替換為式(9),可得各關鍵物候期觀測值聯合GLF-BC 為
當λ=1 時,BC 變換無效,即模型殘差無變換,當λ=0 時,BC 變換為對數變換,而通過觀測值確定時常常結果在接近邊界(通常靠近1)[31],因此為了使BC 變換有效同時方便計算,本研究中使用BC 變換中的平方根轉換,即取λ=0.5。
1.5.1 試驗環境
物侯期預測模型程序均為用Java 語言自主開發具有Restful 風格的web 服務,主體算法程序使用python 語言開發,采樣算法使用EMCEE 工具包,試驗運行環境是Intel(R)Xeon(R)Platinum8163CPU@2.50 GHz,內存16 GB,Windows10 64 位操作系統。
1.5.2 試驗設計
設計了兩組試驗分析比較了不同LF 對用MCMC 方法進行模型參數校正的影響。數據源為3 個水稻品種歷年站點數據(表1),模型包括RiceGrow 和Oryza2000物候期模型。LF 分別為GLF、GLF-CV 和GLF-BC,結果分別對校正后的模型參數后驗分布、模型參數UR 和模型預測UR 進行比較。其中,GLF-CV 是在GLF 基礎上改善了σ,使觀測數據方差趨于穩定,GLF-BC 在GLF 基礎上同時改善了σ和εi,從降低模型結構非線性造成的異方差進行修正。
1.5.3 試驗評價指標
評價方法包括參數校正后驗分布、參數UR 和模型預測UR 評價。
參數后驗分布用概率密度核函數圖表示,由多組參數向量通過曲線擬合而成。
參數屬于無量綱的值,參數UR 是一種參數校正結果可信賴程度的量化指標,用均方根偏差(root mean square deviation,RMSD)和相對均方根偏差(relative root mean square deviation,RRMSD)表示[32],
式中p為后驗分布中參數集個數,θi表示第i個參數,為參數集均值。當θ服從高斯分布時,RMSD 可以作為總標準差的無偏估計。為了比較不同參數集的離散程度和穩定性,計算參數后驗分布的RRMSD,計算式為
模型預測UR 用均方根誤差(root mean square error,RMSE)、標準均方根誤差(normalized root mean square error,NRMSE)來表示。
式中q為關鍵物侯期個數。
2.1.1 RiceGrow 物候期模型參數后驗分布與UR 比較
1)參數后驗分布比較
GLF、GLF-BC 和GLF-CV 下RiceGrow 物侯期模型雪花粘、武育粳3 號、汕優63 號品種參數后驗分布的概率密度核函數圖見圖2。可以看出參數后驗分布收斂區間相對于先驗分布均有縮小,3 種LF 在RiceGrow 物候期模型參數校正均有一定的效果。

圖2 不同似然函數下RiceGrow 物候期模型參數后驗分布概率密度核函數圖Fig.2 Posterior distribution probability density kernel function of RiceGrow phenological model parameters under different likelihood functions
品種參數TS、FDF、To、IE 與品種熟性無明顯關系,PS 代表了水稻的感光性,PS 值越高代表感光性越強,一般來說早熟品種基本不感光或感光極弱,晚熟品種感光較強,而中熟品種感光性較復雜,雪花粘、武育粳3 號、汕優63 號分別對應早熟、中熟和晚熟品種。由圖2 可以看出,3 種LF 下雪花粘PS 概率密度函數峰值對應的參數值均小于汕優63 號,這與實際較為吻合。在汕優63 號中,GLF-BC 下PS 概率密度函數的區間較GLF-CV 和GLF 更為收斂,表明GLF-BC 下得出的PS后驗分布更為精確。
2)參數UR 比較
由表3 可以看出,GLF-BC 所得的各種參數RRMSD最小,其次是GLF-CV,GLF 表現最不理想。這是因為而GLF-CV 只考慮觀測數據帶來的異方差,未考慮模型結構帶來的異方差,GLF-BC 同時考慮了這兩種異方差的來源,因此GLF-BC 下的參數RRMSD 小于GLF-CV,GLF-CV 小于GLF,這表明了GLF-BC 和GLF-CV 在改善殘差異方差性上具有一定的作用,也從反面證明了RiceGrow 物候期模型的異方差性與模型結構本身有關。

表3 不同似然函數下RiceGrow 物候期模型參數不確定度Table 3 Uncertainty ratio of RiceGrow phenological model parameters under different likelihood functions
2.1.2 Oryza2000 物候期模型參數后驗分布與UR 比較
1)參數后驗分布比較
3 種LF 下Oryza2000 物侯期模型參數后驗概率密度核函數圖見圖3,品種參數DVRJ、DVRP、DVRR、PPSE與品種熟性無明顯關系,DVRI 是水稻感光性的倒數,DVRI 值越小代表感光性越強,圖中可以看出3 種LF 下雪花粘DVRI 概率密度函數峰值對應的參數值均大于汕優63 號,這與實際較為吻合。在汕優63 號中,GLFBC 下DVRI 概率密度函數的區間較GLF-CV 和GLF 更為收斂,且峰值對應的參數值更小,表明GLF-BC 下得出的DVRI 后驗分布更為精確。

圖3 不同似然函數下Oryza2000 物候期模型參數后驗分布概率密度核函數圖Fig.3 Posterior distribution probability density kernel function of Oryza2000 phenological model parameters under different likelihood functions
2)模型參數UR 比較
由表4 可知,GLF 所得的雪花粘品種參數RRMSD最小,GLF-BC 所得的汕優63 號品種參數RRMSD 最小;GLF-CV 所得的武育粳3 號品種參數RRMSD 最小,3 種LF 所得的各品種參數RRMSD 均有差別。這可能是因為汕優63 號品種的觀測數據年份最長(見表1),根據統計學理論觀點,觀測數據越多,其數據特征越趨于穩定,GLF-CV 的假設即是觀測數據具有固定的變異系數,這與觀測數據具有穩定性是一致的。同時由于在RiceGrow物候期模型利用二次曲線函數來描述每日光周期效應,Beta 函數描述每日熱效應,這兩種函數均是非線性函數,而Oryza2000 物候期模型結構采用多個線性函數進行級聯,其非線性較RiceGrow 弱。若其異方差大部分來源于模型結構,GLF-BC 好于GLF-CV 是有可能的。若觀測數據的異方差性整體較小且Oryza2000 模型非線性較弱,GLF 好于GLF-CV、GLF-BC 也是有可能的。
將參數后驗分布中的均值帶入模型運行得到模擬結果與觀測值進行比較分析。在RiceGrow 物侯期模型中,選取出苗期、拔節期、抽穗期、成熟期4 個關鍵物候期進行比較;在Oryza2000 物侯期模型中,選取孕穗期、抽穗期、成熟期3 個關鍵物候期進行比較。結果見表5。

表5 不同似然函數下2 種物候期模型預測UR 及參數UR 比較Table 5 Comparison of two phenophase models for predicting uncertainty ratio and parameters uncertainty ratio under different likelihood functions
GLF-BC 下雪花粘、武育粳3 號、汕優63 號品種的RiceGrow 物候期模型預測RMSE 為3.34、3.49、2.66 d;整體上均小于GLF-CV 下的3.43、3.56、3.46 d 和GLF 下的4.54、3.70、2.73 d,這與前一節得出的參數UR 中GLFBC 小于GLF-CV 和GLF 對應,說明了在RiceGrow 物候期模型中,參數RRMSD 越小,模型預測RMSE 越小,整體上GLF-BC 表現最好,GLF-CV 其次,GLF 最后。
雪花粘、武育粳3 號、汕優63 號品種的Oryza2000物候期模型預測RMSE 最小的分別是GLF、GLF-BC、GLF-CV,并沒有像RiceGrow 物候期模型中出現GLFBC 一直表現良好的現象,這是因為LF 可以看作是一種描述模型預測UR 的方法,而模型預測UR 來源包括模型結構UR、模型參數UR、觀測數據UR 等,不同的LF 體現的各類UR 來源權重不同,對模型的匹配程度也不盡相同,相對于RiceGrow,Oryza2000 物候期模型的結構非線性程度和復雜性較低,對于參數校正而言,觀測數據UR 對模型預測UR 的影響較大,而不同品種和年份的觀測數據存在一定差異,因此在Oryza2000 物候期模型中,LF 對于不同品種參數校正的適應性不同。
取每個LF 下的所有品種的參數RRMSD 和模型預測RMSE 的值,得到參數整體UR 和模型預測UR 的量化關系,從表5 可以看出,在RiceGrow 物候期模型中,整體上,參數RRMSD 越小,模型預測RMSE 越小,這可能是因為其參數UR 是模型預測UR 的主要來源。而在Oryza2000 物候期模型中,GLF 的模型預測RMSE 最小,但其參數RRMSD 卻最大,模型預測的UR 并未隨著參數UR 同方向變化,這可能是因為其模型參數UR占據模型預測UR 的來源權重較小。
對比兩種模型結構,在揭示水稻發育進程的規律中,Oryza2000 物候期模型對于光周期效應和熱效應的描述均采用線性方程,相對于RiceGrow 更為簡化,因此同樣的觀測數據,在Oryza2000 中對于參數校正結果的影響較大,因此其觀測數據UR 可能占據模型預測UR 的來源權重較大。而參數UR 對模型預測UR 的影響,只有在參數UR 占據主要來源權重時,才會呈同趨勢變化。
在RiceGrow 物候期模型中,用MCMC 方法進行參數校正時,GLF-BC 好于 GLF 和 GLF-CV,然而Oryza2000 物候期模型中不同LF 的效果更依賴于觀測數據,從模型結構來看,這是由于Oryza2000 物候期模型的線性程度較RiceGrow 高。引入GLF-BC 和GLF-CV的目的是為了改善模型殘差的方差特征,使模型殘差符合正態高斯分布,這對非線性系統模型來說是有一定效果的,在線性系統模型中,模型殘差一般均為隨機誤差,且符合正態高斯分布,一般不需要進行變換。因此將GLF-BC 和GLF-CV 用于MCMC 方法進行Oryza2000 物候期模型參數校正和不確定性分析效果可能不明顯,這需要更多的試驗進行驗證。
在GLF-BC 中,本文假設的BC 變換系數值取值為1/2,這是參考一般的BC 均值變換,雖然在RiceGrow物候期模型中效果良好,但是若在MCMC 采樣過程中能夠結合觀測數據動態調整,將進一步提高LF 的適用性,比如在Oryza2000 物候期模型中使用自適應的LF,這是下一步將要研究的問題。
模型結構UR、參數UR 和觀測數據UR 是模型預測UR 的重要來源,本研究初步量化了參數UR 與預測UR 的關系,但并未對模型結構UR、觀測數據UR 與模型預測UR 的關系進行量化,這是下一步的工作。
本研究通過引入引入變異系數(coefficient of variation,CV)變換的高斯似然函數(Gaussian likelihood function with CV transformation,GLF-CV)和 BC(Box-Cox)變換的高斯似然函數(GLF with BC transformation,GLF-BC)對水稻物候期模型殘差的異方差性進行修正,以RiceGrow 和Oryza2000 物候期模型為研究對象,通過試驗對比了3 種似然函數(likelihood function,LF)下用馬爾科夫鏈蒙特卡洛(Markov chain Monte Carlo,MCMC)算法進行雪花粘、武育粳3 號、汕優63 號水稻品種參數校正和不確定性量化分析結果。得出主要結論如下:
1)引入的GLF-BC 和GLF-CV 在用MCMC 方法進行水稻物候期模型參數校正時均有效果,得出的雪花粘、武育粳3 號、汕優63 號參數后驗分布均值帶入RiceGrow和Oryza2000 進行模型預測,均方根誤差范圍分別為2.66~4.54、2.30~4.41 d。
2)在RiceGrow 物候期模型中,3 個水稻品種參數相對均方根偏差RRMSD(relative root mean square deviation,RRMSD)和模型預測均方根誤差(root mean square error,RMSE)均是GLF-BC 最小,在GLFBC 下模型預測 RMSE 比 GLF-CV 小 0.09、0.07、0.80 d,比GLF 小1.21、0.20、0.07 d,表明GLF-BC 對 RiceGrow物候期模型具有良好的適應性。在Oryza2000 物候期模型中,雪花粘、武育粳3 號、汕優63 號3 個水稻品種的模型預測RMSE 最小的是GLF、GLF-BC 和GLF-CV,分別為2.30、4.17、3.50 d,3 種LF 各有優勢。
3)初步量化了不同LF 下模型預測不確定度(uncertainty ratio,UR)和參數UR 之間的關系。在RiceGrow 物候期模型中,參數UR 是模型預測UR 的主要來源,在Oryza2000 物候期模型中,觀測數據UR 可能是模型預測UR 的主要來源。MCMC 通過對采樣得到的參數進行統計分析,估計模型參數的后驗分布,后驗分布反映了參數UR。而LF 在參數校正中起到了關鍵的作用,參數后驗分布的形狀和位置受LF 的影響,因此LF 的選擇和定義可能因具體問題而異,需要能夠與模型和觀測數據的特性相匹配。LF 的選擇與模型殘差異方差的主要來源有關,當主要來源為觀測數據時,GLF-CV好于其他;當主要來源為模型結構本身時,GLF-BC 好于其他;當模型殘差的異方差性較小時,可使用GLF。