金元寅 鄭開炎 苑育豪
南京林業大學信息科學技術學院
1.建立通過量化分析方法的數學模型,,給出影響煤炭價格的主要因素(不超過10種),并且以秦皇島港動力煤價格為例,給出從2019年5月1日至2020年4月30日,影響秦皇島港動力煤價格的主要因素的排序(按影響程度從大到小排序,不超過10種)。
2.結合秦皇島港動力煤價格的歷史數據,以及問題1中的影響煤炭價格的主要因素,建立煤炭價格預測模型,分別以天、周、月為單位,預測未來31天、35周、36個月的煤炭價格。
3.為了更加準確地預測秦皇島港動力煤價格,綜合考慮未來各種情況(例如突發事件)引起的煤炭價格影響因素在結構性和重要性方面的變化,建立煤炭價格綜合預測模型,并給出模型的預測結果。
1.假設下文數據全部真實有效;2.假設下文代表性數據具有普遍性或可靠性;3.假設除本文分析的政策外,無外界大型干擾因素對煤炭價格產生影響。

變量 主要釋義y煤炭價格x1世界煤炭價格(本文主要采用西北歐標桿價。)x2 煤炭生產總量x3 煤炭消費總量x4 GDP增長率x5下游行業的煤炭需求(選用我國鋼材年產量為替代變量)x6國際市場天然氣價格(數據以美國亨利中心天然氣價格為參考)x7國際市場石油價格(數據以美國西德克薩斯中質原油價格為參考)x8 我國煤炭進口量x9 我國煤炭出口量C常量(截距)
1.變量選取。根據以上分析,我們建立多元回歸方程模型,對影響煤炭價格的各因素進行定量研究。

2.模型檢驗。本文選擇采用向后淘汰回歸分析法進行分析。根據問題設定所需要的P值或者T值,P值一般表達拒絕零假設的犯錯概率,P值越小,結果可信度越高。一般P值的可信度閾值為0.05,即當P值小于0.05時,我們認為結果是可信的。其次,分析每次回歸結果的P值,刪除不需要的P變量,次去掉一個最大的P值,直至所有變量結果都滿足P<0.05。
3.研究結論。通過分析得回歸方程為:

由該方程可知,煤炭產量每增加1億噸,煤炭價格下降2.492元/T,二者呈負相關;鋼鐵產量增加1000萬噸時,煤炭價格上漲21.1元/T,二者呈正相關;當美國油價上漲1元/桶時,煤炭價格上漲0.575元/T,二者呈正相關;當煤炭進口量增加1000萬噸時,相應的煤炭價格上漲0.313元/T,二者呈正相關;當煤炭出口增加1000萬噸時,中國市場煤炭價格將相應下降約18.246元/T,其參數對應的系數為負,因此煤炭價格與之呈負相關。
1.煤炭價格預測模型。在問題一的求解中,我們得出了回歸方程:

因此,我們將通過搜集煤炭產量、鋼材產量、煤炭出口量、美國石油價格、煤炭進口量數據,通過灰度預測方法預測出其未來的結果,代入回歸方程后得到我們關于煤炭價格的預測情況。
2.灰色模型GM的建立。灰色系統理論基于相關空間和平滑離散函數的概念定義灰度導數和灰度微分方程,然后建立具有離散數據序列的微分方程形式的動態模型。由于這是內在灰色系統的基本模型,模型是近似的和非唯一的,因此該模型稱為 GM。也就是說,灰色模型基于分離。離散隨機數變為隨機數,明顯且有規律地減弱。建立微分方程模型以便于研究和描述其變化過程。
1.政策分析。目前我國經濟進入了新常態,經濟增長的速度逐步放緩,但經濟增長的總量依然可觀,在供給方面“三去一補一降 ”顯得尤為重要,這對我過得煤炭行業不僅是機遇,也是挑戰。在化解煤炭產能過剩的進程中,嚴格落實基本方針,把煤炭產能列為安全監管的重點,嚴禁其過量生產低質量煤炭,堅決打擊違規違量生產,把政策正真落實在企業上,加強企業的風險意識,由此減少其對環境的工業污染。從煤炭供需方面來講,當前首要解決的是煤炭過剩問題,煤炭供需平衡首當其沖解決以此穩定煤炭價格。
2.因政策引起的變量變化分析。(1)煤炭產量。在上文政策中提到,煤炭產量會持續降低,最后趨于平緩。(2)鋼材產量。對于不同地方的煤炭需求,煤炭下游產品影響了我國煤炭需求量。針對這樣的問題,鼓勵煤炭下游產品的發展是必要的。因此鋼材產量將會在一段時間內持續增加,隨后趨于平緩。(3)煤炭出口量。針對煤炭供給過量的問題,所要做的是要積極調劑其平衡,防止因過剩造成的浪費問題,以此調控煤炭價格。因此煤炭出口量將持續提高,隨后降低或趨于平緩(4)煤炭進口量。對于煤炭進口來講,受產地供應緊張,港口庫存下降等因素等,高質量進口煤炭成為了必要考慮因素。因此,煤炭進口量將會在未來一段時間內降低,隨后趨于平緩(5)美國石油價格。該價格無政策因素變化。
(1)將復雜的煤炭價格預測模型轉化為易理解的回歸方程模型,降低了模型的難度,同時也保證了預測的準確性;(2)在回歸方程模型中,通過對因素具體的預測與分析,而非直接對因變量煤炭價格進行預測,大大提高了預測的準確性;(3)通過對現在時政的分析,將自變量變化趨勢進行調整后,預測出的煤炭價格,更為接近實際情況。
(1)模型的簡化程度較高,并未過多的考慮干擾因素,在價格預測的過程中會有一定的誤差;(2)在部分因變量數據獲取中,選擇了代表性數據,代表性不一定強也是對模型結果產生誤差的原因之一。