董如意,杜俊杰
(吉林化工學院,吉林 吉林 13022)
人工智能已經成為支撐國民經濟和工業發展的重要技術,并且正在深刻改變著人類的生產生活方式。國務院高度重視人工智能的發展,2017年制定的《新一代人工智能發展規劃》明確指出:“人工智能是引領未來的戰略性技術”[1]。機器學習已經成為當前技術發展熱點,機器學習是通過計算機模擬或實現人類的學習行為,以獲取新的知識或技能,并不斷改善自身的性能,它是計算機具有智能的根本途徑。機器學習技術發展迅速,已日漸滲透到生產和生活服務的各個方面。高校需要與時俱進、順應時代,加強培養更多具有機器學習理論與應用實踐能力的人才。而機器學習具有高度實踐性且涉及的算法眾多,如何在教學過程中結合項目實踐,培養應用型人才,已成為各高校人才培養過程中關注的一個難題。百度的PaddlePaddle是一個易用、高效、靈活和可擴展的深度學習平臺,它使得研究人員更容易、更快捷地構建深度學習模型,以及輕松地上傳訓練數據,訓練深度學習模型,執行準確、直觀的預測分析,極大提高速度和生產率[2]。
機器學習課程是人工智能專業的核心專業課程,但機器學習課程建設過程中面臨著實訓室建設成本較高,機器學習理論艱澀枯燥等問題。因此課題組通過校企合作,引入線上Paddle云平臺來解決實訓室建設成本問題,并通過項目化的教學模式來貼近企業實際中的應用場景,提高學生的學習興趣和學習效果。由此,探索形成一套機器學習課程的實驗案例方案。
通過案例實踐,進一步掌握并驗證相關算法的性能及用法,著實提升學生對機器學習算法的解決問題能力及編程應用能力;通過詳細查閱相關參考文獻,將課程理論知識與未來企業實際需求相結合,以提升學生的技術競爭力。為了實現這些目標,在充分參考現有經典機器學習實驗案例的基礎上,課題組將實驗內容、學科發展及實際需要聯系起來,加強實驗內容的綜合性、系統性、專題性和模塊化建設。
本實驗案例借助PaddlePaddle深度學習框架,使用Python語言構建基于LSTM神經網絡模型,實現股票的預測模型。研究該案例的具體實現及其結合云平臺操作的可行性。
長短期記憶神經網絡(Long Short-termmemory, LSTM)是一種特殊的RNN,是為了解決長序列訓練過程中的梯度消失和梯度爆炸問題而設計的,相比普通的RNN,LSTM能夠在更長的序列中有更好的表現[3]。圖1為LSTM網絡結構。

圖1 LSTM網絡結構
本次試驗采用1990—2015年上證指數的開源股票數據集,共6 109條數據,利用歷史數據中的開盤價、收盤價、最低價、最高價、交易量、交易額、跌漲幅來對下一日的最高價進行預測。基于PaddlePaddle庫構建股票預測的神經網絡模型,具體實驗流程有以下幾方面。
2.2.1 導入庫
導入一些關鍵的庫,分別是:(1)paddle.fluid。PaddlePaddle深度學習框架。(2)numpy。用于科學計算,支持大量的維度數組與矩陣運算。(3)matplotlib.pyplot:類似MATLAB的繪圖框架,支持數據的可視化。
2.2.2 數據預處理
對股票數據集進行預處理,使得滿足模型訓練需要。本次實驗將數據集中的60%作為訓練集,40%作為驗證集,劃分數據集時進行數據歸一化處理,這樣可以提高模型的精度以及加快模型的收斂速度。LSTM算法在訓練集上進行模型訓練,再使用該模型對測試集進行預測,將預測結果與測試集的真實值進行對比,以評估該模型的性能。
2.2.3 搭建模型與訓練模型
搭建LSTM模型的關鍵代碼如下所示:
x = fluid.layers.data(name=’x’, shape=[1], dtype=’float32’, lod_level=1)
label = fluid.layers.data(name=’y’, shape=[1], dtype=’float32’)
fc0 = fluid.layers.fc(input=x, size= 4)
lstm_h, c = fluid.layers.dynamic_lstm(input=fc0, size=4, is_reverse=False)
模型搭建完成后開始訓練,通過設置訓練的回合數、批數據大小等參數,來觀察其對訓練結果的影響。由此得到較好的預測效果。
2.2.4 訓練結果
使用訓練后的模型對測試集數據進行股票預測并觀察預測效果。將預測值Predicted Value和真實值True Value的折線圖繪制在一起進行對比。LSTM神經網絡預測結果如圖2所示。

圖2 LSTM神經網絡預測結果
通過圖2可以看出,使用PaddlePaddle構建的股票預測深度學習模型展示了預測值Predicted Value和真實值True Value有較好的擬合程度。
本文結合實際應用問題,緊跟最新技術的步伐,重點強調教學過程的易懂性和實用性及系統性。通過基于PaddlePaddle平臺的機器學習課程實驗案例的研究,提高了學生利用機器學習方法解決復雜工程問題的能力,結合交叉學科的現實案例,既讓學生能掌握基礎的機器學習相關知識,又讓學生充分了解機器學習技術的發展前沿。在此基礎上學會利用PaddlePaddle進行算法實現和開發,進一步加深對理論知識的理解、概念的建立。除此以外,該課程實驗案例研究能讓學生在發現問題解決問題的過程中,掌握學科知識的具體應用與實現,極大地調動了學生學習的積極性,可以借此課程實驗案例研究引導學生自發學習相關的知識。