神經網絡領域最早是由心理學家和神經學家開創的,旨在尋求開發和檢驗神經的計算模擬。神經網絡是一組連接的輸入/輸出單元,其中每一個連接都與一個權重相關聯。神經網絡可以分為兩個階段,第一個階段是學習階段,通過調整權重,使得能夠預測輸入元祖的正確類標號,第二階段為預測階段,使用生成好的神經網絡模型進行預測[1]。
神經網絡的優勢包括其對噪聲數據的高承受能力,以及對未訓練的數據的模式分類能力,劣勢在于可解釋性差。
Clementine軟件采用可視化編程思想,提供了大量的人工智能、統計分析的模型,可將數據挖掘流程轉化為一個數據流,每個數據流由一系列結點組成,為每個結點指定操作,就可以完成數據流的執行[2]。結點被劃分為七個欄,分別為源、記錄選項、字段選項、圖形、建模、輸出和導出。
校園貸預測模型建立可分為兩個過程,首先是神經網絡模型的訓練過程,其次是使用訓練好的神經網絡模型進行預測[3]。下面分別從這兩個過程分析模型的建立步驟。
1.神經網絡模型的訓練過程
步驟1 在軟件Clementine中選擇源結點中用于讀取Excel數據(訓練集)的結點并配置數據來源;
步驟2 在字段選項中選擇類型結點,并配置數據列的類型和方向;
步驟3 在建模選項下選擇神經網絡結點并配置參數;
步驟4 連接新建立的3個結點并執行數據流,數據流如圖1所示,生成的神經網絡模型如圖2所示。
2.使用訓練好的神經網絡模型進行預測
步驟1在軟件Clementine中選擇源結點中用于讀取Excel數據(測試集)的結點并配置數據來源;
步驟2在字段選項中選擇類型結點,并配置數據列的類型和方向;
步驟3 選擇訓練好的神經網絡模型;
步驟4 選擇輸出選項中的表結點;
步驟5 連接新建立的4個結點,形成的數據流如圖3所示。

圖1 神經網絡模型訓練數據流圖

圖2 神經網絡模型圖

圖3 神經網絡模型預測數據流圖
將樣本分為訓練集和測試集兩部分,訓練集占80%,測試集占20%。使用訓練好的神經網絡模型在測試集上預測,將得到的結果進行處理,取閾值為1.7,將小于閾值的歸為會使用網貸類,將大于等于閾值的歸為不會使用網貸類,將實際值與預測值匯總,得到的結果如表1所示。

表1 預測分類與實際分類圖

表1續 預測分類與實際分類圖
經計算預測準確度達到88.9%,達到了較好的預測效果。
文章以重慶工程職業技術學院范圍內得到的調查問卷為基礎,利用Clementine軟件建立了神經網絡模型,并在測試集上對模型的預測效果進行驗證,測試結果顯示準確度達88.9%,證明使用神經網絡模型預測大學生是否會使用校園貸是可行的。