[摘 要] 根據多元線性回歸的原理和實現方法,采用Delphi和ADO數據引擎開發出了一個集數據采集、樣本剔除、統計檢驗與預測功能于一體的多元線性回歸系統。該系統操作簡單、功能強大,具有很強的魯棒性和適應性,可以方便地進行多元線性回歸和一部分非線性回歸,具有廣泛的應用價值。文章對系統的設計與構建作了詳細的闡述,并用一個實例對該系統的使用及回歸結果的解讀進行了詳細說明。
[關鍵詞] 多元線性回歸 非線性回歸 數據處理 系統設計
一、引言
多元線性回歸分析是一種重要和具有廣泛應用價值的數據處理方法,主要用來測度具有相關關系的變量之間數量變化的一般關系,以便運用估計或者預測的統計方法。目前,多元線性回歸在很多領域,比如經濟、管理等領域得到了廣泛的應用。但目前的一些實現方法,在功能、可視性、易用性、系統性、穩健性、程序的適應性以及運行速度等方面都還有待探索。鑒于此,筆者根據多元線性回歸的原理和實現方法,利用Delphi6.0和ADO數據引擎開發了一個多元線性回歸數據處理系統,用來對大型數據進行回歸處理,相比其他的軟件,該程序具有提高了數據處理的高效性、針對性和可操作性等特點,并且操作簡單明了,上手容易。
二、系統設計
本系統包括以下四個模塊:數據獲取、數據及變量處理、回歸分析、結果輸出。主要的工作內容是通過數據庫或者Excel獲得基本數據,然后對基本數據進行處理,存放在數據庫中,接著利用最小二乘法進行線性回歸,最后將結果進行保存。
根據以上分析,本系統的總體結構如圖1所示。
根據回歸計算的要求及本程序的特點可以得到具有二范式的數據庫概念模型,來滿足系統開發所需要的性能,達到設計要求。由于每次回歸運算解釋變量的數目不一定相同,本系統采用動態建立數據表,及動態增減變量的方法。
三、程序實現
1.系統界面。系統界面如圖2所示,為全中文圖形用戶界面。GUI集成度高,將最重要的回歸分析部分的數據處理、回歸結果,以及回歸圖形等用選項卡列在程序的主界面上。
2.模塊功能和程序實現。(1)數據輸入。在進行多元線性回歸之前,首先要建立一個多元回歸項目。可以通過點擊文件菜單的新建回歸項目菜單或者直接雙擊主界面上的表格直接輸入數據來完成該操作。回歸項目建立完成后,可以在主界面的Spreadsheet里面輸入數據。另外,還可以通過點擊“文件”菜單上的“獲取外部數據”菜單項,從Excel文件獲取數據。(2)數據處理。在完成數據的輸入之后,可以在主界面上的Spreadsheet里面對不符合要求的樣本進行剔除。通過點擊主界面上右下角的“剔除”、“添加”按鈕可以進行剔除和添加變量的操作。對變量進行計算是本系統的特色之一,這樣可以將部分非線性回歸轉化成線性回歸。在表達式欄輸入相應的公式,就能對變量進行處理。目前,本系統支持包括加減乘除、求余、指數運算、三角函數、對數運算、反三角函數及定積分等常用計算。(3)回歸分析。本系統采用最小二乘法對模型參數進行估計。在“操作”菜單點擊“開始回歸”或者在工具欄點擊“開始回歸”按鈕就能完成相應的操作。(4)結果輸出。本程序產生的結果分成兩個部分,一部分是一般的回歸結果,將在下文詳細說明;另一部分為圖形結果,輸出的是各個自變量和因變量的關系圖以及差方圖,這些圖形可以幫助我們直觀的理解線性回歸的結果。(5)其他功能。本程序還能對現存的回歸項目進行管理,并對其數據庫做相應的操作,比如修改、刪除等。另外,本程序還可以將回歸結果保存成Excel表格的形式,以便于日后查看回歸結果。
四、應用實例
下面用一個實例來說明本系統的使用過程、數據處理結果以及結果的解讀。首先,建立一個名為“TEST”回歸項目,來研究某省工業產值()、農業產值()、固定資產投資()對運輸業產值()的影響。點擊主界面上的“開始回歸”按鈕,輸出如下回歸結果。
本軟件的回歸結果由回歸統計、方差分析、回歸參數、殘差表和DW檢驗等五部分組成。回歸統計部分給出了相關系數、測定系數、校正測定系數、標準誤差和樣本數目等。在表中與之對應的分別是Multiple R、R Square、標準誤差和觀測值。
在第二部分方差分析中,df、SS、MS和F格列分別代表自由度、誤差平方和、均方差和F值。
第三部分回歸參數表中包括回歸模型的截距、斜率及其有關的檢驗參數。第一列對應的是回歸模型的系數,由此可以建立回歸模型:;第二列為回歸系數的標準誤差,誤差值越小,表明參數的精確度越高;第三列t Stat對應的是統計量t值用于對模型參數的檢驗。
第四部分為殘差輸出結果。殘差輸出中包括觀測值序號(第一列,用i表示),因變量的預測值(第二列,用i表示)以及殘差(第三列)。由于該回歸的樣本較多,限于篇幅上表僅列出三個樣本點。
回歸結果的最后一部分為DW檢驗,用于檢驗隨機誤差項具有一階自回歸形式的序列相關問題。
五、結論
本文采用Delphi和ADO數據引擎開發了一個從數據的收集整理和處理,到回歸計算以及回歸結果的輸出和可視化結果的多元線性回歸系統。該系統不僅能完成線性回歸,還能通過對變量進行運算,完成一部分非線性回歸。
參考文獻:
[1]賈俊平:統計學[M].北京:清華大學出版社,2004
[2]李全彬 黃 昶:基于Delphi的高效數據庫應用系統開發方法[J].微計算機信息,2006,4~3:235~237