陳溥 楊貺



摘 要 本文根據2017年高教社杯全國大學生數學建模競賽C題中提供的物質在不同濃度下的顏色讀數采樣數據,運用SPSS軟件對數據進行多元線性回歸分析,得到了各種物質顏色讀數與物質濃度的數學模型。對所得模型進行誤差分析發現,只有組胺的模型達到精度要求,其它四種物質的模型誤差均偏大,且模型失效。對失效的模型,考慮更優的建模方法,計算四種物質數據中五個影響指標兩兩之間的相關性系數,選取兩兩之間相關性系數最大的三對指標進行重新組合,得到一組新的數據,之后進行重新建模,最終得到了各物質顏色讀數與濃度優化后的非線性數學模型。
關鍵詞 SPSS 回歸分析 數學模型
中圖分類號:TP311.54 文獻標識碼:A 文章編號:1007-0745(2021)06-0024-04
1 前言
世界是多姿多彩、五彩繽紛、光鮮亮麗的,我們在日常生活中經常會看見五顏六色的事物,這時便會有朋友好奇顏色為什么會有這么多種,即使是相同的顏色,又為什么會有深淺,大多數人都會說是濃度不同所導致的,的確深淺在我們看來,就是濃淡,亦是物質的濃度,那么如何根據顏色的深淺來確定物質的濃度呢,這使得研究顏色讀數與濃度之間的關系就變得越來越重要。
比色法是目前常用的一種檢測物質濃度的方法,即把待測物質制備成溶液后滴在特定的白色試紙表面,等其充分反應以后獲得一張有顏色的試紙,再把該顏色試紙與一個標準比色卡進行對比,就可以確定待測物質的濃度檔位了。由于每個人對顏色的敏感差異和觀測誤差,使得這一方法在精度上受到很大影響。隨著照相技術和顏色分辨率的提高,希望建立顏色讀數和物質濃度的數量關系,即只要輸入照片中的顏色讀數就能夠獲得待測物質的濃度。
2 模型的建立與求解
首先將附件中的采樣數據導入SPSS,其次在SPSS軟件中對各組數據進行多元線性回歸分析,得到各物質顏色讀數與物質濃度的模型如下:(模型中的符號說明見下表)
3 模型的誤差分析
根據以上所得各物質的顏色讀數與濃度的模型,將采樣數據中各顏色讀數代入模型,求得所對應的各物質的濃度模型值yi,之后與所對應的濃度采樣值yi進行比較,代入下面平均相對誤差的計算公式:
計算得到各物質模型的平均相對誤差如下表:
通過表格中的數據可以看出,只有組胺模型的平均相對誤差小于10%,在可以接受的范圍內,另外四種物質模型的平均相對誤差較大,超出了可接受范圍,模型失效。[1]
4 模型的改進
對于四種物質的失效模型,考慮更優的建模方法,運用SPSS軟件計算四種物質采樣數據中五個影響指標(B、G、R、H、S)兩兩之間的相關性系數,得到的相關性系數結果如上表1~4。
在各種物質中,選取五個影響指標兩兩之間相關性系數最大的三對指標進行兩兩組合(對應的指標數據兩兩之間做乘法運算,得到新的組合數據),兩兩之間相關性系數最小的指標不進行組合(對應的指標數據取各自的平方,得到新的數據),從而各物質均得到一組新的五個組合指標,并且得到其所對應的數據如表5~8。
將數據導入SPSS軟件,并對各物質新組合的數據進行多元線性回歸分析,得到了各物質下顏色讀數與物質濃度的模型如下:
溴酸鉀的模型:
y2=413.977-0.015x1x2-0.09x1x5-0.05x23-0.03x25
工業堿的模型:
y3=-35.338+0.02x1+0.01x2x4-0.01x23-0.03x2x5+0.01x4x5
硫酸化鉀的模型:
y4=-12.578-0.00033x1x5-0.001x3x5+0.001x4x5+ 0.001x22+0.00036x24
奶中尿酸的模型:
y5=7569.571-3.404x1x4+2.019x1x5-5.845x2x3+1.015x21+ 4.867x22
根據以上所得的非線性數學模型,將采樣數據中各顏色讀數代入上述模型,求得所對應的各物質的濃度模型值yi,之后與所對應的濃度采樣值yi進行比較,代入下面平均相對誤差的計算公式:
計算得到以上四種物質模型的平均相對誤差如上表9所示。
從表中可以看出,四種物質模型的誤差均小于10%,由此可見,改進后的非線性模型與之前由多元線性回歸分析所得的模型對比,有了很大的優化。[2]
5 結語
本文運用SPSS軟件對采樣數據進行了多元線性回歸分析,建立了顏色讀數和物質濃度的數學模型,并對所建立的模型進行了誤差分析和改進,得到了優化后的非線性數學模型,根據顏色讀數來預測物質濃度,在實際應用中有一定的參考價值。
參考文獻:
[1] 張文彤.SPSS統計分析基礎教程[M].北京:高等教育出版社,2017.
[2] 武松,潘發明.SPSS統計分析大全[M].北京:清華大學出版社,2014.