田茹會(huì)
(陜西能源職業(yè)技術(shù)學(xué)院基礎(chǔ)課教學(xué)部,陜西咸陽(yáng),712000)
采用比色法檢測(cè)一種物質(zhì)濃度,其原理就是把待測(cè)物質(zhì)制備成溶液后滴在特定的白色試紙表面,等讓其在白色試紙上充分反應(yīng)后獲得一張有顏色的試紙,再與標(biāo)準(zhǔn)比色卡進(jìn)行對(duì)比,就可確定待測(cè)物質(zhì)的濃度檔位。由于人對(duì)顏色認(rèn)知都有差異,其敏感程度不同就使其觀測(cè)產(chǎn)生誤差。隨著照相技術(shù)和顏色分辨率的提高,希望建立顏色讀數(shù)和物質(zhì)濃度的數(shù)量關(guān)系,即只需輸入照片中的顏色讀數(shù)就可獲得待測(cè)物質(zhì)的濃度。試根據(jù)題中提供的有關(guān)顏色讀數(shù)和物質(zhì)濃度數(shù)據(jù)對(duì)下面幾題進(jìn)行求解。
問(wèn)題一:由附件1[1]所給出5種物質(zhì)在不同濃度下的顏色讀數(shù),討論從給出的這5組數(shù)據(jù)中能否確定顏色讀數(shù)與物質(zhì)濃度間關(guān)系,并用一些準(zhǔn)則來(lái)評(píng)價(jià)這5組數(shù)據(jù)的優(yōu)缺點(diǎn)。
問(wèn)題二:對(duì)附件2中的數(shù)據(jù),建立顏色讀數(shù)和物質(zhì)濃度的數(shù)學(xué)模型,并給出模型的誤差分析。
問(wèn)題三:討論數(shù)據(jù)量和顏色維度對(duì)模型的影響。
依題意,五種物質(zhì)在不同的濃度下多組數(shù)據(jù)進(jìn)行對(duì)比,將各組數(shù)據(jù)進(jìn)行整合處理,得出不同濃度與顏色讀數(shù)的線性關(guān)系。將濃度設(shè)為縱軸,將藍(lán)色、綠色、紅色,設(shè)為橫軸。利用Excel畫(huà)出散點(diǎn)圖,確定擬合函數(shù)的趨勢(shì)線,求出顏色讀數(shù)與物質(zhì)濃度的關(guān)系式和可決系數(shù),評(píng)測(cè)五組數(shù)據(jù)的優(yōu)劣。
由組胺的不同顏色讀數(shù)與其濃度的擬合趨勢(shì)圖,建立多元線性回歸模型[2]進(jìn)行數(shù)據(jù)分析,得出關(guān)系式為:y=182.3872-0.17185x1-2.28877x2+0.651217

圖1 組胺的擬合趨勢(shì)圖
該函數(shù)的擬合函數(shù)可決系數(shù)[3]R2=0.9951,隨著顏色讀數(shù)的增大,其濃度不斷減小。兩者呈負(fù)相關(guān)。
做出溴酸鉀的不同顏色讀數(shù)與其濃度的擬合趨勢(shì)圖,建立多元線性回歸模型進(jìn)行數(shù)據(jù)分析,得出關(guān)系式為:y=210.0542-1.143744x1+7.35832x2-7.46947x1
該函數(shù)關(guān)系式可決系數(shù)R2=0.9146,說(shuō)明該函數(shù)擬合程度高,與真實(shí)情況接近。
做出工業(yè)堿的不同顏色讀數(shù)與其濃度的擬合趨勢(shì)圖,建立多元線性回歸模型進(jìn)行數(shù)據(jù)分析,得出關(guān)系式為:y=15.60879+0.07411x1+0.04693x2-0.011609x3
該函數(shù)關(guān)系式可決系數(shù)R2=0.8856,說(shuō)明該函數(shù)擬合程度高,與真實(shí)情況接近。
做出硫酸鋁鉀的不同顏色讀數(shù)與其濃度的擬合趨勢(shì)圖,建立多元線性回歸模型進(jìn)行數(shù)據(jù)分析,得出關(guān)系式為:y=7.84906+0.035596x1-0.10072x2+0.00295x3
該函數(shù)關(guān)系式可決系數(shù)R2=0.5035,說(shuō)明該函數(shù)擬合程度不是很高,與真實(shí)情況有一定差距。
奶中尿素的數(shù)據(jù)中存在一組使擬合曲線出現(xiàn)誤差較大的值,所以將濃度為5時(shí)的點(diǎn)剔除,得出奶中尿素的不同顏色讀數(shù)與其濃度的擬合趨勢(shì)圖,建立多元線性回歸模型進(jìn)行數(shù)據(jù)分析,得出關(guān)系式為:y=10862.5-103.777x1+29.68822x2+16.5644x3
其可決系數(shù)為R2=0.9102,說(shuō)明最接近與真實(shí)情況,擬合程度最好。
由以上結(jié)論得出在顏色讀數(shù)不斷增大的過(guò)程中其濃度不斷減小,兩者成反比關(guān)系。根據(jù)五組數(shù)據(jù)中得出的擬合線性關(guān)系,由可決系數(shù)得出各組數(shù)據(jù)中的優(yōu)劣如下。
組胺:綠色讀數(shù)最接近真實(shí)值,紅色讀數(shù)與藍(lán)色讀數(shù)也較為真實(shí),整體較為真實(shí)。
溴酸鉀:藍(lán)色讀數(shù)較為接近,但是紅色讀數(shù)誤差較大。整體接近真實(shí)值。
工業(yè)堿:紅色讀數(shù)較為真實(shí),藍(lán)色讀數(shù)誤差較大,整體略有偏差。
硫酸鋁鉀:三種顏色讀數(shù)都誤差較大。整體誤差很大。
奶中尿素:藍(lán)色讀數(shù)較為真實(shí),剔除其中一組數(shù)據(jù)后,其它兩組擬合度越高,其整體誤差略小。
建立多元回歸模型,得到顏色讀數(shù)和物質(zhì)濃度的數(shù)學(xué)模型,通過(guò)附件2中數(shù)據(jù)的處理研究分析,選取了3個(gè)變量:藍(lán)色顏色值x1,綠色顏色值x2,紅色顏色值x3作為自變量(i=1,2,3),濃度為因變量y,以下為處理附件2之后的數(shù)據(jù)。

表1 二氧化硫數(shù)據(jù)的處理
建立線性回歸模型可表示為:y=β0+β1*x1+β2*x2+β3*x3
利用散點(diǎn)圖繪制圖2。

圖2 顏色讀數(shù)與濃度關(guān)系散點(diǎn)圖
其中橫軸為顏色讀數(shù),縱軸為物質(zhì)濃度。
其可決系數(shù)R2=0.921198,其數(shù)值接近真實(shí)值,擬合出的較真實(shí)。
利用excel處理數(shù)據(jù)得出殘差圖。
如圖在殘差圖中的散點(diǎn)在中軸上下兩側(cè)分布,則擬合直線就是合理的,說(shuō)明預(yù)測(cè)有時(shí)多些有時(shí)少些,總體是符合趨勢(shì)的。

圖3 殘差圖

圖4 線性擬合圖
以上數(shù)據(jù)和圖表證明其符合多元線性回歸,其回歸方程為:
y=628.755+6.63834x1-5.67807x2-5.23354x3
誤差分析如表2所示。

表2 誤差分析
1.3.1 數(shù)據(jù)量對(duì)模型的影響
針對(duì)問(wèn)題中的數(shù)據(jù)量對(duì)模型的影響,做出小組數(shù)據(jù)與大數(shù)據(jù)的對(duì)比,對(duì)數(shù)據(jù)中的二氧化硫進(jìn)行分析對(duì)比如下。
根據(jù)問(wèn)題二可得出二氧化硫不同顏色讀數(shù)所對(duì)應(yīng)的濃度值,現(xiàn)將所給數(shù)據(jù)中的色調(diào)與飽和度加入數(shù)據(jù)進(jìn)行擬合得出新的線性回歸關(guān)系,其中橫軸為讀數(shù),縱軸為濃度。

圖5 二氧化硫濃度圖
得出其擬合可決系數(shù)為R2=0.948456,說(shuō)明最接近與真實(shí)情況,擬合程度最好。利用excel處理數(shù)據(jù)得出殘差圖。
如圖在殘差圖中的散點(diǎn)在中軸上下兩側(cè)分布,則擬合直線就是合理的。得出其多元線性回歸關(guān)系為:
y=2846.291+0.647167x1-19.9277x2+5.272859x3-4.89616x4-10.3539x4
大類數(shù)據(jù)中會(huì)存在一定誤差,用excel對(duì)給出的數(shù)據(jù)進(jìn)行誤差分析。
在小組數(shù)據(jù)中可決系數(shù)R2=0.921198;在大數(shù)據(jù)中可決系數(shù)R2=0.948456;從中可以直觀看出大類數(shù)據(jù)更為精確,其對(duì)模型的影響更小,在誤差分析中,小組數(shù)據(jù)中的誤差波動(dòng)范圍較廣,在[-17.5978,131.6014]之間,整體影響較大,在大類數(shù)據(jù)中誤差波動(dòng)范圍為[-14.1767,21.3614]1,在其范圍內(nèi)也更加直觀的看出大類數(shù)據(jù)更為精確,所以,數(shù)據(jù)量的多少對(duì)其模型的影響很大,數(shù)據(jù)量越多,越能直觀反應(yīng)整體情況。

圖6 殘差圖
1.3.2 顏色維度對(duì)模型的影響
由附件中二氧化硫的數(shù)據(jù)進(jìn)行分析和估算,首先利用色調(diào)和飽和度對(duì)物質(zhì)濃度的影響進(jìn)行分析,得出兩種量與濃度的線性關(guān)系,再由此衍生出三種顏色中每一種顏色分別與色調(diào)和飽和度的關(guān)系,進(jìn)一步分析兩種顏色分別與色調(diào)和飽和度的線性關(guān)系,更加直觀的得出顏色維度對(duì)模型的影響。其中y4為色調(diào)讀數(shù),y5為飽和度讀數(shù),分析結(jié)果如下。

表3 顏色維度對(duì)模型的影響
將以上數(shù)據(jù)處理,利用excel將一種顏色值和兩種顏色值進(jìn)行誤差分析,建立數(shù)學(xué)模型,再將一維模型與二維模型進(jìn)行對(duì)比。得出色調(diào)和濃度之間不成線性關(guān)系,距離真實(shí)值有很大差距,預(yù)測(cè)值和數(shù)據(jù)給予的值也存在很大誤差,所以不能推斷出色調(diào)與顏色和濃度之間模型相互的線性比例關(guān)系,而在飽和度與顏色和濃度的關(guān)系中,得到飽和度和濃度的擬合值很高,而且在各種顏色讀數(shù)中數(shù)據(jù)和飽和度也可以擬合出很精確的值,但是當(dāng)顏色超過(guò)一種進(jìn)行擬合時(shí),可決系數(shù)很小,遠(yuǎn)離真實(shí)值,因此得出結(jié)論:在顏色維度中,可以由一維模型利用線性關(guān)系得出其飽和度,再由飽和度利用其關(guān)系求得濃度,得到的數(shù)據(jù)接近真實(shí)值,將數(shù)據(jù)代入二維模型中,由于顏色讀數(shù)項(xiàng)目太多時(shí)其結(jié)果距離真實(shí)值較遠(yuǎn),所以一維模型對(duì)整體數(shù)據(jù)影響較小,二維模型對(duì)整體影響較大,誤差也越大。
在處理數(shù)據(jù)方面,利用excel詳細(xì)處理了附件當(dāng)中所給的數(shù)據(jù),用這些數(shù)據(jù)通過(guò)excel做出其擬合趨勢(shì)圖、殘差圖,這些圖能直觀反應(yīng)其關(guān)系的走勢(shì),數(shù)據(jù)所產(chǎn)生的誤差也清晰的表現(xiàn)了出來(lái)。
在求解第一、二問(wèn)的過(guò)程中,建立了線性回歸模型,該模型將整體走勢(shì)表現(xiàn)了出來(lái)。
在數(shù)據(jù)量小的情況下,利用excel處理所計(jì)算出的數(shù)據(jù)誤差比數(shù)據(jù)量大時(shí)的誤差大,不能精確化。
參考文獻(xiàn)
[1]全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽.2017年高教社杯全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽賽題[EB/OL].[2017-9-14].http://www.mcm.edu.cn.
[2]韓中庚.數(shù)學(xué)建模方法及其應(yīng)用[M].北京:高等教育出版社,2009.
[3]陳義華.數(shù)學(xué)模型[M].重慶:重慶大學(xué)出版社,1995.