李建軍


摘要 本文研究試紙上的顏色讀數(shù)與溶液濃度的關(guān)系,以五種物質(zhì)在不同濃度下的顏色讀數(shù)為基礎(chǔ)進行數(shù)據(jù)處理,確定顏色讀數(shù)和物質(zhì)濃度之間的關(guān)系,然后利用SPSS軟件進行多元線性擬合,選取剩余標準差S進行分析,評價建立模型的優(yōu)劣。文中采用主成分分析法來驗證三原色維度對模型的影響,進而選取最佳擬合模型。
【關(guān)鍵詞】比色法 主成分分析 多元線性回歸
比色法是目前常用的一種檢測物質(zhì)濃度的方法,即把待測物質(zhì)制備成溶液后滴在特定的白色試紙表面,等其充分反應后獲得一張有顏色的試紙,再把該顏色試紙與一個標準比色卡對比,來確定待測物質(zhì)的濃度檔位了。不同人對顏色的觀測誤差,使得這一方法在精度上受到很大影響,隨著照相技術(shù)和顏色分辨率的提高,更希望建立顏色讀數(shù)和物質(zhì)濃度的準確關(guān)系,本文以五種物質(zhì)在不同濃度下的顏色讀數(shù)為基礎(chǔ)進行數(shù)據(jù)處理,確定顏色讀數(shù)和物質(zhì)濃度之間的關(guān)系,選取最佳模型進行準確應用。
1 基本理論介紹
1.1 擬合度分析和多元線性回歸
數(shù)據(jù)擬合是建立模型逼近實際數(shù)據(jù)序列的過程,模型要盡可能符合實際體系,這是擬合的原則。一種現(xiàn)象常常是與多個因素相聯(lián)系的,由多個自變量的最優(yōu)組合共同來預測或估計因變量,比只用一個自變量進行預測更符合實際,這就是多元回歸,各元素與因變量之間呈線性關(guān)系時為多元線性回歸。
1.2 主成分分析
主成分分析是利用降維的思想,將多個變量轉(zhuǎn)化為少數(shù)幾個主要變量(即主成分),各主成分之間互不相關(guān),P為特征值總個數(shù),對于特征值為λi的主成分,λi的貢獻率ηi可用ηi=λi/(λ1+λ2…λp)表示。λi較小的主成分被認為包含的是噪聲,在分析時不將這些變量引入模型,達到降維的目的。
2 問題分析及模型建立
本文測得五種溶液(組胺、溴酸鉀、工業(yè)堿、硫酸鋁鉀和奶中尿素)在不同濃度下五種顏色讀數(shù)(紅R、綠G、藍B、色調(diào)H、飽和度S)與物質(zhì)濃度的數(shù)據(jù),利用Excel做散點圖如圖l。
同樣處理其他四種溶液的數(shù)據(jù)散點,觀察得出Y,與x.存在一定的近線性關(guān)系。
2.1 溶液的顏色讀數(shù)與物質(zhì)濃度之間的相關(guān)性分析
相關(guān)性分析是分析兩個或多個具備相關(guān)性的變量元素,進而衡量兩個變量因素的相關(guān)密切程度。兩個變量間線性關(guān)系的程度,可用相關(guān)系數(shù)r來描述:
x,y變化的方向一致,如身高與體重的關(guān)系,r>0為正相關(guān);|r|≥0.95顯著相關(guān);|r|≥0.8高度相關(guān);0.5≤|r|<0.8中度相關(guān);0.3 ≤|r|<0.5低度相關(guān); |r|<0.3關(guān)系極弱;反相關(guān),r<0;無線性相關(guān):r=0。
本文采用Pearson相關(guān)系數(shù),運用SPSS軟件對5種物質(zhì)在不同濃度下的顏色讀數(shù)與物質(zhì)濃度的相關(guān)性分析,可得溶液濃度與顏色讀書之間的相關(guān)系數(shù),具有顯著相關(guān)性。
2.2 顏色讀數(shù)與物質(zhì)濃度的函數(shù)模型建立
通過對這五組數(shù)據(jù)多元線性回歸中方差膨脹因子(ViF)可知此函數(shù)共線性極強,各個自變量出現(xiàn)交互作用,影響擬合準確度,所以采用主成分分析法排除共線性對模型進行優(yōu)化。
利用SPSS對五組數(shù)據(jù)進行擬合,對組胺的主成分的提取及擬合(圖2),組胺的濃度與藍色讀數(shù)的有關(guān)函數(shù):Yi=-2.775x1+191.187;溴酸鉀濃度與藍、綠色讀數(shù)的擬合方程為y2=-0.818xl-0.539x2+168.215;工業(yè)堿濃度與藍色讀數(shù)的擬合方程y3=-0.053x1+16.684;硫酸鋁鉀的濃度與藍色讀數(shù)的擬合方程:y4=0.344xl-50.431;奶中尿素的濃度與藍色、綠色讀數(shù)的擬合方程:Ys=-132.618xi+16.014x,+13606.314。利用剩余標準差S來對五個模型的優(yōu)劣進行評定。五種物質(zhì)的優(yōu)劣順序:工業(yè)堿>硫酸鋁鉀>組胺>溴酸鉀>奶中尿素。
3 模型降維分析
維度,又稱維數(shù),是數(shù)學中獨立參數(shù)的數(shù)目。本文把維度理解成可以決定色彩的因素個數(shù),維度從5組顏色讀數(shù)降到4維再降到3維研究擬合特征。由主成分分析可知,不同物質(zhì)中,三原色R、G、B都起著重要影響,色調(diào)與飽和度相對較弱。
建立成分矩陣可以得到R紅色顏色值占的主要成分最多且R=0.977,接下來將R紅色顏色值的數(shù)據(jù)去掉,用剩下的四維數(shù)據(jù)再次進行主成分分析得到G綠色顏色值所占比重是最大的,且R=0.976;然后同以上步驟將G綠色顏色值去掉,可以看出B藍色顏色值所在比重是最大的,且R=0.869,采用降維的方法來判斷降維前后的顯著性。降維的順序是:五維、四維(去掉了色調(diào)H)、三維(去掉飽和度S)。
4 分析結(jié)果與模型評價
隨著將每組的主要成分分別提出后,所得到的R復相關(guān)系數(shù)的大小也是隨著提取由大變小的。由此得出R、G、B對模型都是有一定的影響。從表中的Sig值可看出去掉色調(diào)時有顯著變化,去掉飽和度時沒有顯著變化,由此得出色調(diào)是影響模型的主要因素。
三原色與色調(diào)和飽和度具有相關(guān)性,采用主成分分析法利用spss來驗證三原色維度對模型的影響,觀察顏色讀數(shù)維度從5逐步減小后spss做的回歸分析,通過對R復相關(guān)系數(shù)的研究看出隨著R、G、B的被提取,復相關(guān)系數(shù)的值也是越來越小,這說明顏色維度從5到4再到3,擬合模型最佳。
本文所建立模型的主要優(yōu)點是:簡單快捷、可以直接利用顏色讀數(shù)來測定物質(zhì)的濃度不足之處是:實驗數(shù)據(jù)較少,模型存在一定的誤差。
參考文獻
[1]駱方,劉紅云,黃昆編著,數(shù)據(jù)統(tǒng)計與分析[M].高等教育出版社,2015 (07):12-15.
[2]王凱,對色彩教學中色彩冷暖和色彩三要素之間關(guān)系的思考[J].文藝生活,2014 (04).
[3]馮國生,劉榮,呂振通,統(tǒng)計分析與應用(第2版)[M].機械工業(yè)出版社,2014 (02):26-30.