郝國棟 曹瑞華 李高升 李新悅



摘要:步入新時代以來,國民的收入水平不斷提升,生活水平及生活質量得到極大改善,尤其是臨近2020年我國即將全面建成小康社會的目標的實現,食品安全日益成為人們關注熱點,市場上存在著各式各樣的飯店,政府無法及時的將飯店食品安全檢查結果傳遞給廣大消費者,從而出現餐飲行業衛生安全問題層出不窮,使得人們對餐飲食品安全產生懷疑。食品安全關系到國民切身利益,關系到經濟健康發展和社會穩定。而食安之健康服務平臺的創立旨在銜接廣大消費者與地區相關政府部門,將商戶衛生安全情況及時反饋消費者,為消費者提供衛生健康優質的商戶選擇,并監督商戶配合管理部門及時整改,推動該地區整體餐飲行業環境向衛生安全健康方向發展。
本文基于該平臺前端數據反饋,采用層次分析法對主要影響商戶評判的各個因素進行分析,對各商戶進行綜合評估打分。并對商戶所得分值采用快速聚類法進行層次等級劃分,目的為方便客戶對商戶的判別。
關鍵詞:AHP;快速聚類;商戶評判;SPSS
一.問題分析
收集可以反映餐館整體情況的相關信息,包括營業執照、衛生許可證、食品從業人員健康檢查、培訓資料證明,和質量技術監督部門要求提供的其他資料等各種正規的證件信息,政府相關部門對商戶檢查情況和消費者本身對商家的反映情況數據。本文采用層次分析法建立評價模型,最大化反映商戶實際整體情況,基于商家實際數據通過數學模型計算出來的分值,對計算出來的分值數據進行快速聚類分析算法,對數據進行劃分等級,從而更清晰的將情況反映給客戶及商家。
二.符號說明
三.模型的建立與求解
1.步驟一模型的建立與求解
1.1 AHP模型說明
層次分析法(AHP)作為一種綜合評價方法,以其所具有的定性和定量相結合的優點在目前的安全領域研究中取得廣泛應用。層次分析法的優點是能將復雜的問題進行分解,為最佳方案的選擇提供科學依據,為決策層作出正確的決策提供理論參考。在進行社會的、經濟的以及科學管理領域問題的系統分析中,面臨的常常是一個由相互關聯、相互制約的眾多因素構成的復雜缺少定量數據的系統。層次分析法為這部分問題的決策和排序提供了實用的建模方法。
1.2 問題分析與求解
通過平臺收集數據及線下調查獲取商家相關安全信息和客戶反映信息,包括營業執照、衛生許可證、食品從業人員健康檢查和培訓資料證明以及質量技術監督部門要求提供的其他資料等各種正規的證件信息。綜合上面考核信息主要分為六大類影響因素,采用層次分析法建立模型,綜合評價商家整體情況。
在這個模型下,將問題分解為多個元素的組成,這些元素又按其屬性及關系形成若干層次。上一層次的元素作為準則對下一層次有關元素起支配作用。
(1)最高層:這一層次為目標層,反映最終評價分值。
(2)中間層:這一層次中為實現目標所涉及的中間環節,包含所需考慮的準則:營業證件完善度、從業人員健康證、食品安全檢查評審、客戶評價、環境污染相關證件、消防安全相關評審。
(3)最底層:這一層次為可供選擇的各商戶。
采用調查問卷形式,對以上五種因素進行數據統計,對每一因素打分分值求均值,確定準則層判斷矩陣B;bij表示的意義為與指標j相比,i的重要程度。
中間層判斷矩陣A,通過平臺反饋數據及實際調查對商戶單項因素打分進行兩兩比較。
計算一致性指標CI
CI=(λmax-n)/(n-1)
查找相應的平均隨機一致性指標RI。
計算一致性比例CR
CR=CI/RI
當CR<0.10 時,認為判斷矩陣的一致性可以接受
最終由算術平均法和特征值法兩組權重求平均數得出最后評分準則權重:營業證件完善度:0.2413、從業人員健康證情況:0.2002、食品安全檢查評審:0.1442、客戶評價:0.1123、環境污染相關證件:0.0667、消防安全相關評審:0.1283
2.步驟二模型的建立與求解
2.1 模型說明
聚類分析方法能夠對各種事物的性質進行直接的比較。在數據分析中,這是一種重要的數據分析技術,并有著廣泛的應用。在大樣本聚類分析中,傳統的聚類分析能夠實現對數據進行分類的需求。本文應用的k-mean聚類方法可以對測量數據快速分類。這種方法中,數據被視為k維空間中的點,通過距離實現對個體之間親疏程度的判別。
2.2 問題分析與求解
本文以調查的廊坊市多家商戶具體情況為例,采用步驟一模型進行計算,計算后的數據采用SPSS軟件進行聚類分析求解。指定聚類成3類,SPSS確定3個類的初始類中心點。SPSS根據樣本數據的實際情況,選擇3個由代表性的樣本數據作為初始類中心。需要指定3組樣本數據作為初始類中心點。計算所有樣本數據點到3個類中心點的歐氏距離,SPSS按照距3個類中心點距離最短的原則,把所有樣本分派到各中心點所在的類中,形成一個新的類,完成一次迭代過程。其中計算公式為:
式中,k表示每個樣本中有個變量:示第一個樣本在第i個變量上的取值:yi表示第二個樣本在第i個變量上的取值。SPSS重新確定k個類的中心點。SPSS計算每個類中各個變量的變量值均值,并以均值點作為新的類中心點。重復以上計算過程,直到達到指定的迭代次數或終止達代的判斷要求停止。
將數據錄入SPSS中,檢查數據是否有錄入錯誤,是否有不合理的數據,最后做一個描述性統計,進而查看那些數據是不合理的。對SPSS進行相關參數的設置,對數據進行分析:
通過表格可以得出分值聚集在0.69分為一類共有36戶商家,3.58分為一類共有59戶商家,1.95分為一類共有192戶商家。
通過以上數據反映出以廊坊部分商戶餐館評分數據總體上的情況,聚類分析用戶被分為三類,基于以上研究可以進一步為客戶判別提供直觀視覺,在實際應用中,為用戶更直觀的反映餐館商戶具體情況。
四.模型結論及改進
通過平臺前端數據反饋,應用層次分析法實時基于商戶的各判別因素進行計算,對各商戶進行綜合評估打分。同時對商戶所得分值實時采用快速聚類法進行層次等級劃分,在初步實踐應用中顯示出較良好的判別能力。
但在采用快速聚類分析同時,模型本身對 K 值敏感。K 的選擇會較大程度上影響分類效果。在聚類之前,本文方案預先設定 K 的大小為3,但是實際上很難確定分成幾類是最優的,是當數據量很大時,預先無法判斷。在模型計算中,對離群點和噪聲點比較敏感。K-means 是隨機選擇 K 個點作為初始的聚類中心。我們可以對這個隨機性進行一點約束,使迭代速度更快。只能聚凸的數據集。所謂的凸數據集,是指集合內的每一對點,連接兩個點的直線段上的每個點也在該集合內。若采用 Bregman 距離,則可顯著加強此類算法對更多類型簇結構的適用性。
針對K值的選擇,主要是k的值須預先設定,并在整個算法執行過程中無更改。此時,可以應用 ISODATA 算法。雖有很多啟發式用于自動確定 k 的值,但是實際應用中,仍然基于不同的 K 值,多次運行取平均值。從而提升等級劃分算法的可靠性。
參考文獻:
[1]范宓.層次分析法在安全評價中的應用[J].陜西煤炭,2011,30(6):76-77. DOI:10.3969/j.issn.1671-749X.2011.06.036.
[2]司守奎, 孫兆亮. 數學建模算法與應用[M]. 第2版. 北京: 國防工業出版社, 2016.
[3]匡宸毅. 聚類分析及其spss實現[C]. 管理科學和工業工程協會.探索科學2016年6月學術研討.管理科學和工業工程協會:管理科學和工業工程協會,2016:102.
[4]周志華.《機器學習》[J].航空港,2018,000(002):P.94-94.