999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于K近鄰算法的外采成品油溯源方法

2020-03-12 05:49:02
石油庫與加油站 2020年6期
關鍵詞:模型

鄭 斌

〔中國石化銷售股份有限公司 北京 100728〕

外采油品作為中國石化銷售企業重要的資源補充,對于穩定市場供應具有重要的作用。然而外采油品來源復雜,非法調和油品常常混雜其中,社會上由此導致的質量事故頻發,給企業帶來巨大風險。中國石化強化外采油品源頭管理,建立了供應商和可采生產企業目錄,并設立了“三不采”原則,即無法確定油品生產企業的不采;油源向上追溯三級,生產企業不在規定目錄范圍內的不采;供應商未提供合格質量檢測報告的不采。然而在利益的驅動之下,部分供應商為了將調和油品或源頭不明的油品賣入石化銷售企業,偽造油品真實來源。因此,識別和追溯外采油品的來源,對于成品油銷售企業采購和質量管理具有十分重要的現實意義。

目前,質量管理人員核實外采油品來源的方法,一是查驗供應商提供的生產商報告單,二是比對入庫質檢數據與出廠報告單數據的一致性。其中,查驗生產商報告單受人員主觀影響較大,而且隨著造假手段不斷發展,報告單樣式的差異越來越細微,人工識別的難度越來越大。比對質檢報告數據一致性對人員能力要求很高,成品油質量指標眾多,而且可采生產企業多達上百家,即使出現檢測數據比對不一致的情況,管理人員也很難追溯油品的真實來源。

K近鄰算法(K Nearest Neighbors,KNN)是一種比較成熟的分類算法,也是最簡單的機器學習算法之一[1]。由于該法操作簡單,目前已經廣泛且有效地應用于各種領域的識別、溯源和預測等問題上[2-6]。例如文獻[2]將其與氣相色譜-質譜分析法相結合應用于動物油鑒別區分,文獻[3]將其應用于犯罪工具圖片快速溯源,文獻[4]將其應用于網絡輿情中的新話題熱度預測,文獻[5]將其應用于城市道路短時交通預測。為了解決外采油人工溯源難的問題,本文以K近鄰算法為基礎,探索性提出了一種外采油品溯源方法,建立了外采油生產商匹配模型。應用結果證明,該方法具有良好的可行性,能夠有效輔助管理人員識別和追溯外采油的來源。

1 K近鄰算法簡介

K近鄰算法是基于統計的分類方法,是數據挖掘分類算法中比較常用的一種方法。所謂K最近鄰,就是K個最近的鄰居的意思,即每個樣本都可用它最接近的K個鄰居來代表。其核心思想是[1]:如果一個樣本在特征空間中的K個最相鄰的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。K近鄰算法中,所選擇的鄰居都是已經正確分類的對象。該方法在確定分類決策上只依據最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。K近鄰算法是一種基于實例的學習方法[5],不需要對機器進行已知樣本的訓練,具有很好的魯棒性,簡單易用,分類準確率較高,對

大規模數據非常有效[6]。K近鄰算法見圖1。

圖1 K近鄰算法示意圖

K近鄰算法流程如下:第一步:構建一個已分好類的數據集;第二步:計算新近樣本與數據集中所有數據的距離;第三步:按照距離大小進行遞增排序;第四步:選取距離最小的K個樣本;第五步:確定前K個樣本所在類別出現的頻率,并輸出出現頻率最高的類別。

2 基于K近鄰的生產商匹配模型

2.1 生產商匹配模型思路

生產工藝穩定的煉油企業生產的油品質量是相對穩定的,出自同一生產企業的油品具有相似的質量特征。中國石化銷售企業LIMS數據庫中積累了海量的外采油樣本,基本涵蓋了國內所有的煉油生產企業,每一個外采油樣本都具有明確的類別信息(供應商和生產商信息)。基于K近鄰算法實現油品溯源的基本思路是:如能從歷史數據中找到與待溯源樣本質量特征相似的油品,據相近相似原理,則可根據相似樣本的來源推斷該油品來源。據此構建生產商匹配模型:利用K近鄰算法,在歷史數據庫中找出與該樣本最相似的K個樣本,將該樣本與K個最近鄰樣本的生產商信息進行匹配識別,據匹配結果判斷油品來源是否準確。當與其中一個或多個樣本匹配成功時,判斷該樣本所述生產商為真;否則,判斷該樣本所述生產商為假,該樣本來源存疑。

2.2 生產商匹配模型的實現

(1)確定比對數據集。由于K近鄰算法需要計算待溯源樣本與比對數據集中每一個樣本的距離,當比對數據集較大時,特別是特征數量比較大時,計算量相當大,時間復雜度高。為了提高溯源的準確性和模型運算效率,本研究中選擇待溯源樣本之前6個月的所有外采油歷史樣本作為比對數據集。

(2)確定特征向量。本研究中,結合業務意義與指標重要性,選擇汽油的常規理化指標中研究法辛烷值、硫含量、烯烴含量、芳烴含量、氧含量、苯含量、餾程和密度作為計算樣本間距離的特征向量。

(3)樣本預處理。在某些情況下用于計算樣本距離的指標可能為空缺值,對于指標為空的情況,在計算距離前需要對空缺值進行填充。本研究采用平均值填充法,即采用與該樣本同類型、同牌號的樣本中指標的平均值進行填充。

(4)相似度計算。歐式距離是一種常用的衡量m維空間中兩點距離的度量。本研究采用歐氏距離計算待溯源樣本與比對數據集中樣本的相似度,計算公式如公式(1)所示。

(1)

式中:xk為樣本x在k維向量上的坐標;yk為樣本y在k維向量上的坐標;n為空間維數(特征向量數);d(x,y)為樣本x與樣本y的歐式距離。

(5)結果匹配與判斷。根據計算結果,按照距離大小對樣本進行遞增排序。模型構建中選取K值為5,即選取距離最近的5個樣本,判斷待溯源樣本與這5個最近鄰樣本的生產商是否一致,當與5個樣本中一個或多個樣本一致時,定義為匹配成功;當與5個樣本都不一致時,定義為匹配不成功,判定該樣本油源存疑,并給出預警。

3 模型應用效果

供應商根據性質不同可以分為生產型供應商和貿易型供應商。生產型供應商本身既是供應商又是生產商,其油品來源一般是清晰準確的;貿易型供應商其油品來源復雜,其提供的油源(生產商)信息往往存在疑問,是溯源管理的重點。

為驗證該方法的可行性,選取了2018年12月1日至12月10日某公司入庫的160個外采油樣本(其中,80個生產型供應商樣本和80個貿易型供應商樣本)作為驗證樣本,驗證模型的識別、預警和溯源效果。生產型供應商樣本和貿易型供應商樣本典型的模型匹配結果如表1和表2所示。對模型匹配結果進行統計分析,結果如表3所示。對模型輸出的5個最近鄰樣本的匹配結果進行統計,結果如表4所示。

表1 生產型供應商樣本的典型匹配結果

表2 貿易型供應商樣本的典型匹配結果

表3 驗證樣本模型匹配結果統計

表4 5個最近鄰中匹配成功的樣本個數

由表3和表4可以看出,生產型供應商樣本的模型匹配成功率很高,達到95%,即95%的樣本通過模型匹配準確找到其生產商來源。在生產型供應商樣本中,模型輸出的5個最近鄰樣本與待溯源樣本全部匹配成功的有51個,占總樣本數的63%,顯示模型匹配的精度很高。貿易型供應商樣本的模型匹配成功率較低,預警率達到34%,即34%的樣本通過模型匹配進行了預警,提示油源存疑。其中,Z石油串換樣本的匹配成功率相對較高,達到81%,社會供應商樣本的匹配成功率較低,63%的樣本來源存疑進行了預警。由表4可見,Z石油串換樣本的匹配精度高于社會供應商樣本的匹配精度,社會供應商樣本的匹配精度明顯較低,絕大多數樣本只能與5個最近鄰中的1~2個樣本匹配成功。這與實際情況是一致的,反映了社會供應商提供的油源信息的可靠性較低。

對于未匹配成功的樣本,除了預警之外,根據模型匹配結果還可以提示油品可能的真正來源。如表2中:樣本(2125874)的模型匹配結果顯示5個最近鄰樣本中有3個樣本為同一個生產商(F石化分公司),指示樣本的油源有可能來自該生產商。經核實,該樣本的油品真實來源為F石化分公司,是操作人員在LIMS系統錄入生產商信息時出現了差錯;樣本(2123293)的5個最近鄰樣本中有3個樣本為同一生產商(L股份公司),指示該批油品可能來源于此生產商;樣本(2121049)的5個最近鄰樣本中,與第一個樣本的相似度顯著高于其余4個樣本,指示這兩批次油品可能來自同一來源,這為管理人員進一步溯源指示了方向。

對給出預警的貿易型供應商樣本所述的生產商信息進行核實,結果如表5所示,發現其中有10個樣本的生產商信息存在人為錄入差錯(即在LIMS系統錄入信息時生產商選擇錯誤),17個樣本存在供應商偽造報告、供應商油品混存、來源不清等情況。樣本信息失真嚴重影響油品溯源的準確性,因此,提高LIMS系統樣本信息錄入的準確性,將有助于提升模型匹配準確性和溯源結果可靠性。

表5 預警樣本油源核實情況

4 結束語

提出了一種基于K緊鄰算法的外采成品油溯源方法,建立了外采油生產商匹配模型。通過計算待溯源樣本與LIMS系統歷史樣本的相似度,給出5個目標生產商。通過與目標生產商的匹配識別,實現外采油生產商識別、預警和溯源。將該方法已應用于中國石化銷售企業外采油的溯源管理。實踐證明,該方法可行有效,模型的適用性較好,能夠為管理人員追溯油品來源提供可靠依據,大大提高溯源的成功率和效率。K近鄰算法中,模型溯源結果的準確性依賴于樣本信息的準確性,提高樣本錄入信息的準確性將有助于進一步提高模型的溯源準確性。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产成人无码久久久久毛片| 激情无码视频在线看| 久久综合婷婷| 国产精品yjizz视频网一二区| 欧美午夜视频在线| 中文字幕天无码久久精品视频免费 | 精品国产aⅴ一区二区三区| 国产精品一区二区无码免费看片| 亚洲日韩日本中文在线| 在线网站18禁| 日本精品中文字幕在线不卡| 国产一区二区人大臿蕉香蕉| 国产精品男人的天堂| 五月天天天色| 色偷偷一区二区三区| 怡红院美国分院一区二区| 欧美一级高清视频在线播放| 亚洲精品麻豆| 亚洲天天更新| 欧美中文字幕在线二区| 毛片在线看网站| 国产视频资源在线观看| 黄片一区二区三区| 无码啪啪精品天堂浪潮av| 国产黄色爱视频| 久久久成年黄色视频| 免费国产高清视频| 青青草91视频| 日韩欧美国产精品| 尤物特级无码毛片免费| 91福利国产成人精品导航| 欧美成人影院亚洲综合图| aⅴ免费在线观看| 国产精品免费入口视频| 亚洲乱强伦| 国产日韩欧美黄色片免费观看| 亚洲天堂网在线观看视频| 99在线免费播放| 中文纯内无码H| 亚洲天堂日韩av电影| 久热中文字幕在线| 亚洲精品国产日韩无码AV永久免费网| 免费一级毛片在线播放傲雪网| 在线观看国产精品第一区免费| 国产精品亚洲一区二区三区z| 伊人福利视频| 国产精品亚洲日韩AⅤ在线观看| 久久精品一品道久久精品| www.狠狠| 亚洲第一成年人网站| 亚洲精品在线91| 日韩毛片免费视频| 欧美成人区| 97精品久久久大香线焦| 日韩精品免费一线在线观看| 操国产美女| 欧美特黄一级大黄录像| 久久这里只精品国产99热8| A级毛片高清免费视频就| 国内老司机精品视频在线播出| 国产91线观看| 性喷潮久久久久久久久| 免费a级毛片18以上观看精品| 91 九色视频丝袜| 国产91精品久久| 中文字幕一区二区人妻电影| 国产乱人激情H在线观看| 亚洲人成色在线观看| 香蕉蕉亚亚洲aav综合| 99re经典视频在线| 亚洲av无码牛牛影视在线二区| 欧美成在线视频| 午夜少妇精品视频小电影| 香蕉久久国产精品免| 五月综合色婷婷| 乱人伦中文视频在线观看免费| 无码人妻免费| 国内精品久久久久鸭| 亚洲欧美日韩中文字幕在线一区| 最新亚洲人成网站在线观看| 欧美一级色视频| 亚洲成人动漫在线观看 |