楊倩玉+陳紅倩+馬慧鋆
摘 要:針對全國農殘檢測數據不同地區間、多種MRL標準下判定結論間的數據對比分析需求,提出一種地理位置相關的多重放射環可視化方法。該方法首先基于GIS方法指代各部分檢測數據所在地區,借鑒氣泡圖形式通過圖元大小映射各地區檢測樣品采樣量,以及借鑒餅圖形式通過扇區比例映射樣品中檢出不同毒性農藥的比例關系,并提出并行環方法,映射各地區的檢測數據在不同MRL標準下的超標結論對比情況。實驗結果與領域專家的評價表明,該方法能有效提高全國農殘檢測數據的分析效率,可實現不同地理位置、不同檢出結果判定類別間的對比分析。
關鍵詞:MRL標準;農殘檢測數據;多重放射環;R語言
DOIDOI:10.11907/rjdk.173112
中圖分類號:TP391
文獻標識碼:A 文章編號:1672-7800(2018)002-0172-03
0 引言
食品安全問題關系到國計民生,國家多部門都會對食品中的農藥殘留進行檢測及防范。為規范食品安全檢測,中國、美國、日本、歐盟、中國香港、國際食品法典委員會(CAC,Codex Alimentarius Commission)均存在相應的MRL標準。
農殘檢測數據具有層次、空間屬性特征,具有采樣點、農產品、農藥、檢測數據4大屬性。采樣點基于地圖上的行政區域劃分,農產品種類、農藥種類均具有層次結構。在進行全國農殘檢測數據分析過程中,首先需要分析在數據集中的哪些地區,農產品是需要重點關注或亟需采取措施的。同時,在數據分析過程中,農藥殘留量超標的判斷結論是相對的,需同時參照多種MRL標準,在不同標準下的同步對比分析是提高分析效率的有效手段。因此,針對數據中不同地區間、多種MRL標準下判定結論間的對比分析是需要解決的首要問題。
在層次型數據可視化技術方面,主要技術為節點-鏈接(Node-Link)法和空間填充(Space-Filling)法兩大類。Xiaotong Liu等[1]在2016年設計了BrandWheel,對社會媒體品牌的公眾認知進行可視化分析;PhenoStacks[2]利用徑向層次結構的sunburst總結表型全局層次結構,輔助進行醫學領域的表型比較可視化;ViDX[3] 使用同心圓結合條形圖,可快速顯示智能工廠產品裝配過程所需的時間;Lohmann S[4]在2015年提出一種分層詞云布局的可視化方法,利用各層扇區的交集進行文本交集的詞云展示;Keim[5]提出一種PixelMap算法,通過小范圍移動點改善重疊現象。
在農殘檢測數據中,地理位置、區域分布等空間屬性是非常重要的方面。在地理信息與其他屬性同步展現的方法中,Ward[6]提出CityScape方法將地圖區域劃分為塊,并采用3D柱狀圖表示區域塊的統計數據;Li J和Xiao Z[7]結合地圖與外射圓環表征煙霧分布和隨時間變化情況;Isaac Cho[8]結合地圖與節點鏈接式的放射環分析不同時間、地點下的羅馬歷史事件;Lu Y和Steptoe M[9]利用采樣地圖疊加餅圖的方式展現層次、時序屬性;Nivan Ferreira[10]使用地圖疊加矩陣像素塊,以顏色深淺反映各地區航空公司延遲航班的速度情況。
本文針對農藥殘留檢測數據多地區、多MRL標準下的對比分析需求,提出一種能同時表征基于多種MRL標準的判定結果且結合地理位置的可視化方法。該方法首先將每一城市或地區的數據聚合為一個多重放射環,以一種直觀的方式表達多種MRL標準下的農殘檢測數據統計結果,并結合地圖隱喻直觀地呈現地區間的采樣量、含量超標的對比情況。
1 基于多重放射環的多標準對比可視化
1.1 多重放射環設計
由于各國家/地區的MRL標準有所差異,不同的判定標準會造成某種農產品中某種農藥的檢出值是否超標的結果不同,從而造成同一批檢測數據,在不同MRL標準下超標和未超標樣品數不同。
本文針對指定城市或區域的農殘檢測結果數據,設計了一種名為“多重放射環”的可視化方法,其設計思想源自于Sunburst,方法的示意圖如圖1所示,具體設計思想為:
(1) 根節點設計為餅圖,分別表示無農藥檢出、中低毒農藥檢出、高劇毒農藥檢出3種情況的比例。
(2) 外射的同心外環分為兩部分:在中低度農藥檢出部分采用堆疊圖的形式表示未超標/超標數據的占比,在高劇毒農藥檢出部分采用徑向映射表示高劇毒農藥的檢出情況。
1.2 內層放射環計算
多重放射環的內層放射環具體計算方法為:
(1)內徑映射與計算。第一重環(A、B、C區)中餅圖半徑稱為多重放射環的內徑,映射為所指定城市或區域的“農產品樣品采樣量”。內徑映射公式如公式(1)所示:
其中,[min,max]為內徑的自定義區間,區間大小根據實際效果而定。Num為各地區樣品數,Num.max為樣品數最大值,Num.min為樣品數最小值。根據公式(1)將各農產品樣品數映射為多重放射環內徑radius.in。
(2)角度占比與著色。根據農產品中的檢出農藥情況,將數據集分為中低毒農藥檢出、高劇毒農藥檢出、無農藥檢出3類,根據3類檢出情況的農產品占比映射為圖2中A、B、C區扇區所占的圓心角角度比。針對中低毒農藥檢出、高劇毒農藥檢出、無檢出3類情況,依次著色為藍色、紅色、綠色。
1.3 外層放射環計算
多重放射環的外層放射環的環寬計算方法為: ①無農藥檢出扇區,對應環寬為0;②中低毒農藥檢出扇區(圖2中B1區),環寬映射為農產品樣例中農藥檢出量的最高值或均值,本文實例選擇農藥檢出量的均值。
多重放射環B1區的外徑計算方法如公式(2)所示:
1.4 多標準并行環計算endprint
為對比多種MRL檢測標準下超標/未超標判定結果的對比情況,將中低毒農藥檢出扇區(即圖2中B1區)的外徑由內到外劃分為6層,分別表示中國、歐盟、日本、香港、美國、CAC的MRL標準下的判定結果。在同一并行環中,超標部分使用深色著色,未超標部分使用淺色著色。
判定結果中未超標/超標占比將對應圓環逆時針分割,每個分割區間圓心角為各類檢出量與總檢出量的比值乘以中低毒檢出扇區圓心角。
2 實驗結果與分析
2.1 案例數據集可視分析
基于R語言實現了本文提出的多重放射環可視化方法。圖2為多重放射環應用到農藥殘留檢測數據的可視化效果圖的一個樣例,從該圖中得出的分析結論有:
(1)從中心的餅圖可以看出,綠色扇形區代表的未檢出量及紅色扇形區代表的高劇毒檢出量占比較小,而藍色扇形區代表的中低毒檢出量占比較大,可見中低毒檢出量相對較多。
(2)從高劇毒農藥總檢出頻次映射區間看,其檢出頻次在所有城市或地區的農產品采樣中基本處于中等。
(3)從同心圓環對比多國/地區MRL標準下的檢出超標情況看,中國、香港、美國、CAC標準下超標量較少,但歐盟、日本標準下的超標量相對較多,因此該批次農產品仍需引起注意。
針對多地區的農殘檢測情況的對比,本文基于leaflet地圖庫實現了多重放射環與地圖結合的全國農殘檢測數據概覽效果圖,如圖3所示為其中一個數據集的可視化效果。
該圖共展示了26個省會城市以及4個直轄市的主要檢測信息,通過對比圖3中表征各城市的多重放射環,可得到以下結論:
(1)根據不同城市/地區中的多重放射環大小,可對比其農產品樣品采樣數量。如本例中北京、石家莊、廣州的采樣量相對較多,有些地區的采樣量相對較少,可以考慮加大其采樣量。
(2)根據多重放射環的內層環各扇區占比,可對比各城市不同農藥檢出情況的農產品樣品占比情況。如本例中烏魯木齊、南寧、長沙等城市無農藥化學物檢出的樣品比例較高,說明其農殘檢測的結果總體較好。
(3)根據高劇毒農藥檢出扇區的外層環環寬值,可對比各城市的農產品樣品中的高劇毒農藥檢出情況。如本例中武漢、南寧等城市的高劇毒農藥平均檢出量較少。
(4)根據中低毒農藥檢出扇區的外層環環寬,可對比各城市的中低毒農藥平均檢出量。如在本例中石家莊、北京、廣州等城市的農產品采樣量較多,但中低毒農藥的平均檢出量較小。
(5)根據中低毒農藥對應區域的外層環各標準下超標/未超標情況占比,可對比各城市農產品樣品中的超標/未超標情況。如本例中大部分城市含中低毒農產品化學物的樣品超標比例都較低,但在日本MRL標準下各城市樣品的超標比例明顯高于其他標準。這是由于日本MRL標準的限量值較低,標準要求更為嚴格。
2.2 本文方法性能分析
本文設計的對比可視化方法,從多重放射環的可視編碼和布局設計上,同現有的類Sunburst層次可視化布局方法相比,本文方法采用創新的可視化元素編碼,并可以較好地實現數據集的多屬性和多標準對比,展現的信息量增多,且空間利用率高。
3 結語
本文針對農殘檢測數據多地區間、多MRL標準下的對比分析,提出了一種多重放射環的可視化方法,并與地圖相結合,實現了農殘檢測數據的對比分析可視化以及多MRL標準下的判定結果比較。該方法有利于專家快速瀏覽數據集,分析區域間數據的差異性,并根據各項數據指標針對指定區域進行深入分析。實驗結果表明,本方法能幫助食品安全領域專家對指定城市/地區的農殘檢測結果數據作一個快速了解,根據可視結果重點關注超標嚴重或高劇毒農藥占比較大的地區,以便對農產品中農藥殘留檢測情況作進一步分析。下一步工作將設計農產品及農藥的分類統計可視化方法,利用交互手段進行協同展示,通過多視圖實現多角度的綜合評價。
參考文獻:
[1] LIU X, XU A, GOU L, et al. SocialBrands: visual analysis of public perceptions of brands on social media[C].IEEE Conference on Visual Analytics Science and Technology. IEEE Computer Society, 2016:71-80.
[2] GLUECK M, GVOZDIK A, CHEVALIER F, et al. PhenoStacks: cross-sectional cohort phenotype comparison visualizations[J]. IEEE Transactions on Visualization & Computer Graphics, 2016,23(1):191.
[3] XU P, MEI H, LIU R, et al. ViDX: visual diagnostics of assembly line performance in smart factories[J].IEEE Transactions on Visualization & Computer Graphics, 2016,23(1):291-300.
[4] LOHMANN S, HEIMERL F, BOPP F, et al. Concentri cloud: word cloud visualization for multiple text documents[C].International Conference on Information Visualisation. IEEE, 2015:114-120.
[5] KEIM D, PANSE C, SIPS M, et al. Visual data mining in large geospatial point sets[J]. Computer Graphics and Applica-tions, IEEE, 2004,24(5):36-44.
[6] WARD M O, GRINSTEIN G, KEIM D. Interactive data visuali-zation: foundations, techniques, and applications[M]. CRC Press, 2010.
[7] LI J, XIAO Z, ZHAO H Q, et al. Visual analytics of smogs in China[J]. Journal of Visualization, 2016(3):1-14.
[8] CHO I, DOU W, WANG D X, et al. VAiRoma: a Visual Analytics system for making sense of places, times, and events in roman history[J]. IEEE Transactions on Visualization & Computer Graphics, 2016,22(1):210-219.
[9] LU Y, STEPTOE M, BURKE S, et al. Exploring evolving media discourse through event cueing[J].IEEE Transactions on Visualization & Computer Graphics, 2015,22(1):220-229.
[10] WANG Z, FERREIRA N, WEI Y, et al. Gaussian cubes: real-time modeling for visual exploration of large multidimensional datasets[J]. IEEE Transactions on Visualization & Computer Graphics, 2016,23(1):681-690.endprint