冀曉東 孫高嶺 涂新雨 鄭懷城 許應成



摘 要:為防范兒童用品化學危害可能造成的嚴重后果,有效支持兒童用品源頭治理和過程控制,保障兒童用品安全,本文提出了兒童用品化學安全知識圖譜構建框架,根據兒童用品化學危害召回數(shù)據,兒童用品化學安全標準文本數(shù)據特征和結構化程度,結合UIE模型和基于規(guī)則的方法對兒童用品召回數(shù)據和安全標準進行知識抽取,通過知識融合構建知識圖譜。基于構建的知識圖譜清晰分析了兒童用品的安全隱患、化學危害的識別和控制、質量安全監(jiān)管決策支持。兒童用品化學安全知識圖譜可以為兒童用品的生產制造和質量監(jiān)管提供支持,降低兒童接觸有害化學物質的風險,保障兒童健康安全。
關鍵詞:化學安全,兒童用品,知識圖譜,決策支持
DOI編碼:10.3969/j.issn.1674-5698.2024.06.005
兒童是國家的未來、民族的希望,兒童用品的質量安全關系到兒童的身心健康和社會安定和諧。根據2021年第七次全國人口普查結果,我國14歲以下人口為2.53億人,占全國總人口的17.95%。中國兒童產業(yè)中心公布調查數(shù)據顯示,我國8 0%的家庭中兒童支出占家庭支出的30%~50%,家庭兒童年平均消費為1.7萬~2.55萬元。2018年10月30日,市場監(jiān)管總局、教育部、工業(yè)和信息化部發(fā)布了《關于進一步加強兒童用品質量安全監(jiān)管工作的通知》,強調要加強對兒童用品化學品和有關原輔料的質量監(jiān)督檢查,并將兒童用品納入各地重點監(jiān)管目錄,加大對兒童用品的監(jiān)管力度。國務院發(fā)布《中國兒童發(fā)展綱要(2021-2030)》中提出要持續(xù)開展兒童用品質量安全守護行動,加強對產品造成兒童傷害的信息監(jiān)測、分析、監(jiān)督檢查和缺陷產品召回工作,杜絕“毒跑道”“毒校服”等事件。確保兒童用品質量安全可靠,讓消費者放心消費,才能不斷釋放兒童消費市場潛力,促進和擴大消費,也是全面落實質量強國戰(zhàn)略的迫切要求。
我國不僅是兒童用品的消費大國,也是其出口大國,兒童用品種類繁多。但兒童用品生產企業(yè)門檻相對較低,對標準中的各指標了解不深入,缺乏必要的質量管理措施和檢驗手段,產品質量難以保證[1]。根據近年來國內和歐美市場兒童用品召回信息統(tǒng)計,化學危害是導致兒童用品召回的主要原因之一[2 ,3]。兒童用品化學危害是指兒童用品含有的有害化學物質可能對兒童健康產生的危害,主要通過吸入、皮膚接觸攝入或非飲食經口攝入等方式進入人體,造成過敏、特定器官損害、生殖毒性、致癌性等其他傷害[4]。相較于機械危害等,化學危害表現(xiàn)出更加隱蔽且長期的傷害特性,且影響因素復雜多樣,包括暴露時間、化學物質的性質及其濃度等,傷害原因追溯較為復雜和困難。因此,源頭控制對于有效預防化學物質的危害,保障兒童用品的安全尤為關鍵。由于兒童用品種類繁多,可能包含的有害化學物質范圍廣泛,且不同有害化學物質限量要求往往來源于不同的標準文件,需要借助知識關聯(lián)方法將分散的信息關聯(lián)起來,以有效進行風險控制。
知識圖譜是一種結構化的語義知識庫,將知識以“實體—關系—實體”的形式進行描述[5],能夠清晰展示事物之間的關聯(lián)關系,近年來得到學術界和工業(yè)界的廣泛關注[6-10]。相關學者將知識圖譜技術應用于領域知識的關聯(lián)分析,Ding等[11]基于深度學習方法構建了產品制造過程的知識圖譜,可以快速準確地為需求者提供制造知識。葛睿夫等[12]提出了基于深度學習的面向注塑產品缺陷的知識圖譜構建方法,服務于智能制造。Zhong等[13]提供了一種基于消費者需求獲取設計知識的方法,以促進產品設計創(chuàng)新,提升企業(yè)核心競爭力。部分學者將知識圖譜技術用于風險控制研究,為智能決策提供支持,袁剛等[14]基于深度學習構建了食品安全風險知識圖譜,為明確食品安全風險因素之間關聯(lián)關系奠定技術基礎。Janani等[15]構建了兒童用品中香料化學物質的圖譜,描述其化學結構、兒童產品來源、化學來源和氣味特征等,以便為兒童提供更安全的產品。趙敏等[16]構建了化妝品風險物質知識圖譜,為化妝品風險物質監(jiān)管工作提供數(shù)據基礎與決策參考。上述知識圖譜構建過程為兒童用品化學危害控制研究提供了重要的方法參考和范例。
綜上,本文通過收集兒童用品化學危害召回數(shù)據和質量安全標準文件,基于兒童用品化學安全知識需求,定義實體類別、關系和屬性,結合本領域文本特點,分別采用UIE模型和基于規(guī)則的方法進行知識抽取,通過知識融合建立兒童用品化學安全知識關聯(lián)關系,構建兒童用品化學安全知識圖譜,以顯式化不同兒童用品、有害化學物質、可能產生的危害及其相關標準之間的復雜關聯(lián)關系,為企業(yè)在兒童用品設計和生產過程中提供風險預警,輔助兒童用品質量監(jiān)管,為保護兒童健康提供強有力的技術支撐和決策依據。
1 兒童用品化學安全知識圖譜構建
1.1 知識圖譜構建框架
知識圖譜是由實體、關系和屬性組成,用于描述知識之間的語義關聯(lián)關系。兒童用品化學危害控制知識圖譜構建的關鍵技術環(huán)節(jié)主要包括數(shù)據收集和預處理、知識抽取、知識融合和知識存儲。針對兒童用品召回數(shù)據和安全標準文本特征,分別采用不同的路徑和方法進行知識抽取,進一步通過知識融合消除冗余信息,完成兒童用品化學危害知識圖譜的構建。兒童用品化學安全知識圖譜構建框架如圖1所示。
1.2 兒童用品化學安全知識圖譜構建方法
基于兒童用品化學安全知識圖譜構建框架,對兒童用品化學危害召回數(shù)據和安全標準進行數(shù)據收集和預處理,根據文本特征抽取出兒童用品化學危害信息和化學物質限量要求信息,建立化學危害信息與兒童用品安全標準中的有害化學物質限量要求的關聯(lián)關系,完成兒童用品化學安全知識圖譜的構建。
(1)數(shù)據收集與預處理
兒童用品化學安全知識抽取的數(shù)據集主要包括兩部分,分別是兒童用品化學危害召回數(shù)據和兒童用品安全標準。其中,兒童用品化學危害召回數(shù)據主要來源于中國產品安全與召回信息網,選取產品類別為兒童用品,時間為20 08年7月至2024年1月,共爬取1304條數(shù)據,并進一步過濾出由于化學危害導致兒童用品召回的數(shù)據,作為兒童用品化學危害數(shù)據集,示例見表1。
兒童用品安全標準主要來源于全國標準信息公共服務平臺,過濾出包含不同兒童用品各項化學物質的限量要求的標準文件,共獲取標準17份。將獲取的PDF標準文件轉換為可編輯處理的word文件,其中,不同兒童用品各項化學物質的限量要求在標準中都是以表格形式存在,示例見表2。
(2)基于UIE的兒童用品化學危害知識抽取
由于兒童用品化學危害召回數(shù)據具有復雜的語義關聯(lián)關系,UIE模型可以實現(xiàn)實體關系的聯(lián)合抽取,并可以通過小樣本微調快速提升模型知識抽取性能,具有較好的泛化能力,適用于兒童用品化學危害召回數(shù)據的知識抽取。基于兒童用品化學危害召回數(shù)據的內容特點,結合兒童用品化學危害控制知識需求,定義實體和關系類別,其中,實體類別包括兒童用品、產品部件、化學危害、化學物質、安全隱患和標準號,關系類別包括包含、存在、涉及、限量要求、造成、來源于,實體類別與關系之間的對應關聯(lián)關系見表3。
基于定義的實體關系類別,將經過預處理的兒童用品化學危害召回數(shù)據以txt文本格式存儲,導入文本標注工具doccano進行實體關系標注。采用PaddleNLP開源的基于ERNIE-3.0的中文通用信息抽取(universal information extraction,UIE)模型[17 ]作為基準模型。UIE模型充分利用了預訓練語言模型的語義表示能力,借助Prompt將不同的信息抽取任務統(tǒng)一為文本到文本的生成問題,由此,UI E模型可以有效的學習和適應少量標注數(shù)據甚至零樣本情況下的信息抽取任務,在實體抽取、關系抽取等任務上表現(xiàn)出較好的性能,UIE框架如圖2所示。
對于模型超參數(shù)的設置,本文選擇采用Adam優(yōu)化器[18]對參數(shù)自適應調整;采用網格搜索對模型進行超參數(shù)調優(yōu),不同參數(shù)設置下loss值變化情況如圖3所示。
由此得出3 個模型的超參數(shù)設置,學習率為3e-5,批處理大小batch_size為16,最大句子長度為512,訓練批次epoch為30。模型實驗效果評價采用常用的知識抽取評價指標,包括精確度、召回率和F1值[19],分別對零樣本和小樣本下UIE模型的知識抽取效果進行評價,兩種情況下模型表現(xiàn)效果見表4。
從模型評價結果可以得出,在零樣本情況下,UIE模型在兒童用品化學危害召回數(shù)據集上的F 1值為0.784,說明UIE模型具有較強的泛化能力,在沒有針對特定任務的訓練數(shù)據的情況下,也能表現(xiàn)出較好的適應能力;在對UIE模型增加訓練數(shù)據后,模型效果F1值提升為0.965,模型效果有了顯著提升,說明UIE模型可以基于小樣本學習快速適配兒童用品化學危害知識抽取任務。
(3)基于規(guī)則的化學物質限量要求知識抽取
由于兒童用品安全標準中化學物質限量要求均以表格形式存儲,表格數(shù)據屬于結構化程度較高的數(shù)據類型,可以采用基于規(guī)則的方法實現(xiàn)表格知識抽取。對于表格知識抽取主要包含以下兩個步驟。
1)表格標準化處理:通過合并和拆分單元格,對表格數(shù)據進行重組,確保表格的行列遵循一致的邏輯,將表格轉換為易于解析的標準格式;
2)基于規(guī)則的知識抽取:對標準化處理后的表格進行分類,依據表格中行列的邏輯和語義關系,確定實體、關系和屬性,導出三或多元組。結合表2內容,對其進行表格標準化處理,并采用基于規(guī)則的方法進行知識抽取,抽取結果以三或多元組進行表示,示例見表5。
通過將以表格形式存在的兒童用品化學元素限量要求知識轉化為三或多元組,可以建立不同類型兒童用品與對應化學要素限量要求和來源標準之間的關聯(lián)關系。
(4)知識融合
由于兒童用品化學危害召回數(shù)據中對于兒童用品名稱、化學危害、標準號等的描述存在相同含義不同表述的情況,例如:童鞋、兒童鞋,甲醛含量超標、甲醛含量過高,甲醛項目不符合國家標準要求等,知識融合的任務是需要將同一含義的不同表述進行合并,消除冗余信息。實體之間的語義相似性是知識融合的依據,本文采用基于BERT模型[20]計算詞向量,借助余弦相似度獲取實體之間的相似程度,余弦相似度計算公式如下。
將計算所得的實體之間相似度閾值設置為0.85,過濾出具有高相似度的實體列表,依據兒童用品化學安全標準中所規(guī)定的術語和適用范圍中涉及到的兒童用品名稱,將相同或相近語義的實體進行統(tǒng)一,部分實體融合后的結果見表6。示例1借助標準術語對實體的不同表述進行統(tǒng)一;示例2整合了相同含義的不同表述,示例3糾正了實體抽取中存在的錯誤。
(5)圖譜存儲
為準確和清晰地表示兒童用品或產品部件中化學物質的限量要求以及知識來源,將化學物質限量值和來源標準作為關系“限量要求”的屬性存儲,確保兒童用品或產品部件與對應化學物質的限量要求只有唯一限量值和標準來源。通過知識融合和相同實體合并,建立兒童用品化學危害知識和兒童用品化學元素限量要求知識關聯(lián),采用Neo4j對兒童用品化學安全知識圖譜進行存儲和可視化。
2 知識圖譜應用分析
對構建的兒童用品化學安全知識圖譜進行有效分析和利用,可以為兒童用品設計制造和質量監(jiān)管提供決策參考。在兒童用品設計制造過程中,基于知識圖譜可以獲取化學物質超標存在的安全隱患和化學物質在標準中的限量要求,為產品設計和制造過程中的材料選擇和工藝調整提供支持,實現(xiàn)化學危害源頭控制;同時,知識圖譜中所包含的化學危害信息有助于監(jiān)管部門更快速地識別潛在的風險,更精確地進行風險評估和管理,通過知識圖譜可以快速獲取對應化學物質的標準限量要求,提升監(jiān)管效率和有效性,實現(xiàn)對兒童用品化學危害的有效控制,確保兒童用品安全可靠。
2.1 基于化學物質的兒童用品安全隱患分析
基于知識圖譜可以清晰展示化學物質可能產生的化學危害,進而關聯(lián)到造成影響的兒童用品類別、產品部件和存在的安全隱患,由此,可以基于化學物質進行兒童用品安全隱患分析。兒童用品化學危害控制知識圖譜中包含化學物質20種,涉及化學危害頻次較高的化學物質有鄰苯二甲酸酯和甲醛等,在總召回數(shù)據中占比分別為39.8%和17.2%。其中,由甲醛造成的化學危害具有涉及兒童用品類別廣泛、化學危害存在的狀態(tài)不同、存在的安全隱患較大等特征。其中,不同化學危害狀態(tài)包括甲醛含量超標、甲醛釋放量超標、游離甲醛含量超標。甲醛含量超標是潛在的;甲醛釋放量超標直接關聯(lián)到室內空氣質量;游離甲醛超標是實際可能被人體吸收,并對健康構成直接威脅;涉及的兒童用品類別包括童鞋、童裝、玩具、課桌等;甲醛超標造成的安全隱患包括致癌、頭痛、喉嚨灼燒感、呼吸困難,觸發(fā)或加重哮喘癥狀、導致嚴重的健康問題甚至死亡,具體如圖4所示。
基于化學物質進行兒童用品安全隱患分析,可以幫助消費者識別化學物質可能存在的不同化學危害狀態(tài),明確有害化學物質的暴露途徑,進而規(guī)避存在化學危害安全隱患的兒童用品;在兒童用品設計制造過程中,對于化學物質的不同化學危害存在狀態(tài),在質量控制時采取針對性的控制策略,消除兒童用品化學危害安全隱患;對于兒童用品質量監(jiān)管,基于知識圖譜可以快速獲取關鍵化學危害可能波及的兒童用品類別,進行優(yōu)先和重點質量檢查,避免存在化學危害安全隱患的兒童用品流入市場,影響兒童健康安全。
2.2 兒童用品化學危害識別和控制
基于知識圖譜可以清晰展示召回數(shù)據中的兒童用品及其產品部件存在的化學危害、涉及的化學物質和造成的安全隱患,由此,可以實現(xiàn)基于兒童用品的化學危害識別,兒童用品化學危害控制知識圖譜共包含兒童用品實體239個,涉及兒童用品類別較多,其中,童鞋、童裝、兒童玩具和兒童車是召回頻次較高的兒童用品類別。童鞋是由于化學危害召回中頻次最高的兒童用品類別,涉及化學危害類別較多,包括甲醛含量超標、鄰苯二甲酸酯含量超標、重金屬鉛和鎘超標。其中,幫面材料和外底主要涉及鄰苯二甲酸酯含量超標、重金屬鉛和鎘超標,鞋墊涉及甲醛含量超標;由于涉及多種化學危害,可能存在的安全隱患較為復雜,需要進行重點關注和質量把控,如圖5所示。
通過識別兒童用品可能存在的化學危害,可以為兒童用品設計和制造過程提供決策依據。基于兒童用品中各產品部件或材料可能存在的化學危害數(shù)據,為兒童用品設計和制造過程中的各產品部件的材料選擇、測試檢驗和質量把控提供參考,輔助兒童用品源頭質量控制;同時,可以識別兒童用品或產品部件存在的化學危害可能造成的安全隱患的嚴重程度等,獲取兒童用品監(jiān)管重點和優(yōu)先監(jiān)管對象,實施精準防范,確保兒童用品的化學安全性。
2.3 兒童用品質量安全監(jiān)管決策支持
基于兒童用品化學安全知識圖譜,可以快速匹配兒童用品對應化學物質的標準限量值要求。兒童用品化學安全標準知識是兒童用品生產和質量監(jiān)管的重要依據,基于知識圖譜對兒童用品化學物質限量要求進行知識組織可以清晰展示限量要求的指標關聯(lián)關系。將化學物質限量要求和來源標準作為兒童用品或產品部件對應化學物質之間關系的屬性值,可以實現(xiàn)限量值和標準來源的唯一對應從而清晰描述兒童用品涉及的化學危害、可能存在的安全隱患、對應化學物質的限量要求,形成兒童用品化學安全知識鏈路。圖6展示了兒童家具中各產品部件對用有害化學物質的限量要求,可為有害化學物質限量控制提供參考,并可以直接追溯化學物質限量要求來源標準。
基于知識圖譜可以快速獲取兒童用品對應化學物質限量要求,為兒童用品質量監(jiān)管提供監(jiān)管依據;通過整合兒童用品化學危害知識和化學物質限量要求知識,輔助質量監(jiān)管人員更全面地了解兒童用品的化學安全性,更有效地進行風險評估和決策制定,提升兒童用品質量監(jiān)管效率,確保兒童用品安全。
3 結 論
本文基于兒童用品化學安全需求,通過收集兒童用品化學危害召回數(shù)據和安全標準,結合不同文本特征設計知識抽取方法,構建了兒童用品化學安全知識圖譜,得到以下結論。
(1)提出了兒童用品化學安全知識圖譜構建方法。通過訓練和優(yōu)化UIE模型對兒童用品召回數(shù)據進行知識抽取,采用基于規(guī)則的方式對化學物質限量要求表格數(shù)據進行知識抽取,并通過知識融合建立兩者語義關聯(lián),構建了兒童用品化學安全知識圖譜。
(2)基于兒童用品化學安全知識圖譜,可以實現(xiàn)基于兒童用品、化學物質查詢化學危害信息和化學物質標準限量要求,清晰展示兒童用品、產品部件、化學危害、安全隱患、化學物質、限量要求之間的關聯(lián)關系。基于知識圖譜可以為產品設計和制造過程中的材料選擇和工藝調整提供支持,實現(xiàn)源頭控制;同時可以輔助監(jiān)管部門更快速地識別潛在風險,提升監(jiān)管效率和有效性,實現(xiàn)對兒童用品化學危害的有效控制,確保兒童用品安全可靠。
(3)基于本研究所提出的兒童用品化學安全知識圖譜構建方法,下一步研究可以綜合考慮進出口兒童用品化學安全知識,融入不同國家和地區(qū)對于兒童用品化學安全的要求和規(guī)范,為我國兒童用品相關政策和標準的制定提供參考。