【摘要】本文探討了新零售模式下商品源數據服務的模式,強調了商品標準化和數字化對電子商務和零售業發展的重要性,并就改進當前商品源數據服務工作提出了幾點建議。
【關鍵詞】源數據;數據采集;數據應用
【DOI編碼】10.3969/j.issn.1674-4977.2024.04.049
Current Situation and Problem Analysis of Commodity Source Data Service
ZHANG Yuying
(Fujian Provincial Standard Institute Information Technology Co., Ltd., Fuzhou 350013, China)
Abstract: This paper mainly discusses the model of commodity source data service under the new retail model, emphasizes the importance of commodity standardization and digitalization to the development of e-commerce and retail industry, and puts forward some suggestions for the existing problems of source data service.
Keywords: source data; data acquisition; data application
在“互聯網+”和大數據戰略的推動下,很多傳統零售企業紛紛轉型升級,依托大數據、互聯網、人工智能、線上線下相融合等技術共同催生出了新零售模式。新零售時代拉開的帷幕,也讓數據問題逐步呈現在市場這個大舞臺中。
從源頭來看,供應方數據是整個零售業數據的基礎,但目前供應方數據完整性、準確性和可靠性都較為薄弱,進入零售方后,依靠銷售端和電商平臺倒逼其完善這方面工作,起到的作用也相當有限,導致零售方的數據匯聚困難重重。再加上零售方基本在使用獨立系統,數據沒有互聯互通,信息采集和標準要求不統一,導致商品信息繁雜、質量低下,進一步影響到消費者數據。從源頭到終端,環環相扣的數據鏈條沒有形成統一的標準和制度,最終導致供應方數據采集無從下手,零售方數據收集魚龍混雜,消費者數據掃碼漏洞百出。而商品的信息不對稱、不聯通甚至成了個別不良商家假冒偽劣的空子。
國務院《促進大數據發展行動綱要》(國發〔2015〕50號)明確要求“建立標準規范體系,推進大數據產業標準體系建設,加快建立數據標準體系。”
針對人工收集商品信息的耗時耗力、獲取信息渠道分散、缺乏結構性信息的痛點。2016年8月,中國物品編碼中心(以下簡稱編碼中心)相繼與京東集團、阿里巴巴成功簽署戰略合作協議,正式宣告商品源數據啟動。商品源數據戰略旨在構建基于統一編碼的商品數據平臺,通過標準化、結構化的信息采集,為商品信息的身份驗證、搜索優化、品類匯聚、市場細分和營銷宣傳提供更高質量的數據,滿足商品快速上架、多維度信息快速檢索、新品數據分析的零售方需求和商品數據獲取準確性和可靠性的消費者需求。
商品源數據以商品條碼為關鍵字,通過標準化采集將商品實物轉化為數字資產。商品源數據采用GS1全球數據模型,在GS1全球主數據標準中的元數據結構和內容不變的基礎上,對標準中的四千多個商品屬性及關聯屬性進行個性化梳理和分類,形成針對不同品類的應用模型,精確屬性選擇范圍,降低采集成本,提高應用效率。
源數據采集服務通過對商品全方位拍攝、圖片有效處理、尺寸重量測量、產品外包裝文字提取等方式獲取商品信息。目前商品源數據采集主要包括商品基本信息、詳細信息、質量信息、包裝信息、企業信息、特征屬性信息等內容,詳情見表1、表2。


商品源數據戰略的提出踐行了我國《促進大數據發展行動綱要》,有效推動了我國電子商務和零售業的數字化和標準化發展,提升了零售商的商品上架速度和廣大消費者線上線下的購物體驗。
除了2016年編碼中心和京東集團、阿里巴巴簽署戰略合作協議外,2020年11月,編碼中心聯合大潤發流通事業股份有限公司及阿里巴巴集團控股有限公司,啟動“端到端數據交換項目”,共同開展商品數字化工作。2021年4月,編碼中心與便利蜂商貿有限公司合作,就商品信息標準化、數字化、商品數據共享應用等方面進行深度合作,越來越多的零供企業加入了這場商品數據的戰役中。
而自2016年起,編碼中心開始分批次在各個省市建立源數據工作試點——源數據服務工作室(以下簡稱“工作室”)。工作室向生產方、流通方、銷售方、購物方提供標準化商品信息數據服務、協助貿易各方進行信息交互。截至2023年12月底,編碼中心已在全國40個城市建立了43個源數據服務工作室,已服務品牌商30.9萬家,零售商380家,采集商品源數據93.23萬條。
為了提升商品源數據服務工作,相關標準也逐步制定并發布。編碼中心牽頭制定了團體標準T/CABC 1—2022《商品源數據采集規范》、T/CABC 2.1—2022《商品源數據商品屬性信息規范第1部分:通用屬性》、T/CABC 2.3—2023《商品源數據商品屬性信息規范第3部分:公共采購類》、T/CABC 8.1—2023《商品源數據數據質量實施規范第1部分:質量管理》、T/ CABC 8.2—2023《商品源數據數據質量實施規范第2部分:質量控制》、T/CABC 8.3—2023《商品源數據數據質量實施規范第3部分:質量核查》、T/CABC 8.4—2023《商品源數據數據質量實施規范第4部分:質量評價》。部分省市制定了地方標準,如河南省地方標準DB41/T 2215—2022《商品源數據采集規范》、DB41/T 2470—2023《商品源數據服務規范》、安徽省地方標準DB34/T 4525.1—2023《商品源數據屬性信息規范第1部分:通用屬性》、DB34/T 4525.2—2023《商品源數據屬性信息規范第2部分:特征屬性-政府采購辦公設備及耗材類》。這些標準都為源數據服務工作提供了良好的支撐作用。
建立完善的標準體系。雖然目前已有編碼中心牽頭制定的《商品源數據采集規范》總標準和6個配套標準,以及河南省制定的相關地方標準作為商品源數據服務工作的支撐,但由于商品源數據服務工作涉及各行各業,范圍廣、跨度大,目前配套標準還遠遠無法覆蓋源數據采集工作范圍的需求。建議相關部門以編碼中心制定的《商品源數據采集規范》為總指導,不斷推廣商品源數據應用試點,探索源數據服務管理體系,并且在源數據采集過程中不斷檢驗、改進和提升,形成行之有效的標準,逐步完善商品源數據標準體系,為源數據采集服務的提質增效奠定堅實的基礎。
提高數據更新速度。目前,商品源數據的采集主要由43個源數據服務工作室進行收樣采集,企業沒有權限進行自主采集。但目前商品更新迭代速度快,現有數據采集速度遠遠無法滿足不斷升級變化的商品信息。再加上企業對源數據采集的重視程度不夠,沒有及時對更新后的產品進行送樣采集,導致商品數據庫的部分數據無法與市場流通的最新產品相匹配。針對這個問題,建議開放部分采集字段由企業選擇自主錄入/送樣采集,拓寬采集渠道,加快采集速度。同時與更多零供企業合作,進一步發揮源數據標準化的優勢,協同零供企業一起提高市場對源數據采集的重視度。
提高應用數據契合度。雖然編碼中心前后與相關大型零售企業、電商企業合作,但在合作的過程都會遇到不同程度的數據匹配難題,每一個合作方對于數據字段需求不一致,導致應用場景所需數據與編碼中心數據提供需求不匹配,在這個過程中為了合作必須進行協商,找到共贏的方法。所以在探索合作的前期,應該做好需求調研,充分評估采集字段增減、平臺技術支撐的成本以及后期源數據服務工作室的可行性,做好個性化方案制定,精準匹配各方需求。同時建議編碼中心與相關行業協會、企業、科研機構等建立密切的合作關系,促進行業企業間的信息共享和技術交流,共同推動商品源數據服務的不斷完善和提升。
【參考文獻】
[1]張成海.統一追溯編碼標準完善機制共享數據:追溯的歷史、現狀、趨勢與對策[J].條碼與信息系統,2018(1):9-16.
[2]王華,毛鳳明.GDSN商品主數據在商品數字化管理中的應用[J].中國自動識別技術,2021(2):70-74.
[3]陳震宇,蔣蕓杉,羅雪娟,等.基于商品條碼數據的市場發展分析[J].條碼與信息系統,2022(4):21-23.
[4]武松霞,楊士民,吳慧,等.商品源數據助推河南新零售發展及存在問題分析[J].中阿科技論壇(中英文),2022(7):100-103.
【作者簡介】
張玉英,女,1988年出生,中級經濟師,學士,研究方向為編碼應用。
(編輯:于淼)