999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種海關品牌型號庫構建工具設計方法

2022-01-22 10:34:31滕灝,高亞東,劉存,毛柯
計算機時代 2022年1期
關鍵詞:機器學習

滕灝,高亞東,劉存,毛柯

摘? 要: 目前海關常用的十位商品海關編碼是一種比較粗放的編碼方式,在報關單中商品海關編碼很難和具體商品實現一一對應的關系,亟待構建一套標準的商品智能分類工具,為海關管理提供基準的商品分析依據。文章基于海關報關單申報商品名稱規格型號,利用機器學習等先進技術手段,實現將海關商品的最小分析單元從HS編碼細化至具體品牌型號,形成商品基礎庫,實現商品智能分類,為貿易監管、稅收征管、稽查緝私等業務提供強大支撐。

關鍵詞: 海關編碼; 報關單; 機器學習; 商品基礎庫

中圖分類號:TP311? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2022)01-42-04

A novel design method of building tool for customs brand model library

Teng Hao, Gao Yadong, Liu Cun, Mao Ke

(Division of Science, Hangzhou Customs, Hangzhou, Zhejiang 310006, China)

Abstract: At present, 10 bit commodity HS code is a rough coding method commonly used by Customs. Unfortunately it is difficult to achieve a one-to-one correspondence between the commodity HS code in the customs declaration and the specific commodity, which lead to urgently build a set of standard intelligent commodity classification system to provide the basis of commodity analysis for customs management. According to the customs declaration of commodity name, specification, model, using advanced technology such as machine learning, this paper refines the minimum analysis unit of customs commodity from HS code to specific brand and model, forming a basic commodity library, realizing intelligent classification of commodities, which provide strong support for supervising trade, tax collection and management, anti-smuggling and other businesses.

Key words: HS code; customs declaration; machine learning; basic commodity library

0 引言

近年來全球大數據[1]技術呈現快速發展趨勢,大數據技術在數據分析[2]、流程優化[3]、風險防控[4]及監測預警[5]等方面展現出巨大威力,大數據已成為各國家政府的多種國家戰略交叉域。各國海關在大數據應用方面紛紛加大投入,如新西蘭海關實施大數據戰略,聯合內外部專家利用多機構的數據開發目標模型,更好地預測威脅,監測趨勢并確定高風險目標;英國海關借助第三方數據廠商拓展數據來源及數據多樣化類型,保證數據準確性,通過數據對碰及時發現監管風險。2018年,我國海關總署設立了全國海關大數據應用中心,搭建了互相聯通、統一管理的大數據基礎平臺,在支持全國通關一體化[6]、打擊走私[7]、應對中美貿易摩擦[8]、捍衛國門安全[9]等領域做了有益的嘗試并取得一定成效。但在商品領域,缺少有效的分類基礎數據及構建工具,如何構建精細的商品分類方式來為精準分析提供支撐,成為海關大數據分析領域的一個重要課題。

1 商品分類痛點

海關通關業務中,各企業、各代辦機構的報關員出于便利、個人習慣或對商品的不同認識,填寫報關單時,對商品的描述往往不規范,導致不同的商品描述代表了同一種商品;同時,海關常用的稅號通用的是10位HS編碼[10],這是一種比較粗放的編碼方式,一種商品編碼在報關單中很難精準定位到一種商品。因此亟待構建一個標準的商品要素屬性庫體系為業務工作提供基準的商品分析依據。

SKU來源于電商平臺的最小庫存單元理念,即庫存進出計量的基本單元,現在已經被引申為產品統一編號的簡稱,每種產品均對應有唯一的存貨單元號。本文中的品牌型號庫構建工具就是構建SKU級的商品分類編碼,能精準定位到具體某類商品,實現商品的屬性管理、屬性值管理、SKU管理等功能。

2 系統建設目標

商品庫構建工具對報關單中的商品信息進行分析,根據商品報關要素進行分類整理,最終形成基于SKU級別的商品庫,為其他數據分析系統提供數據支持。

系統為海關商品數據分析、歸類提供技術支持,具體有以下幾個層次:

一是報關的數據采集與清洗,采集對象是報關產生的大量非結構、不確定、高冗余的商品記錄數據,對其做初步的清洗和規整化,抽取報關單中商品相關的重點申報信息;二是商品要素提取,參照海關報關要素提取商品屬性,針對屬性提取該商品的屬性值;三是商品SKU管理,通過對商品屬性和屬性值的梳理,逐步形成海關申報商品的SKU編碼規則,實現比已有的HS編碼更精細化的分類管理方式。

3 系統設計

3.1 總體架構

系統對報關單數據進行快速有效的歸類整理,按照分析人員要求,將報關數據中的共性的商品特征信息按一定的分類標準歸類入庫,進行提取分析,形成SKU級商品要素屬性庫,供其他分析系統做進一步的數據分析。系統體系結構如圖1所示。

3.2 功能設計

系統應用架構分為四個層次,基礎層、服務層、應用層和展現層,系統應用架構如圖2所示。

3.2.1 數據采集與處理

采集對象是報關產生大量非結構、不確定、高冗余的商品記錄數據。這些數據存在大量不完整、不一致、有異常的情況,嚴重影響到商品庫要素挖掘的執行效率,甚至可能導致挖掘結果的偏差。所以進行數據清洗就顯得尤為重要。

通過ETL工具抽取數據源為Max Compute、Oracle或SQL Server的系統數據,支持數據的全量和增量采集,支持對數據同步過程進行監控,可通過瀏覽相關日志,了解數據同步過程的詳細信息,并支持對數據同步執行過程進行干預和調整。

數據采集后,預先對其清洗,刪除原始數據集中的無關數據、重復數據,平滑噪聲數據,處理缺失值、異常值。利用優化剪枝以及高性能算法對其進行屬性提取、關系挖掘、比較融合等處理。

3.2.2 商品分類管理

由于商品數量龐大,商品種類成千上萬,為方便管理,需要我們將商品分門別類,同一類別是管理范圍內的商品集合總體,它既可以是某一類稅號,又可以是擁有相同屬性的某一商品類別。系統提供靈活的商品分類自定義功能,根據需要對分類進行更新、刪除等,通過查詢分類列表,可掌握該分類商品數據挖掘情況。系統按類別定向采集數據,針對同一類別下的商品實現對商品屬性和屬性值的統一管理。

3.2.3 商品屬性管理

依據海關現有商品綜合分類清單,梳理商品屬性,商品屬性由商品自有的特性抽象而來,是商品本身存在的不可缺少的性質。系統針對商品屬性進行統一管理,具體功能包括:商品屬性定義、商品屬性維護。

屬性定義是對同一商品分類下的商品自有特征進行提煉。針對一類商品,系統完成初步的清洗和規整化,抽取報關單中商品相關的重點申報信息,形成待分析商品清單。

屬性維護便于用戶查看該商品分類下的屬性信息。用戶根據需求,參照待分析商品清單,對屬性進行增加、修改和刪除。為方便屬性定義和維護,將其分為全局屬性和局部屬性。

3.2.4 商品屬性值管理

按照定義的屬性,對報關單中商品相關信息進行全面分析,將屬性值全部提取出來,形成該屬性的值域。某一商品分類下的同一屬性的屬性值數量龐大,系統針對商品屬性值進行統一管理。

屬性值提取來自于報關單中商品相關信息,前面提到的待分析商品清單為屬性值提取提供數據基礎,用戶查看待分析商品清單。同時支持對屬性值的批量導入,直接納入屬性值清單。對于已納入的屬性值,系統采用基于語義的機器學習分詞方法與細胞詞庫相結合的方式,結合過濾去重規則,更新待分析商品清單。

智能推薦基于主動學習和模式識別的方法,利用商品屬性及圖關系,結合語義特征對有效的商品屬性值進行推薦。系統根據選中的屬性值內容,自動在商品信息中匹配篩選,對同義詞或相似度高的值進行提示。

屬性值維護記錄已提取的商品屬性值,形成屬性值清單,便于用戶查看該商品屬性下的屬性值信息。為了方便提取,當某一屬性值被選中時,系統將通過語義分析,給出其相關屬性值推薦。用戶可根據實際需求對屬性值清單進行修改和刪除。

屬性值定位提供搜索框,支持屬性值模糊搜索功能,除顯示屬性值作為搜素結果外,選中的記錄將在待分析商品清單中定位,便于用戶對屬性值相關信息的查看和分析。

基礎信息更新支持報關單商品基礎信息的增量更新。新增數據將按照已定義的商品屬性進行歸類整理、分類。對于無法分類的數據,將其納入待分析商品清單,便于用戶通過機器學習及專家經驗等方式進行商品屬性值提取。

3.2.5 商品信息查詢

對已完成商品屬性值提取的商品集,建立以商品分類為根節點的商品展示樹。提供關鍵字搜索功能,根據輸入的內容定位所在商品樹位置,便于相關屬性和屬性值的查看;同時,系統自動提取該分類下的商品屬性作為篩選條件,查詢符合篩選條件的商品信息。

3.2.6 商品SKU管理

通過對商品屬性和屬性值的梳理,逐步形成海關申報商品的SKU編碼規則,提供比已有的HS編碼更精細化的分類管理方式——SKU管理。

SKU定義結合定義的屬性和提取的屬性值,系統自動對特定稅號的商品進一步抽取、提煉、歸類分析,并給每個類別賦予一串唯一編碼。每一個SKU編碼作為識別一類商品的唯一標識,實現對申報商品從HS層面細分到SKU層面的精細化管理。

SKU更新將獲取最新數據并按一定規則動態地更新SKU。SKU不斷地更新完善,形成符合最新業界商品現狀的海關SKU級的智能商品庫。

3.3 部署架構

系統采用高可用架構部署,通過虛擬化及鏈路負載均衡提高系統的可用性,具體架構圖如圖3所示。

4 應用展望

通過該系統的運用,可以將商品最小分析單元從HS編碼細化到具體品牌型號,利用專家經驗機器輔助構建的方式,夯實海關商品數據基礎,為商品價格分布分析、消費指數分析、違法案件精準打擊等應用提供支撐,通過大數據的運用提升海關的監管力度和服務水平。同時可以利用本系統的相關技術,服務于跨境電商的監管,如地址解析等,從而實現海關高效監管,促進企業發展。

參考文獻(References):

[1] 程學旗,靳小龍,王元卓,等.大數據系統和分析技術綜述[J].軟件學報,2014(9):1889-1908

[2] 朱建平,章貴軍,劉曉葳.大數據時代下數據分析理念的辨析[J].統計研究,2014,31(2):10-19

[3] 王云鵬,李善興,王占中,等.基于Petri網的汽車制造業生產物流流程優化[J].吉林大學學報(工學版),2008,38(S1):61-64

[4] 仲育,辛帥.金融行業應用云計算和大數據安全風險防范策略[J].現代金融,2017,4(410):49-51

[5] 吳炳方,張淼,曾紅偉,等.大數據時代的農情監測與預警[J].遙感學報,2016(20):1027-1037

[6] 張健.數據化驅動的海關通關一體化改革[D].廈門大學,2018

[7] 陳志鋒.AS海關網上緝私研究[D].電子科技大學碩士學位論文,2016

[8] 李強,覃春面,董耀武.中美貿易摩擦視角下的股,匯市風險溢出研究[J].武漢金融,2019,238(10):5-11

[9] 徐強.試論大數據標簽化在進出口企業畫像中的運用[J].中國口岸科學技術,2020,460(11):34-39

[10] 張紫玄,王昊,朱立平,等.中國海關HS編碼風險的識別研究[J].數據分析與知識發現,2019

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 欧美日韩在线亚洲国产人| 欧美啪啪网| 好吊日免费视频| 国产亚洲视频免费播放| 国产18在线播放| 午夜日韩久久影院| 亚洲AV无码久久精品色欲| 婷婷丁香色| 久草视频精品| 四虎影视国产精品| 欧美一区二区丝袜高跟鞋| 国产真实乱了在线播放| 国产免费人成视频网| 国产人前露出系列视频| 亚洲色大成网站www国产| 中文字幕在线视频免费| 国产精品浪潮Av| 欧美在线伊人| 国产综合精品一区二区| 国产一区二区三区免费观看| 免费看一级毛片波多结衣| 国产区在线观看视频| 欧美国产日韩在线| 天天摸夜夜操| 国产一区二区三区在线无码| 亚洲一级毛片在线播放| 伊人久热这里只有精品视频99| 一级在线毛片| 国产一二三区在线| 国产成人综合亚洲欧美在| 国产97色在线| 国产精品欧美激情| 久久国产成人精品国产成人亚洲| 好吊色妇女免费视频免费| 国产不卡国语在线| 国产欧美一区二区三区视频在线观看| 欧美日韩成人在线观看| 国产成人无码AV在线播放动漫| 狠狠色噜噜狠狠狠狠奇米777| 国产黄色视频综合| 国产一级毛片网站| 欧美午夜小视频| 99热这里只有精品久久免费| 最新国产高清在线| 精品国产免费人成在线观看| 国产91线观看| 最新亚洲av女人的天堂| 亚洲 欧美 日韩综合一区| 国产日本欧美亚洲精品视| 永久免费无码日韩视频| 欧美va亚洲va香蕉在线| 人妖无码第一页| 一级在线毛片| 黄色在线不卡| 欧美成一级| 免费在线色| 国产波多野结衣中文在线播放| 国产性爱网站| 91精选国产大片| 亚洲免费毛片| 免费看黄片一区二区三区| 欧美 亚洲 日韩 国产| 国产小视频a在线观看| 久久这里只有精品国产99| 深夜福利视频一区二区| 丰满的少妇人妻无码区| 国产91久久久久久| 成人综合网址| 国产人成在线观看| 国产正在播放| 在线高清亚洲精品二区| 国产手机在线观看| 亚洲日韩精品欧美中文字幕| 狼友av永久网站免费观看| 国产成人高清精品免费| 美女裸体18禁网站| 一个色综合久久| 国产在线98福利播放视频免费| 波多野结衣一区二区三区四区视频| 日本在线亚洲| 米奇精品一区二区三区| 国产精品美女免费视频大全|