999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

關于大數據環境下的電子商務商品實體同一性識別的研究

2016-03-24 08:12:54于帥
中國新通信 2016年4期
關鍵詞:大數據

于帥

【摘要】 經濟與科技的發展帶動了電子商務的發展,在電子商務平臺中對數據的收集與分析是相關人員應當重視的關鍵性問題,不同的電子商務主體其擁有的數據是不同的,且具有相對獨立自治,數據異構等特征,為了對商品信息進行識別與判定,應當設計相應的模型,提高對商品實體同一性的識別率。文中將對這一問題展開研究。

【關鍵詞】 大數據 電子商務 商品實體 同一性 識別

信息化的發展是人們進入了大數據時代,商品交易對網絡的依賴性與利用率迅猛提升,電子商務已經逐漸成為人們生活中不可分割的一部分。為了更好的在網絡上開展生產經營活動,需要對大量的數據進行收集與分析,從眾多的數據源中找到能夠描述具有同一性的商品實體的網頁,如何開展商品實體同一性識別是應當思考的重點問題。

一、電子商務在大數據環境中進行商品實體同一性識別面臨的挑戰

在大數據環境中,對同一性商品進行識別具有較大的難度。首先數據極為龐大,這一特點主要表現在三個方面,第一是數據量本身較多,我國現有的電子商務平臺在100家以上,而商品數量則超過200萬件,識別難度較大;第二是數據具有多樣性,商品的描述方式、屬性結構、數據模態、商品布局等均存在差異,因此很難在一個模型下進行選擇與分析;第三是數據增長與更新速度快,商品的數量與價格、用戶評價、交易記錄等都會成倍的增長,因此數據篩選難度大。其次,商務平臺中,商家與商品均較多、交雜,而不同商家對同一商品的定義與設計也存在或多或少的差異性,因此在進行關鍵詞搜索時,兩個相似度較高或相同的商品不一定會顯示在同一個頁面中,相似度相對較低的商品也可能因為某一關鍵詞而出現在同一頁面中。在對商品描述性語言進行分析時,傳統方法很難準確判定兩個描述的語義是否具有一致性,因此識別相對困難。

二、大數據環境下電子商務商品實體同一性識別的模型研究

1、對象數據模型。在數據背景下可用對象來描述數據特征,商務平臺中商品數據通常以網頁的形式呈現出來,網頁可被稱作為對象頁面,每一商品對應的網頁頁面都含有獨特的結構信息,由對象、對象頁面以及頁面信息所構成的模型極為對象數據模型。為了更準確的進行同一性識別,整個網站會被描述為非空樹,由五個層次組成,其中根節點為網站數據源,中間節點為各級欄目,葉子節點為頁面,用戶在網站主最多只需點擊四次就可以到達目標頁面。

2、樹模型。關系模式難以對電子商務中的復雜數據進行描述與定義,而樹模型以值或者屬性為基礎,并與鍵值型進行適當結合,可以滿足多樣性的需求。整個模型由數據單元關系以及鍵值型對應的數據單元兩部分組成,對象數據則包括不同層次的元數據,元數據包括實體、父級對象、鍵名以及數據值,如商品實體OPPO手機,可分為N1、N3等多個型號即多個商品對象,各型號存在的不同的屬性即為值。由于樹模型不會對數據結構與數據內容進行識別與解析,它可適用于任何類型的數據,其擴展性極強。

3、索引設計。在找尋具有同一性的商品實體時,需要對每兩個商品進行一次比較,這一過程是極為復雜與繁瑣的,為了解決這一問題,可將商品對應的屬性值構造進行倒排,從而形成新的索引表,完成對商品的查詢。屬性名稱、取值、子樹中滿足要求的頁面集合共同組成索引記錄集合。當用戶鍵入關鍵詞后,模型會根據條件形成層次樹,即建立樹模型,然后索引設計模型再對符合條件的項目進行檢查,如果節點中存在索引集合,那么記錄中將會增加該頁面,通過這種方式可以完成初步的聚類處理。

4、值與屬性處理。電子商務平臺中商家、商品都極多,而其商品可能會采取不同的形式表述,雖然其值或屬性節點是等價的,由于表述不一,篩選起來十分困難,如蘋果手機與iPhone這種表述等。若想準確找到具有同一性的商品就需要對商品的值或屬性進行規范化的處理,在索引設計中采取倒排索引,設計人員應當將可以表示商品值與屬性的點集進行分析,然后判定各值或屬性所占的權重。如果某兩件商品的某一屬性完全等價,則可將其納入到同一商品的集合中。

5、層次概率模型。對同一體進行識別的過程最終是在層次概率模型的基礎上完成的,在實際的電子商務中幾乎沒有頁面的相關描述是百分百一致的,因此同一性識別的依據只能是相似度,由于不同屬性對商品識別產生的影響具有差異性,因此在識別與比較前需根據實際需求對各屬性賦予不同的權值,然后就商品比較的需求設計由三個層次構成的概率樹,最后以此對概率樹種的屬性進行篩選與比較,找出其中相似度較高的屬性,找出具有同一性的商品。

結語:在電子商務活動中對商品實體進行同一性的識別是十分必要且重要的,信息時代數據量迅猛增長,為了準確、迅速的找到具有同一性的商品,設計人員應當建立有效的對象數據模型、樹模型、索引、值與屬性處理系統以及層次概率模型等,對數據進行合理的篩選與分析。

參 考 文 獻

[1]胡亞慧,李石君,余偉,等.大數據環境下的電子商務商品實體同一性識別[J].計算機研究與發展,2015(08).

[2]劉顯敏.XML數據實體同一性相關技術的研究[D].哈爾濱工業大學,2013.

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 成人精品免费视频| 中文字幕在线观| 综合色在线| 国产成人无码AV在线播放动漫| 国产噜噜噜视频在线观看| 免费aa毛片| 精品小视频在线观看| 亚洲第一视频网| 国产精品自拍合集| 无码视频国产精品一区二区| 麻豆精品视频在线原创| 国产福利微拍精品一区二区| 色妞www精品视频一级下载| 99热这里只有免费国产精品| 黄色在线不卡| 日本www色视频| 尤物特级无码毛片免费| 日韩 欧美 国产 精品 综合| 国产剧情一区二区| 欧美色综合网站| 亚洲国产精品久久久久秋霞影院 | 久久这里只有精品国产99| 国产小视频在线高清播放 | 久久综合婷婷| 亚洲无线国产观看| 亚洲福利片无码最新在线播放| 国产无码制服丝袜| 午夜国产在线观看| 丰满人妻一区二区三区视频| 国产尤物视频网址导航| 国产成人亚洲综合A∨在线播放| 少妇露出福利视频| 国产精品一区二区在线播放| 无码国产偷倩在线播放老年人 | 亚洲成a人片77777在线播放| 青青网在线国产| A级全黄试看30分钟小视频| swag国产精品| 成年人久久黄色网站| 永久毛片在线播| 特级欧美视频aaaaaa| 2020精品极品国产色在线观看 | 国产一区二区三区精品久久呦| 久久国产乱子伦视频无卡顿| 一级高清毛片免费a级高清毛片| 亚洲丝袜第一页| 色AV色 综合网站| 国产91视频观看| 色综合天天视频在线观看| 国产农村1级毛片| 日本一区二区三区精品国产| 日本欧美一二三区色视频| 91精品国产综合久久不国产大片| 亚洲天堂色色人体| 欧美一级夜夜爽| 美女被操91视频| 欧美亚洲国产视频| 人妻一本久道久久综合久久鬼色| 成人免费黄色小视频| 精品国产免费观看一区| 国产在线视频二区| 爽爽影院十八禁在线观看| 欧美亚洲国产一区| 18黑白丝水手服自慰喷水网站| 99草精品视频| 国产福利在线观看精品| 欧美不卡视频在线观看| 国产99视频在线| 欧美一区二区三区不卡免费| 亚洲a级毛片| 日韩av无码精品专区| 黄色不卡视频| 国产91丝袜在线观看| 老熟妇喷水一区二区三区| 九色在线观看视频| 四虎影视库国产精品一区| 国产丝袜丝视频在线观看| 久久精品这里只有国产中文精品| 欧美亚洲一二三区| 色综合天天娱乐综合网| 国产在线专区| 91亚瑟视频|