摘 要:為推動中國與俄羅斯的外貿服裝產業發展,并有效指導國內企業進入反向定制生產模式,以俄羅斯電商平臺Wildberries為數據來源,應用文本挖掘技術對平臺上商品的在線評論內容進行情感分析,通過消費者評價維度權重、情感積極率和待改進度3項指標獲得服裝消費者的反饋信息。結果表明:一級維度中對消費者整體情感傾向影響最大的是產品質量,其次是產品外觀和服務質量。在產品質量中,保暖性雖然是羽絨服最重要的服裝特性,但在影響消費者整體情感傾向程度的排名中僅第三;排名第一的為合身度,也是最需要改進的。在其他二級維度中,對消費者整體情感傾向影響最大的分別是顏色、客戶服務,兩者均需進一步改進。未來中國的外貿服裝企業在設計生產過程中不僅要增加相應的尺碼,還要考慮到消費者對顏色的偏好和保暖性需求,銷售方在服務提供過程中要注重提升客戶服務質量,以提升消費者滿意度,最終促進國內企業進入反向定制生產模式,推進雙方貿易發展。
關鍵詞:跨境電商;文本挖掘;在線評論;情感分析;消費者需求
中圖分類號:TS941.1
文獻標志碼:A
文章編號:1009-265X(2024)08-0108-09
收稿日期:20231014
網絡出版日期:20240320
基金項目:新疆大學橫向項目(202010140003)
作者簡介:康雷(1999—),男,黑龍江齊齊哈爾人,碩士研究生,主要從事服裝消費者需求分析方面的研究。
通信作者:張瑜,E-mail:562759500@qq.com
俄羅斯是中國服裝的重要出口市場,服裝在雙邊貿易中一直占有很大體積質量,對雙邊貿易持續穩定發展具有重要作用。目前,俄羅斯因棉毛原料匱乏、紡織加工工藝陳舊、設備落后、服裝及其他各類制成品生產能力不足等原因,導致俄羅斯內的服裝市場無法滿足其消費者購買需求[1]。在此情形下,中國供貨企業需結合俄羅斯當地冬季氣候環境等因素,為俄羅斯服裝市場提供更具針對性的高品質冬季服裝,以推進雙方服裝貿易發展。在消費者需求研究領域中研究人員將文本挖掘技術應用于蘊含豐富消費信息的電商在線評論中,結合各情感評價指標情況對評論內容進行情感分析獲取消費者的購買需求,并為企業設計與生產提供指導意見。
通過在中國知網上進行關鍵詞和主題搜索“消費者需求”發現,國內消費者的消費需求研究內容較多,國外的消費需求研究較少,評價指標不全面,這表明國內企業在國際市場發展仍有較大提升空間。在此背景下,本文基于文本挖掘技術,獲取俄羅斯電商平臺Wildberries中冬季服裝商品的在線評論,從中提取高頻特征詞匯進行聚類分析得到消費者評價維度,以評價維度權重、情感積極率和待改進度3項情感評價指標為基礎,分析消費者購買商品的需求偏好,探索服裝產品消費者的真實需求,為從消費能力轉化到設計生產能力再轉變服裝行業的生產模式提供助力,進而推動雙邊服裝貿易發展。
1 研究綜述
1.1 俄羅斯服裝市場現狀
俄羅斯輕工業發展不平衡,紡織工業和造紙工業在俄羅斯未受到太多關注。根據俄羅斯統計局不完全統計,在俄羅斯生活消費用品中,紡織工業依賴進口程度最大[2]。據海關總署數據,2021年中國對俄羅斯紡織原料及制品和鞋帽類及其零件的出口金額為79.02億美元,同比增長12.42%;2022年出口金額為79.91億美元,同比增長1.13%。2022年相比較2021年同比增速下降了近11個百分點,但仍緩慢增長。在購買服裝時,多數普通的俄羅斯消費者認為價格是影響購買決策的最重要因素,其次是款式、舒適度、質量;少數高收入的消費者有能力購買進口的高檔服裝商品[3]。
俄羅斯地處歐亞大陸北部,冬季時間較長,且更加寒冷,對冬季服裝要求比其他季節更為重要。俄羅斯夏季,女性多數穿著連衣裙、裙套裝等;男性穿著襯衫、文化衫等。在冬季,女性喜歡穿較長的羽絨服,下著毛呢大擺裙、較厚踏腳褲和長筒靴;而男子多喜歡穿羽絨服、皮大衣、短風衣、茄克衫和絨布格子軟領襯衫[4]。
1.2 俄羅斯電商平臺市場現狀
2022年,在俄羅斯最受歡迎電商平臺排行前三的分別是Lamoda、Ozon、Wildberries [5]。Lamoda成立于2011年,是俄羅斯和周邊地區最大的在線時尚購物平臺之一,主要銷售男、女性服裝、兒童時裝、鞋履、包袋、配飾等商品;2022年,Lamoda營業額達到613億盧布,在最受歡迎的電商平臺中排名第三。Ozon成立于1998年,是俄羅斯市場唯一的多品類綜合電商平臺,為客戶提供跨越俄羅斯11個時區最廣泛的商品選擇和送貨上門服務;2022年,Ozon的營業額達到2770億盧布,在最受歡迎電商平臺中排名第二。Wildberries公司是一家主營時裝、鞋子及配飾的大型網絡商店,公司直接與服裝生產商及官方經銷商合作;2022年,Wildberries的營業額達到1.669萬億盧布,占據了俄羅斯電商市場的領先地位。Wildberries和Ozon都是面向俄羅斯的電商平臺,兩平臺在受歡迎的程度上相差無幾。Варламова等[6]對300人進行問卷調查,發現56.7%受訪者更喜歡用Wildberries,43.3%受訪者則使用Ozon,但Wildberries平臺相比較于Ozon平臺能夠獲得更多有關商品的銷售信息。
1.3 在線評論研究現狀
隨著電子商務的快速發展以及網絡購物行為的日益普及,在線評論已成為一個蘊含豐富信息的重要數據源。在線評論挖掘研究通常包含維度提取和情感分析。維度提取方法主要包括基于詞頻統計的頻繁項提取、基于語法結構的規則匹配和機器學習的方法。趙楊等[7]結合頻繁項提取與無監督學習從在線評論中提取了海淘APP屬性特征,確定用戶滿意度維度,運用支持向量機算法得到各維度的用戶滿意度評分。情感分析方法包括情感詞典法、機器學習方法以及基于計量經濟學和統計學方法等。董婧等[8]利用新型冠狀病毒期間收集的微博評論數據,基于SnowNLP中文情感詞匯本體庫,構建情感分類詞典,對每日微博情感指數進行長時間序列分析,獲取民眾在不同時間段內情感變化的趨勢,探究新型冠狀病毒對民眾情感狀態的影響。柴源[9]引入LSTM網絡構建情感分析模型對圖書評論進行情感分析,并在相同訓練集下與基于詞典、SVM和RNN模型進行性能對比,為進一步優化模型提供指導。相比機器學習的方法,情感詞典實現起來相對簡單,且不依賴標注好的訓練集,因此在處理通用領域網絡文本時,能夠快速、有效地進行情感分類。然而,基于情感詞典方法對詞典的質量和覆蓋面要求較高,對于特定領域的文本,效果可能不如基于機器學習的方法。因此,根據實際需求和應用場景的不同,需選擇合適的情感分析方法。
隨著文本挖掘技術不斷出現和改進,在線評論挖掘成功地應用于消費生產等領域當中。然而,消費者需求的研究對象多數為國內消費者,該方法未被充分運用于國外消費者需求研究當中。
1.4 文本挖掘研究現狀
文本挖掘是數據挖掘技術在大量文本集合上的應用。通過分析文本數據,可以實現總結、分類、聚類、關聯分析等知識發現功能。文本挖掘技術可以將一堆文本數據自動分類成不同的主題或類型,從而幫助用戶更好地了解數據集合的內容和結構[10]。文本挖掘的應用領域包括輿情管理、生物醫學、金融管理、消費生產等。
在輿情管理領域中李彤彤等[11]以微博文本為基礎,采用支持向量機算法對微博文本進行情感分析,探究新型冠狀病毒感染下大學生的情感狀態及其影響因素。Sastre等[12]將文本挖掘技術應用到醫學領域,利用PyLucene搜索引擎和GrapeNLP語法引擎從大量科學出版物中提煉信息,確定溫濕度對COVID-19傳播有一定影響。劉壯等[13]提出了一種基于BERT模型架構的開源金融預訓練語言模型F-BERT;該模型能夠自動從金融大數據中提取信息并記憶在模型中,可直接用于各種金融領域任務,例如股票漲跌預測、金融情緒分類和智能客服。王克勤等[14]運用構建情感詞典的方法來進行情感分析,比較消費者在智能手機更新換代前后各個屬性特征的綜合評分,從產品設計改進角度給出相應建議。在消費生產方面,研究者傾向于將文本挖掘技術應用到電商平臺中,挖掘商品在線評論中潛在的信息。文本挖掘研究對技術有很強的依賴性,具體應用領域研究需要使用到不同算法和技術,因此信息提取、自然語言處理及深度學習等技術依然是未來的研究熱點。
1.5 消費者需求研究現狀
在服裝產品消費者偏好與需求的研究中,傳統詢問調查法依靠模擬選擇將消費意愿與實際產品相關聯,提取特定群體對特定類型服裝產品的需求特征,并量化其對需求的偏好程度。張冰潔等[15]基于功能性滑雪內衣的認知情況、穿著感受、運動體驗和功能需求4個維度設計調查問卷,應用交叉分析和卡方檢驗等方法對專業滑雪運動員與大眾滑雪愛好者的差異化需求進行分析。隨著互聯網的快速發展,越來越多消費者習慣于網上購物,分析消費者購物時留下的評論,能獲取數據中的潛在信息,解讀消費者想法。劉娜娜等[16]采用文本挖掘技術對在線評論進行詞頻統計和情感分析,繪出情感分布圖,并通過SAS變量聚類法分類,建立消費者需求模型,分析其購買需求。
傳統詢問調查法具有調查規模小、反饋周期長等問題,隨著互聯網購物的流行,目前對消費者需求的相關研究更傾向使用文本挖掘技術。
2 研究方法
本文研究框架包括:羽絨服類服裝產品消費者在線評論收集、通過高頻詞匯提取和文本聚類對在線評論進行維度提取、人工數據標注、消費者需求分析、為企業給出相應指導建議。研究框架如圖1所示。
2.1 在線評論維度提取
本文采用Python語言編寫爬蟲程序,在最受俄羅斯人歡迎的Wildberries電商平臺上獲取羽絨服類商品的基本信息和評論內容。獲取的評論內容無法直接使用,需對評論文本內容進行預處理。采用TF-IDF算法進行在線評論的評價維度表征詞匯提取,此算法能夠綜合詞匯在文本中出現的頻率與分布情況,可選取高頻詞作為評價維度表征詞匯。K-means++相較于傳統的K-means算法,在初始聚類中心的選擇上更加智能,能夠提高算法的收斂速度、改善聚類結果的質量,并且對異常值具備一定抗干擾能力。將提取的評價維度表征詞匯作為輸入,對指定數目簇的評價維度表征詞匯進行概括,得到服裝產品具體評價維度。Word2vec模型實現詞匯到詞向量間的轉換。
2.2 消費者評論情感分析
本文以各個產品評價維度的權重、情感積極率和待改進度為基礎,對在線評論進行情感分析來獲得消費者對羽絨服的消費需求,進而對該類服裝設計和生產提出優化建議。根據各維度在評論集中被提及概率、每個評論中維度情感傾向和整體情感傾向的一致性來計算各維度對整體情感傾向影響的權重值,以此來衡量消費者對各維度的關注情況[17]。根據各維度正面傾向出現頻次計算得到的情感積極率來衡量消費群體對于各維度的滿意程度。產品待改進度由產品維度關注度和滿意程度決定,待改進度越大,產品越需要改進。
維度在評論中被提及的概率計算公式:
式中:ax為第i條評論語料中存在的第x個維度,Fx為維度ax在評論中被提及的概率,R為評論集的元素數量,A為評論維度數量,在聚類分析過程中得到一級維度數量為3、二級維度數量是10。
維度情感與評論整體情感傾向的一致性計算公式:
式中:Cx表示維度情感傾向與評論整體情感的一致性,siax代表ri在維度ax上的情感,si代表評論ri的整體情感,siax=si時代表兩者情感傾向一致,此時eq(siax, si)取值1,反之取值0。
維度權重的計算公式:
Wx=Fx×Cx(3)
式中:Wx為維度ax的權重值。
維度情感積極率的計算公式:
式中:Sx為維度ax的情感積極率,siax =5時代表ri在維度ax上的情感傾向為積極,此時pos(siax)取值1,反之取值0。
維度待改進度計算公式:
Px=Fx×Sx(5)
式中:Px為維度ax的待改進度。
3 實驗過程
3.1 數據收集
俄羅斯電商平臺Wildberries上的冬季服裝包括羊皮大衣、羽絨服、人造毛皮大衣、天然毛皮大衣、皮草大衣等,其中羽絨服商品總量較其他商品更多,并且在人氣銷量排行前一百排名中羽絨服占據了62%,綜上選取40件評論數量均在1000條以上的羽絨服商品作為本文的主要研究對象。通過爬蟲程序,共獲得了61701條商品的基本信息和在線評論。
3.2 評價維度提取
自然語言處理工具包(Natural language toolkit,NLTK),是在自然語言處理領域中較為常用的Python庫,使用NLTK對獲取的評論數據進行文本預處理,包括文本切分、去停用詞等。對評論內容做預處理后,以詞匯為基本單位做TF-IDF高頻詞匯提取,在程序中設置詞頻從高到低排序,提取出詞頻排名前300的詞匯作為評價表征詞匯。將61701條評論送入Word2vec連續詞袋模型進行訓練,min_count設置為205,可過濾掉次數較少的詞匯減少模型大小和計算復雜度。表征詞匯對應的詞向量經過主成分分析(Principal component analysis,PCA)進行向量降維,利于高維數據處理和聚類數據可視化。將低維向量作為K-means++算法輸入,當k=3時,每簇表征詞匯對應羽絨服裝產品的3大評價維度:產品質量、產品外觀、服務質量。聚類效果如圖2所示,橫縱坐標對應PCA降維后的詞匯向量在二維空間中第一主成分和第二主成分,主成分可視為數據集中的主要方向,數值越大表明與主要方向的相關性越強,相似的詞匯在二維空間中更接近;圖中紅色對應每簇的中心點,黃色代表產品質量,淺綠色代表產品外觀,紫色代表服務質量。
根據每簇詞匯的具體內容還可對評價維度進一步細分作為二級評價維度。其中:產品質量可細分為合身度、面料質量、性價比、社會反饋以及保暖性;產品外觀可細分為顏色、款式、風格;服務質量可細分為物流服務和客戶服務。各級維度對應的表征詞匯如表1所示。
3.3 人工數據標注
將獲取的40件羽絨服產品以價格區間分3類,從每個價格區間中各選取兩件銷量和評論數量均較高的羽絨服案例產品。6件產品總共評論量為8222
條,對其進行人工標注,標注規則為:維度情感傾向和評論整體情感傾向分為負面、中性、正面,分別用數字1、3、5來進行對應標注,評論中未提及的維度不予標注。選取的案例產品信息如表2所示。
4 消費者需求分析
4.1 評價指標分析
所選在線評論示例如表3所示,人工數據標注結果示例如表4所示。根據人工數據標注的結果,結合維度情感積極率的計算公式可得到產品各級維度的情感積極情況,具體如表5所示。
根據公式計算出各維度的權重值和各維度的待改進度,具體數據如表6所示。權重值越大代表該維度對整體情感傾向的影響越大,由此可以得出各級維度中相對重要程度的排名情況。
通過表5、6的數據可直觀得到以下內容:
在一級維度中,產品質量、產品外觀、服務質量的維度權重分別為0.8522、0.1178、0.0299。由此得知:在一級維度中對消費者滿意情況影響最大的是產品質量,其次是產品外觀和服務質量;產品質量的待改進度要明顯大于其他兩維度;從情感積極率可看出消費者對一級維度均較滿意,對產品外觀的滿意情況要略高于其他兩個。
產品質量的二級維度中對消費者滿意情況影響最大的是合身度,保暖性是羽絨服最重要的服裝特性,但在影響程度的排名僅占據第三,影響程度最小的是性價比;表5中各產品合身度的情感積極率和表 6合身度的綜合情感積極率以及待改進度可以看出合身度未能很好地滿足消費者的需求,需要進一步改進。
在產品外觀中對消費者滿意情況的影響程度最大的是顏色,其次是風格和款式;顏色的情感積極率要略低于其他維度,且待改進度較高。
現代網絡消費與傳統消費在服務質量方面相比多了物流服務,但消費者相比較于物流服務更重視客戶服務,并從表5、表6可看出客戶服務基本滿足消費者需求,但物流服務未能滿足消費者的需求。
針對上述對表中數據直觀得出的信息進行分析,合身度未很好地滿足消費者需求的原因有:商家提供尺碼的數量較少,消費者未能找到適合自己尺碼的服裝;選擇到適合自己的尺碼,但在實際穿上后發現不合身,尺碼描述與實際不相符;客服人員在發貨的過程中發錯尺碼,導致不合身。保暖性未在很大程度上影響消費者滿意情況的原因:保暖性相對于其他服裝特性不夠突出,導致俄羅斯消費者對其他方面的關注要高于保暖性。
造成顏色維度情感積極率較低和待改進度較高的情況的主要原因有:產品顏色數量較少,找不到心儀顏色;圖片上服裝顏色與實際相差較大;實際穿著效果與理想預期差距較大。
物流服務和客戶服務待改進度較高的原因有:送貨時間與平臺預計送達的時間不符;收到的快遞包裝不完整有破損等;客服人員的售前和售后服務未滿足消費者的需求。
4.2 產品改進建議
通過觀察案例產品信息中尺碼數量,再結合表5中各產品情感積極率,可發現尺碼數量少的產品合身度的滿意度較低。在接下來的服裝生產過程中,可以適當增加尺碼的數量為消費者提供更多選擇,另外商家應提供更詳細的尺碼信息,從而改善消費者的合身度體驗。當然,在保證合身度體驗的同時,也要注重服裝的保暖性,發現并使用更優質的填充物,為消費者提供良好的保暖性體驗。
在產品外觀方面,通過觀察表2和表5中顏色部分數據,可發現顏色數量在一定程度上影響著顏色維度的滿意度,顏色數量較多的兩件產品的滿意度明顯要高于其他產品。在服裝設計和生產過程中可以嘗試對服裝的顏色進行創新,豐富色彩設計增加可供選擇的顏色數量,同時也要減少產品色彩展示與實際的色差。
在服務質量方面,物流服務的滿意度較低,應嚴格規范貨物送達的時間,并且避免在過程中損壞貨物,提高物流服務的同時也應注意客戶服務質量,可以培養專業的客戶服務人員,為消費者提供良好的線上購物體驗。
5 結論
本文對Wildberries平臺中61701條羽絨服的在線評論進行高頻詞匯提取,通過K-means++算法得到3個一級消費者評價維度、10個二級評價維度,以維度權重、情感積極率和待改進度為評價指標來獲得消費者對羽絨服的消費需求。結果表明:在一級維度中對消費者滿意情況影響最大和最需要改進的為產品質量,情感積極率較差的是服務質量;在二級維度中對消費者滿意情況影響最大的是分別是合身度、顏色、客戶服務,最需要改進以及情感積極率差的分別是合身度、顏色、物流服務。通過分析評價維度未能滿足消費需求的原因,為改進產品設計和生產提供改良建議,為從業者設計滿足不同消費群體需求的產品提供依據。
在未來的研究中,為更詳細地了解羽絨服消費者需求的全部特征,可以進一步擴充數據集并將其納入訓練樣本中;為更有效地利用數據,可以采用深度學習技術對評論進行分析,自動提取關鍵詞和主題,快速識別消費者的偏好和反饋。
參考文獻:
[1]趙剛. 新疆紡織服裝業出口貿易的發展現狀、問題及對策[J]. 全國流通經濟, 2020(15): 39-40.
ZHAO Gang. Development status, problems and countermeasures of export trade
of textile and clothing industry in Xinjiang[J]. China Circulation Economy, 2020(15): 39-40.
[2]伊戈爾. “一帶一路” 背景下中俄石油貿易的發展現狀及對策研究[D]. 哈爾濱: 哈爾濱師范大學, 2020: 30-31.
YIGEER. The Development Status and Countermeasures of Sino Russian Oil Trade under the Background of \"The Belt and Road\"[D]. Harbin: Harbin Normal University, 2020: 30-31.
[3]馬琳. 中國服裝出口俄羅斯市場的問題研究[D]. 蘇州: 蘇州大學, 2019: 16-19.
MASTIAEVA M. A Study on the Chinese Garment Export to the Russian Market[D]. Suzhou: Soochow University, 2019: 16-19.
[4]赫勒拿. 俄羅斯輕工業結構研究[D]. 西安: 西安石油大學, 2019: 1-4.
DORZHIEVA A. Research on the Structure of Russian Light Industry [D]. Xi'an: Xi'an Shiyou University, 2019: 1-4.
[5]АЛЕКСАНДРОВА Е Н, БЕЗНОСОВ А А. Маркетинг Как Основа Эффективной Деятельности Современных Маркетплейсов[J]. Международный Журнал Гуманитарных И Естественных Наук, 2022, 3:115-118.
[6]ВАРЛАМОВА ДАРЬЯ ВАДИМОВНА, БАРАБАНЩИКОВА ИРИНА ИГОРЕВНА, ХАКБЕРДИЕВА ШАХРИЗА БАГТЫЯРОВНА. Оценка качества Интернетмагазинов На Примере Wildberries и Ozon[J]. Практический Маркетинг, 2021, 5: 30-35.
[7]趙楊, 李齊齊, 陳雨涵, 等. 基于在線評論情感分析的海淘APP用戶滿意度研究[J]. 數據分析與知識發現, 2018, 2(11): 19-27.
ZHAO Yang, LI Qiqi, CHEN Yuhan, et al.
Examining consumer reviews of overseas shopping APP with sentiment analysis[J]. Data Analysis and Knowledge Discovery, 2018, 2(11): 19-27.
[8]董婧, 范全潤, 張順吉. 突發重大公共衛生事件情境下的微博文本情感分析[J]. 內蒙古師范大學學報(自然科學版), 2022, 51(5): 489-493.
DONG Jing, FAN Quanrun, ZHANG Shunji. Research on microblog sentiment analysis in public health emergency[J]. Journal of Inner Mongolia Normal University(Natural Science Edition), 2022, 51(5): 489-493.
[9]柴源. 基于LSTM和Word2Vec的圖書評論文本情感分析研究[J]. 信息技術, 2022,46(7): 59-64.
CHAI Yuan. Research on sentiment analysis of book review text based on LSTM and Word2vec[J]. Information Technology, 2022,46(7): 59-64.
[10]王繼成, 孫穎, 張福炎. 文本挖掘-數據挖掘研究的新課題[J]. 蘭州大學學報(自然科學版), 1999,35(S1):314-318.
WANG Jicheng, SUN Ying, ZHANG Fuyan. Text mining: A new research issue of data mining[J]. Journal of Lanzhou University(Natural Sciences), 1999,35(S1):314-318..
[11]李彤彤, 郭栩寧, 周彥麗, 等. 新冠肺炎疫情下大學生情感狀態及其影響因素分析:基于微博文本挖掘的證據[J]. 開放學習研究, 2022, 27(5): 43-52.
LI Tongtong, GUO Xuning, ZHOU Yanli, et al. College students' emotion state and its influencing factors under COVlD-19: Evidence from Micro-blog mining[J]. Journal of Open Learning, 2022, 27(5): 43-52.
[12]SASTRE J, VAHID A, MCDONAGH C, et al. A text mining approach to discovering COVID-19 relevant factors[C]. IEEE International Conference on Bioinformatics and Biomedicine(BIBM). Seoul, Korea (South). IEEE,2020: 486-490.
[13]劉壯, 劉暢, Wayne Lin, 等. 用于金融文本挖掘的多任務學習預訓練金融語言模型[J]. 計算機研究與發展, 2021, 58(8): 1761-1772.
LIU Zhuang, LIU Chang, WAYNE Lin, et al. Pretraining financial language model with multi-task learning for financial text mining[J]. Journal of Computer Research and Development, 2021, 58(8): 1761-1772.
[14]王克勤, 毋鳳君. 面向產品設計改進的在線評論挖掘[J]. 計算機工程與應用, 2019, 55(19): 235-245.
WANG Keqin, WU Fengjun. Online reviews mining for product design improvement[J]. Computer Engineering and Applications, 2019, 55(19): 235-245.
[15]張冰潔, 王莉, 傅維杰, 等. 滑雪內衣差異化需求多維度分析[J]. 紡織學報, 2021, 42(8): 161-166.
ZHANG Bingjie, WANG Li, FU Weijie, et al. Multi-dimensional analysis of differentiation demands for ski underwear[J]. Journal of Textile Research, 2021, 42(8): 161-166.
[16]劉娜娜, 張強. 基于電商平臺的消費者需求及產品數據挖掘技術分析[J]. 內蒙古統計, 2019(1): 38-41.
LIU Nana, ZHANG Qiang. Analysis of consumer demand and product data mining technology based on e-commerce platform[J]. Inner Mongolia Statistics, 2019(1): 38-41.
[17]趙志濱, 劉歡, 姚蘭, 等. 中文產品評論的維度挖掘及情感分析技術研究[J]. 計算機科學與探索, 2018, 12(3): 341-349.
ZHAO Zhibin, LIU Huan, YAO Lan, et al. Research on dimension mining and sentiment analysis techniques for Chinese product comments [J]. Journal of Frontiers of Computer Science and Technology, 2018, 12 (3): 341-349.
Consumer demand for down jackets in Russia based on cross-border e-commerce
KANG Lei, ZHANG Yu
(School of Textiles and Clothing, Xinjiang University, Urumqi 830046, China)
Abstract: "In the history of bilateral trade in China and Russia, Russia has always been an important export market in China. Because of the geographical location of Russia, its people have high demand for winter clothing products. In this context, Chinese suppliers provide more targeted high quality winter clothing for the Russian clothing market, which will further promote the development of bilateral clothing trade. However, in the field of domestic consumer demand research, most of the research targets are domestic consumers, and foreign consumers are in the minority.
To promote the development of the foreign trade clothing industry in China and Russia, and effectively guide domestic companies to enter the reverse custom production model, this article used the Russian e-commerce platform Wildberries as the source of data to obtain online comments from down jacket clothing products. After preprocessing online comments, the article used the high frequency vocabulary extraction and cluster algorithm to extract consumer evaluation dimensions from it, obtaining three primary evaluation dimensions, and ten secondary evaluation dimensions. During the analysis of consumer demand, sentiment analysis was conducted on the manually annotated online comment dataset through three indicators: consumer evaluation dimension weight, emotional positivity rate, and to-be-improved progress, ultimately obtaining feedback information from clothing consumers. The results indicate that product quality has the greatest impact on the overall emotional orientation of consumers in the primary dimension, followed by product appearance and service quality. In terms of product quality, although warmth retention is the most important clothing characteristic of down jackets, it ranks only third in the overall emotional tendency of consumers; fit ranks first and it is the one that needs to be improved the most. Among the other secondary dimensions, color and customer service have the greatest impact on the overall emotional orientation of consumers, and they both need to be further improved. In the future, China's foreign trade clothing enterprises should not only increase corresponding sizes in the design and production process, but also consider consumer preferences for colors and warmth needs. Sales parties should pay attention to improving customer service quality in the service provision process to enhance consumer satisfaction, so as to facilitate domestic enterprises to enter the reverse customization production mode and promote the development of bilateral trade.
In future research, in order to use data more effectively, deep learning technology can be used to automatically analyze online reviews, efficiently and accurately extract keywords and themes, and identify consumer preferences and feedback. In the meantime, it is necessary to expand the dataset and incorporate it into the training sample, so that we can better understand the all characteristics of the demand for down jacket consumers.
Keywords: cross-border e-commerce; text mining; online review; emotion analysis; consumer demand