




摘要:隨著科技的飛速發(fā)展,機器人逐漸走入普通家庭,輔助完成幼兒早教、老人陪伴等功能,但因品種眾多,功能繁雜,質量參差不齊,普通用戶無法理性判斷并做出選擇。另外,產品銷售后,商家和廠家距離用戶較遠無法獲得產品反饋信息,阻礙了產品的持續(xù)改進。針對以上問題,本文通過Python 網絡爬蟲技術,采集京東商城家庭用機器人的用戶評論數據,通過中文分詞、情感分析等進行數據分析并對結果可視化展示,以方便用戶快速理解商品優(yōu)劣,做出理智選擇。同時也為產品性能迭代和服務提升提供了寶貴的參考依據。
關鍵詞:家庭用機器人;用戶評價;爬蟲技術;情感分析
中圖分類號:TP393 文獻標識碼:A
文章編號:1009-3044(2025)06-0079-04 開放科學(資源服務)標識碼(OSID):
0 引言
我國作為新晉的老齡化人口大國,陪伴機器人備受市場青睞,市場前景廣闊[1],同時越來越多的幼兒早教機器人進入普通家庭,擔任起教育和陪伴的角色。廠家和商家都需及時了解用戶對家庭用機器人產品的反饋和服務滿意度情況,對促進產品功能迭代、售后服務和市場營銷具有重要意義。同時用戶購買前也需了解各種商品性能、特點,以選擇最適合的機器人。此時用戶評論便成為第一手數據,網絡爬蟲、中文信息處理、文本情感分析、數據可視化等技術為數據增值提供有效幫助。京東商城作為優(yōu)秀的電子商務平臺之一,匯聚著海量的商品和海量的用戶,以及用戶的瀏覽、點擊、加入購物車、購買的行為數據和商品評論數據。這些數據不僅反映了市場的需求、商品的優(yōu)劣、用戶的喜好,還能為產品升級、商業(yè)決策、用戶選擇提供支持。
本文以京東商城中某款家用機器人產品的用戶評論文本數據為研究對象,通過Python語言編程分別實現網絡爬蟲采集評論信息、數據預處理、中文分詞、文本情感分析和數據可視化,探索商品評論數據對功能升級迭代和服務質量提升、幫助用戶決策中的應用價值。
1 商品評論數據采集
1.1網絡爬蟲原理
網絡爬蟲技術是指按照一定的規(guī)則,自動抓取互聯網信息的程序或是腳本[2],用于互聯網信息收集和后續(xù)分析處理。它模擬人類用戶在瀏覽器中的行為,訪問網頁并提取有用數據。網絡爬蟲的執(zhí)行過程如圖1所示,首先爬蟲模擬瀏覽器向目標網頁服務器發(fā)送HTTP請求,服務器收到請求后并做出HTTP響應;然后網絡爬蟲將收到的響應數據進行解析,提取有效信息以及URL鏈接;最后將解析后的數據存儲到文件中。盡管網絡爬蟲功能強大,但使用時需遵守法律法規(guī)和道德規(guī)范,確保數據安全和用戶隱私保護,需要尊重網站的使用條款,遵守網站設定的爬取規(guī)則,避免對網站造成巨大的訪問壓力。
1.2 數據采集實現
網絡爬蟲庫是網絡爬蟲數據采集框架的核心模塊,主要用于獲取和解析網頁數據[3]。具體實現過程如下:
1)導入模塊,requests 庫用于發(fā)送HTTP 請求,pandas庫用于數據處理,JSON庫用于解析JSON數據,Threading庫用于實現多線程爬取,random庫用于隨機化請求頭和控制請求間隔。
2)定義run函數,負責單個線程的爬取工作。
3)構造URL用于發(fā)送請求并解析數據,每次請求后,進入短暫休眠時間。
4)定義save_info 函數將抓取到的數據轉換成DataFrame結構,并保存到Excel文件中。
5)定義main函數,創(chuàng)建并啟動四個線程,每個線程分別負責處理不同數據,并發(fā)執(zhí)行,整體加快數據爬取的速度。
6)在主程序入口輸入商品ID,并初始化全局變量Lis,調用main函數開始爬取。
為避免爬蟲程序過于頻繁地訪問頁面而被拒絕服務,使用Random庫生成隨機User-Agent字符串,用于模擬不同瀏覽器發(fā)起的請求,調用Threading模塊中的threading.Thread類創(chuàng)建線程對象,采用target參數指定線程執(zhí)行的函數,args參數傳遞給目標函數。線程啟動時調用線程對象start( )方法,使用join( )方法實現線程同步。
在京東商城主頁以家庭用機器人中的“幼兒早教及陪伴機器人”關鍵詞進行搜索,選擇購買量較大、評論數據較豐富的商品,點擊篩選標簽確定某款幼兒早教或陪伴機器人商品后,商品界面中地址欄里對應商品的ID,如圖2所示。運行爬蟲程序,輸入商品ID,商品頁面的URL 地址為https://item.jd.com/100002./+#comment,編程實現指定爬取京東商城機器人商品的所有用戶評論信息。
3 數據分析及可視化
數據可視化部分分別調用Matplotlib庫繪制餅狀圖,Wordcloud庫構建詞云圖。詞云是一種用來展示詞匯出現頻率的圖形[8]。
為統(tǒng)計用戶評論的積極、消極及中性詞語,大致理解用戶的總體評價情況,做了如下設置,當某個詞匯的情感值等于0.5時,將其歸類為積極詞匯,這些積極詞匯如“滿足”“喜悅”等。當情感值等于0.5時,該單詞則被劃分為中性詞匯,中性詞匯沒有明顯的感情色彩傾向,更多地則是以客觀的方式表達信息。當情感值小于0.5時,該單詞則被判定為消極詞匯,如“恐懼”“笨重”和“厭煩”等,在人們的日常交流中通常扮演著次要角色,用于表達負面情緒。
定義三個列表pei_5_10、pei_5 和pei_0_5,分別存儲積極、中性和消極的詞語。根據情感得分將詞語分類到這三個列表中。Matplotlib庫中設置圖形屬性確保中文顯示正確,默認的字體為Microsoft YaHei。使用plt.pie() 函數繪制餅狀圖,通過x=[len(pei_5_10),len(pei_5), len(pei_0_5)]指定每個類別的數值,使用ex?plode=[0.1, 0, 0]設置第一個類別(積極)突出顯示,百分比的顯示格式為保留兩位小數,最后使用plt.save?fig() 保存餅狀圖。藍顏色代表積極詞匯,占比為85.55%,說明市場上大部分陪伴機器人商品能夠得到用戶青睞,在模型設計和功能上,符合用戶審美以及預期效果;橙黃色代表中性詞匯,占比為6.75%,說明小部分商品也能夠滿足用戶的使用;綠色代表消極詞匯,占比為7.70%,說明部分商品給予用戶的服務不滿意度較高,在市場上,該類商品的提升空間也較大,需改善的方面也較多。如圖4所示。
另外,除了統(tǒng)計用戶的大致評論情感,還需要了解用戶對產品的哪些方面最滿意,哪些方面問題最大,所以對積極和消極的極性進行極化,并根據出現的詞頻,構建詞云圖,直觀明了表現優(yōu)劣特點。極性做如下假設:如果某個詞匯的情感得分大于0.9,則認為是明顯的正面情感,劃分為積極詞匯;如果某個詞匯的情感得分小于0.1,則認為是明顯的負面情感,劃分為消極詞匯。
積極詞匯詞云圖如圖5所示,“陪伴”“信賴”“貼心”“功能齊全”“物超所值”“成長”“古詩詞”等詞匯充分說明,幼兒早教及陪伴機器人緊密貼合用戶的日常需求。“陪伴”“貼心”“成長”等是設計靈魂,在快節(jié)奏社會中顯得珍貴,以其獨特存在為用戶帶來溫暖。“信賴”體現了對服務的高度認可,源于產品性能與貼心服務。考慮到產品主要的面向對象是老年人和兒童,人機交互的重要性不言而喻,所以幼兒早教及陪伴機器人的操作界面既簡潔又直觀,讓用戶能夠快速掌握操作方法。增強用戶的滿意度和信賴感。“小巧”考慮便攜性,方便用戶攜帶與靈活使用。“物超所值”“一流”贊譽人工智能技術賦能產品,提升了性能與智能高效的體驗。“語文”“古詩文”體現了陪伴機器人的主要設計功能,也說明了用戶的需求取向。
同時,消極詞匯詞云圖如圖6所示,揭示了家庭用機器人商品存在的一些問題和有待改進的方面。其中,“監(jiān)控”是最大的問題,掩蓋了陪伴的本質,存在數據安全和隱私保護潛在風險,用戶無法接受。“刺耳”“再大點”“遙控器”“機械”等詞匯,直觀地反映了用戶體驗上的感受,與用戶交流時顯得生硬和機械,依賴手動操作,音質不夠和諧,聲音對老年人來說較小,與“陪伴”這一核心任務相悖。“英文字母”說明不能很好地滿足老年人的需求,“不經用”“弄臟”也是在外觀和材質上提出了更高的要求。客服服務存在不足,影響購物體驗和品牌信任度。部分幼兒早教及陪伴機器人在,聲音控制和操作界面設計也需要改進,其聲音應當輕柔,避免產生噪聲干擾用戶的生活;操作界面文字應以中文為主,確保用戶能夠輕松理解并使用。
如圖5所示。
綜上所述,幼兒早教及陪伴機器人以其卓越的性能、貼心的服務以及人性化的設計,贏得了用戶的廣泛贊譽和喜愛。雖然家庭用機器人幼兒早教、老人陪伴領域具有廣泛的應用前景,但在隱私保護、用戶體驗、人機交互、客戶服務等方面仍有很大的提升空間。廠商可通過詞云圖及時掌握產品問題,不斷優(yōu)化產品設計,提高用戶服務。
4 總結
本文首先分析了幼兒早教及老人陪伴等家庭用機器人的市場需求,采用網絡爬蟲技術采集京東商城中商品的用戶評論,經過中文分詞和情感分析技術對評論數據進行分析和,最終通過餅圖和詞云圖對數據進行可視化,為用戶提供購買決策,直觀為廠家和商家反饋用戶體驗信息,尤其是揭示了用戶對該類產品的意見建議。研究結果受限于數據來源的單一性,可能不足以代表更廣泛的情況。我國《新一代人工智能發(fā)展規(guī)劃》強調,要大力發(fā)展智能教育,構建包含智能學習、交互式學習的新型教育體系,并指明將人機協(xié)同增強作為人工智能發(fā)展的重點之一[9]。人機交互越發(fā)全面深入,人機關系也從人機分離向人機融合發(fā)展。正如凱文·凱利在《失控》一書中所說:“機器,正在生物化;而生物,正在工程化。”完善幼兒早教及陪伴機器人的人性化交互設計和售后服務可以最大程度上滿足用戶需求,根據提供的建議來進一步完善幼兒早教及陪伴機器人,使其更加智能化,有利于提升幼兒早教及陪伴機器人的實用性,從而提高市場競爭力。