求文星,李 超
(安徽財經大學 統計與應用數學學院,安徽 蚌埠 233030)
隨著人工智能技術的發展,以現代化工業為主要依托的機器人技術越來越多地應用于軍事國防、科教文娛等領域,形成獨立學科,一個智能機器人改變制造模式和生活模式的時代已經到來。人工智能對各行各業都有重要應用,學者對于智能機器人的發展前景普遍持樂觀態度,認為其發展方向多維且潛力巨大。楊娟、陳小紅[1]等認為,智能機器人市場需求持續增加,機器人與信息技術深度融合,向模塊化、智能化和系統化方向發展;石征、吳難[2]等認為,機器人性能將不斷提高,控制系統不斷完善,傳感器融合技術不斷成熟,向著仿生性方向發展。
本文通過對智能機器人國內、安徽省發展現狀以及相關研究的梳理[3~5],以供給和需求作為切口,通過實地問卷調查和網上數據爬取,采用機器學習的方法,進行線上線下家用智能機器人消費研究。具體而言,線下主要針對安徽省蚌埠市區居民,調查其對家用智能機器人消費意愿和需求類型;線上主要針對大型網購平臺京東商城的消費數據,分析現階段家用智能機器人熱銷類型及體驗評價,為相關企業、研發部門有關家用智能機器人的種類研發、功能探索提供一定借鑒,打造更好的智能家居生活服務,以滿足人民日益增長的中高端消費和個性化消費等消費升級需求。
1.調查對象
問卷調查主要針對蚌埠市區(不包括三縣)四個區12個鄉、鎮、街道市民,采用區域分層取樣與多階段抽樣中的三階段抽樣相結合的抽樣方法,根據預調研有效問卷回收率90%,并結合實際的調查情況和團隊的人力物力資本,以及理論計算所得的樣本容量410份,考慮問卷損壞、無效等人為因素,確定最終問卷量為450份。在調查過程中已進行人為篩選,主動挑選對家用智能機器人感興趣的人群進行訪問。
網購數據主要是從最大的網購平臺之一——京東商城,以“家用智能機器人”為關鍵詞爬取相關商品信息,共4 082個產品,228 960條評論。
2.調查方法
此次調查主要采取線上線下相結合的方式,并根據各階段不同目標運用四種調研方法。具體調查方法如下:(1)文案調研。為了解當代最新家用智能機器人類型、功能[6~18],在中國知網、維普等中、外文檢索庫中,搜索與之相關的文獻,進行研讀總結,得出研究框架并設計問卷。(2)預調研法。為減小誤差和保證問卷具有較好的信度和效度,采取街頭攔截面訪。結合調查中出現的問題、受訪者建議對問卷進行修改完善,以確定最終問卷。(3)實地調研。為保證研究的真實有效性,調查主要采取實地訪談。按各區域樣本量的分配,在公共場所隨機攔截志愿者做訪問。(4)數據爬蟲。為了解全國消費者對家用智能機器人的消費需求,綜合考慮各種因素,選取了較具代表性的京東網購平臺,爬取相關數據,進行整理分析、歸納總結,作為對實地調研的重要補充。
3.數據整理
采用機器學習方法“決策樹”填補缺失值,并利用信度檢驗和效度檢驗來檢測問卷設計的合理性。通過相關統計軟件的計算,克朗巴哈系數為0.920,KMO值為0.716,Bartlett檢驗的p值為0.000<0.05,說明此次調查問卷信度較好,具有結構效度。
1.樣本概況
表1樣本基本情況分布表

受訪對象中女性稍多于男性,女性通常在家居配置方面擁有更多的決策權,因此側重于考慮女性的意見;主要的年齡群體為21-30歲,該群體將會是家用智能機器人消費的主力軍;婚姻情況中,大部分家庭構成較為龐大,對家居服務有更多元化的需求;調查對象整體學歷水平較高,符合社會現階段及未來的發展趨勢;關于職業,就業者和即將就業的學生達90%;居住狀況中,大部分屬于大家庭生活。由此可見受訪群體都比較貼合本次調研的要求。
2.消費意愿

圖1 線下購買意愿圖
此次調查中(如圖1),僅有28.04%的受訪群體表明有購買意愿。由于調查設于經濟水平較低的蚌埠市,群眾對家用智能機器人的消費潛力有待挖掘,此意愿分布亦符合實際情況。為進行各省市家用智能機器人潛在消費能力推廣探索,以調查中的個人屬性、家庭屬性和了解情況三個大類9項細化指標作為自變量,消費意愿作為因變量,構造預測模型。采用logistic回歸、決策樹、隨機森林和支持向量機以及混合模型等機器學習方法進行模型構造,擇其最優,并篩選影響顯著的因素。混合模型是指綜合決策樹、隨機森林和支持向量機三個模型,以少數服從多數的規則來確定預測結果。
五類模型預測準確率見表2:

表2 預測準確率結果表
所有模型中,隨機森林模型的預測效果是最好。同時,探究對隨機森林模型預測效果影響最大的因素。

圖2 消費意愿的隨機森林模型影響因素
影響因素分析圖中分別顯示了mean decrease accuracy和mean decrease gini兩個指標值。mean decrease accuracy是直接測量每種特征對模型預測準確率的影響,指標值越大,影響越大。mean decrease gini是基于節點不純度降低的特征選擇,該值越大表示該變量的重要性越大。從消費意愿的隨機森林模型中,可知,“性別”的兩指標值均最大,說明“性別”是所有變量中最重要的,同時也是對預測準確性影響最大的。“戶籍”的mean decrease accuracy指標值最小,即“戶籍”對模型預測準確性影響最小;“職業”的mean decrease gini值最小,即重要性程度最低。
3.需求類型

圖3 線上線下需求類型對比條形圖
對比線上線下的需求類型(如圖3),線上主要消費類型為兒童陪伴型;線下主要需求類型為家政服務型,其他類型占比相對均衡。線下數據主要表現了受訪對象想要購買的機器人類型;而線上數據則表明,在實際購買時,消費群體往往選擇購買兒童陪伴型機器人,對比可得,大眾群體往往更愿意為孩子花錢。
以相同的細化指標作為自變量,對需求類型(選擇哪一類型機器人)分別構造五類預測模型。預測準確率見表3:

表3 預測準確率結果表
隨機森林模型的預測效果最好,進行影響因素分析。由于文章篇幅有限,整理六類家用智能機器人隨機森林模型的關鍵因素(見表4)。兒童陪伴型和教學輔導型,“婚姻狀況”因素對預測效果影響較大,重要程度最高,“收入”的影響程度較低,“戶籍”的重要性最低。老人陪伴與看護型和殘助型均是“居住狀況”因素影響最大,重要性較高,其中老人看護型模型是“戶籍”影響程度最低,最不重要,而殘助型則是“了解程度”影響最小,最不重要。住宅安全與監視型和家政服務型,“年齡”影響最大,較重要,“戶籍”影響最小,最不重要。
表4隨機森林模型關鍵因素表

4.體驗評論
對于網購數據的體驗評價,采用文本分析。關于網購評價的詞頻共現(見表5),與“機器人”關聯最緊密的詞匯為“智能”“學習”“功能”;與“質量”“功能”“服務”“物流”聯系最緊密的詞匯均為積極詞匯,網購群體大部分認為現階段消費的智能機器人質量較好,功能強大、齊全,客服熱情周到,物流比較快、很給力。

表5 評論詞頻共現表

圖4 評論詞云圖
對所有的消費評論進行刪除停用詞、提取關鍵詞、繪制詞云圖(如圖4),發現好評居多,均為積極評價詞,還有一些“愛不釋手”“齊全”“豐富”等體驗評價,都體現了家長和孩子對兒童陪伴型智能機器人非常滿意。
5.未來展望
采用主題建模和情感分析對問卷中未來展望的主觀題進行文本挖掘。對于問卷中“對智能機器人未來十年的發展看法”的主題建模,概括得出如下三個主題(見表6):一是人類社會在不久將來是智能時代,機器人的使用會更常見;二是人們對科技的發展有一定的需求;三是人也將越來越懶。

表6 未來展望主題詞

圖5 理由詞頻條形圖
情感分析中(如圖5),頻數最大的十個詞匯中,“不夠”“難題”“未知”三個消極詞均出現兩次,“成熟”“成為”“發達”“發展”“進步”“希望”和“迅速”七個積極詞匯,“發展”出現六次,“發達”和“進步”出現四次,其余均出現兩次。無論從積極詞、消極詞占比,還是從兩類詞出現次數,都表明受訪對象對家用智能機器人未來發展持積極的態度。
本次市場調查分線上線下兩部分,線下以蚌埠市區居民為調查對象,從消費需求的角度探索了關于家用智能機器人的消費意愿、需求類型和未來展望,線上以智能機器人網購數據為分析內容,從供給市場角度探索了現階段的智能機器人市場、熱銷機器人類型、產品體驗評價等。基于本文分析,提出幾點相應的建議:
第一,現階段實地調查中最愿意購買的是家政服務型機器人,而網購數據顯示購買最多的是兒童智能陪伴型機器人。目前智能機器人市場總需求大但有效需求不足,由于現有產品智能化程度不夠,功能類型單調,人機交互體驗效果不佳,企業研發部門急需突破技術瓶頸,可以針對以上的技術瓶頸采取些許有效措施。
第二,所有機器學習方法構建的預測模型中,隨機森林模型的預測效果最好。可進一步將預測效果最好的隨機森林模型推廣應用于全國各省市,預測全國各地的各類家用智能機器人的有效需求,為企業市場部門提供一定的參考,進一步擴大市場。
第三,企業銷售部門可參考隨機森林模型的重要影響因素,從用戶需求個性化、創新化、多樣化等特點出發,加強對智能機器人行業的知識學習,加大市場調研的深度與廣度,提高產品與需求之間的匹配度,深刻把握市場動向,推陳出新。
第四,人們對智能機器人未來發展大多持積極看好的態度,認為存在較大的市場需求。政府部門應當高度重視智能機器人產業的發展,根據設定的戰略目標制定相關政策,提供有效的市場監管和安全保障,加大對相關產業的投資和扶持力度,完善與新興企業間的溝通機制,打造開放高效的協同體系。