999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

產品用戶評論在企業競爭情報中的應用——基于產品特征的關聯規則數據挖掘

2015-04-11 05:31:00吉順權
現代情報 2015年6期
關鍵詞:數據挖掘企業

吉順權 周 毅

(蘇州大學社會學院,江蘇?蘇州 215123)

產品用戶評論在企業競爭情報中的應用——基于產品特征的關聯規則數據挖掘

吉順權周毅

(蘇州大學社會學院,江蘇?蘇州 215123)

〔摘要〕在總結用戶評論相關研究的基礎上,提出關聯規則理論在用戶評論挖掘中的作用,包括可以用來挖掘產品的優劣勢特征及其程度大小,以及挖掘影響產品整體評價的關鍵特征。提出了基于產品特征關聯規則數據挖掘的企業競爭情報應用模型,包含確定用戶評論情報源及其采集、數據預處理及其產品特征提取、數據結構化處理及其關聯規則分析和產品優劣勢特征及其關鍵特征的對比分析四個模塊。最后通過實驗論證了這一模型的價值。

〔關鍵詞〕企業;用戶評論;產品特征;關聯規則;數據挖掘;競爭情報

產品用戶評論是用戶從自我體驗或自我感知角度對某產品的優點、缺點、性能、價值、使用滿意度等方面所發表的意見或態度,從用戶角度反映產品特征的優劣。隨著交互網絡和電子商務的發展與成熟,關于產品的用戶評論數量正在急劇增長,作為開放的信息資源,用戶評論逐漸受到電商賣家、產品企業和同行競爭企業的關注。基于用戶評論的口碑營銷、產品特征分析、產品企業自我分析與定位、同行競爭企業分析與發展等功能促使用戶評論成為新的情報源。作為新的情報源,產品用戶評論中包含豐富多樣的產品信息和用戶使用感受,幫助產品企業從用戶視角了解自己產品的優勢和劣勢,進而提高產品性能,獲得競爭優勢[1-2]。而且產品用戶評論有助于從本質上認識產品特點及對企業的影響,為企業競爭情報研究提供相關的理論支撐[3]。

關聯規則由美國IBM Almaden Research Center的Rabesh Agrawal等人于1993年提出,反映一個事物與其他事物之間的相互依賴性或相互關聯性,從而達到認識事物客觀規律[4],利用這一方法對產品用戶評論進行數據挖掘,可以快速發現用戶評論中有價值的信息,對企業競爭情報工作的開展具有重要意義。

1 用戶評論相關研究

目前關于用戶評論(或產品評論)的研究較少,從1996-2014年相關發文量才100多篇(CNKI以“用戶評論”或“產品評論”為篇名檢索結果),但近三年來發文量占總發文量的80%,所以,關于用戶評論的研究正處于發展階段,而且逐漸成為眾多學者關注的研究熱點。用戶評論相關研究主要集中在理論探討和實踐技術兩個方面。在理論探討上,主要包括用戶評論的特點、價值、信息源和在企業競爭情報中的應用等方面,尤其是關于用戶評論在企業競爭情報中的應用研究,已涉及行業監測、用戶研究、競爭對手分析、企業戰略制定等多個領域[3,5]。在實踐技術上,主要包括用戶評論特征提取和用戶情感分析兩個方面。用戶評論產品特征提取主要是對提取算法進行利用和改進,如自組織映射(SOM)屬性識別[6]、FP增長算法[7]、CRF挖掘方法[8]等。

理論探討和實踐技術是用戶評論研究的兩大重要領域,理論探討在宏觀上論證用戶評論的價值和構建企業競爭情報模型,為具體實踐操作提供理論指導,實踐技術在微觀上論證利用用戶評論價值的可行性,為理論創新提供技術支撐。理論探討中的基于用戶評論的企業競爭情報模型構建和實踐技術中的用戶評論特征提取算法優化是目前用戶評論研究的熱點問題。

2 用戶評論中產品特征關聯規則挖掘在企業競爭情報中的作用

從用戶評論相關研究中可以發現,用戶評論研究已形成由理論到實踐的跨學科研究體系,不但強調了用戶評論在企業競爭情報中的價值,而且提供了產品特征提取和情感分析的技術支撐。然而,在應用中,關于產品優劣勢特征的重要性大小以及關鍵產品特征的挖掘仍然處于薄弱環節,而基于用戶評論的產品特征關聯規則挖掘則可以彌補這一薄弱環節。

產品特征關聯規則挖掘涉及的主要參數有支持度、概率和規則重要性[9]。支持度(support)是用來衡量一個項集出現的頻率,它是用來對項集的限制,而非對規則的限制。概率又是關聯規則的可信度(confidence),表示用戶對某些規則感興趣,但這些規則必須是高概率,而非小概率,最小概率對項集沒有影響,對規則生成有影響。規則的重要性Importance(X?Y)=log(p(Y X)/p(Y not X)),描述了規則的關聯性大小,如果Importance=0,表示X和Y沒有關聯性;如果Importance>0,表示X和Y正相關,X為真時,Y的概率會上升;如果Importance<0,表示X和Y負相關,X為真時,Y的概率會下降。

產品的用戶評論形式多樣、內容豐富,蘊藏著重要的商業價值,對企業開展競爭情報工作具有重要作用。用戶評論內容不但體現了用戶從自我體驗或自我感知角度對產品某些特征的積極評價和消極評價,而且包含了用戶對產品的整體評價,如用戶評論中的星級評價和分數評價機制。因此,對用戶評論中的產品特征與評價進行提取并形成記錄,再運用關聯規則進行數據挖掘,尋找概率高、規則重要性為正且較大的規則,從而挖掘出用戶所認為的優勢特征和劣勢特征,以及這些特征的重要性大小。并利用用戶評論的總體評價,發現影響產品整體評價的關鍵特征。

2.1挖掘產品的優劣勢特征及其程度大小

用戶評論雖然形式多樣,但其內容基本都含有對產品的優勢特征和劣勢特征的評價。有的用戶評論將優勢和劣勢評價分開,由多條評論文本組成,如中關村網上的產品評價;有的用戶評論沒有詳細劃分,用戶直接評論,一條評論文本中既包含了優勢特征也包含了劣勢特征,如淘寶網上的產品評論。對這些用戶評論中的產品特征進行提取,同一ID的用戶評論形成優勢特征和劣勢特征兩條記錄,優勢特征形成“Feature A,Feature B…?Positive”形式的記錄,劣勢特征形成“Feature A,Feature C…?Negative”形式的記錄。然后,通過關聯規則Apriori算法對產品各優勢特征和劣勢特征的分量和概率進行計算,挖據出概率高、重要性大的產品特征,并顯示其重要性的大小,從而發現多個產品之間優勢特征和劣勢特征的差異,幫助企業從用戶反饋的評論信息中重新了解產品的特性、功能和用戶的喜好。

2.2挖掘影響產品整體評價的關鍵特征

用戶評論中除了包含用戶對產品優勢特征和劣勢特征的評價外,還包括用戶對產品的整體評價,一般以總結性語言、產品評分以及星級評價來體現。用戶對產品的整體評價以用戶對產品優勢特征和劣勢特征的評價為基礎,受優勢特征和劣勢特征的多少及重要性大小影響,但并不存在必然聯系,而關鍵特征則會直接影響用戶的最終評價。關鍵特征可能與挖掘產品優劣勢特征中的最大重要性特征一致,也可能不一致,具體要看產品特征關聯規則挖掘的結果。

在挖掘產品優劣勢特征及其重要性大小時,同一ID的用戶評論形成兩條記錄,而挖掘影響產品整體評價的關鍵特征時,同一ID的用戶評論形成一條記錄,其中包含了優勢特征和劣勢特征,但最后產品的整體評價結果“Positive”或“Negative”以用戶的評分或星級評價來確定,最終形成“Feature A?Positive,Feature B?Positive,Feature C?Negative…?Positive”或者“Feature A?Positive,Feature B?Positive,Feature C?Negative…?Negative”形式的記錄。然后再進行關聯規則挖掘,挖掘出影響產品整體評價的關鍵特征。產品的關鍵特征是產品的核心競爭力,改善、提高產品關鍵特征的性能,是企業提高產品競爭優勢的最佳途徑。

3 基于產品特征關聯規則數據挖掘的企業競爭情報應用模型

有學者認為,競爭情報系統的根本任務是以戰略目標為導向對競爭數據進行有效的收集、存儲、處理和維護,并不斷尋找和發現環境中可能影響企業生存和發展的先兆信息[10],而除此之外,對企業自身產品數據的收集和分析也是企業競爭情報系統的重要任務。鑒于此,筆者以用戶評論為情報源,提出基于產品特征關聯規則數據挖掘的企業競爭情報應用模型,該模型的功能設計是對自身產品和競爭對手產品進行用戶評論數據搜集分析,并利用關聯規則進行用戶評論數據挖掘,通過對比分析尋找產品各個特征在用戶心中的地位,以及發現影響產品研發與設計上的核心問題,進而幫助企業全面了解自己產品和競爭對手產品的競爭形勢。

基于產品特征關聯規則數據挖掘的企業競爭情報應用模型包括4個模塊,分別是確定用戶評論情報源及其采集、數據預處理及其產品特征提取、數據結構化處理及其關聯規則分析和產品優劣勢特征及其關鍵特征的對比分析,如圖1所示。

圖1 基于產品特征關聯規則數據挖掘的企業競爭情報應用模型

3.1確定用戶評論情報源及其采集

在數字時代,網絡是所有信息傳遞、加工和處理的最好載體,正成為競爭情報的一個主要來源[11],而用戶評論不僅包含了產品信息,更體現了用戶需求和用戶滿意度,而且在獲取方面更加方便與廉價,所以用戶評論逐漸成為競爭情報的重要來源。

作為重要的情報源,如何確定要采集的用戶評論是進行產品特征關聯規則數據挖掘的首要問題,用戶評論的來源主要有產品評測網、產品論壇網、電子商務網以及各大社交平臺,每一個網站上的用戶評論都是有價值的情報信息,然而在選擇用戶評論情報源時需注意幾點問題:(1)網站是否具有權威性。網站權威性越高,其產品介紹越詳細精準,用戶評論才會更加全面精確。(2)用戶評論質量是否具有保障。由于網絡水軍的存在,用戶評論的質量也參差不齊,而用戶評論的質量將直接影響關聯規則數據挖掘的結果,所以只有高質量的用戶評論情報源才能分析得出全面可靠的產品特征信息。(3)不同產品的用戶評論信息來源要一致。由于不同信息來源的評論機制不一樣,所以無法進行對比分析。只有選擇同一信息來源的不同產品的用戶評論進行數據挖掘,才能將挖掘結果進行對比分析。而不同信息來源的用戶評論可以單獨進行數據挖掘與對比分析,從而達到相互驗證的效果。

在確定用戶評論情報源后,需對用戶評論中的相關數據進行采集,具體采集信息需根據網站用戶評論內容格式和企業需求來確定。

3.2數據預處理及其產品特征提取

已采集的用戶評論內容是自然語言,具有多樣性、模糊性和不一致性,無法直接分析,需對其進行數據預處理以及產品特征提取。

數據預處理的目的是提取有效的用戶評論內容,將內容缺失、重復、異常的數據記錄進行剔除,保證數據內容的有效性。在用戶評論數據預處理完成后,利用相關工具或算法對用戶評論內容進行產品特征的提取和用戶態度的分析,其方法有ICTCLAS分詞法、自組織映射(SOM)屬性識別、FP增長算法、CRF挖掘方法等,可以根據需要選擇。其目的是將用戶評論中涉及產品的優勢特征和劣勢特征信息進行提取分類,若用戶態度無法直接獲取,還需進行用戶情感分析。

3.3數據結構化處理及其關聯規則分析

由于產品特征的關聯規則數據挖掘包括兩個方面,一方面是挖掘產品特征的優劣勢及其重要性大小;另一方面是挖掘影響用戶對產品整體評價的關鍵特征。所以,在數據結構化處理過程中需進行兩個方面的處理:

(1)將產品特征進行優勢特征和劣勢特征的分類,即用戶評論中產品特征為優勢時,其對應的觀點為“Positive”,產品特征為劣勢時,其對應的觀點為“Negative”,其數據結構化樣式如表1所示。

表1 數據結構化樣式(一)

(2)在產品優勢特征和劣勢特征分類的基礎上,加入用戶對產品的整體評價,整體評價的觀點“Positive”或“Negative”以評分或星級評價為判斷依據,其數據結構化樣式如表2所示。

表2 數據結構化樣式(二)

在數據結構化處理完成后,將結構化數據導入到Business Intelligence Development Studio、SAS等數據挖掘工具,利用關聯規則進行數據挖掘部署,得到相關規則、規則重要性以及規則的概率等結果。

為了保證數據挖掘的有效性,需要從數據和挖掘方法兩方面提供相應保障措施。在數據上,需保證其時效性。在數字時代,產品(尤其是數字產品)的更新換代速度逐步加快,用戶評論有效性的時間逐漸縮短,及時采集分析用戶評論數據是保證數據挖掘有效性的首要措施。在挖掘方法上要選擇正確的參數設置,保證挖掘規則的科學有效,也可以通過多次挖掘,論證挖掘規則的正確性。

3.4產品優劣勢特征及其關鍵特征的對比分析

在關聯規則數據挖掘得出的規則中,選取概率高、重要性大的規則進行分析,發現優勢特征、劣勢特征和關鍵特征。同時在多個產品之間進行對比分析,發現自己產品和競爭產品的差異,為產品定位和企業決策做參考。

產品優勢特征和劣勢特征的對比分析可以全方位了解自己產品和競爭對手產品之間的差異,發現自己與競爭對手的擅長點和薄弱點,為今后產品設計作參考。同時,通過優劣勢的對比發現用戶在產品某一特征上的偏好,根據規則概率的大小了解用戶偏好的覆蓋面,間接進行了用戶需求(偏好)的調查。

產品關鍵特征的對比分析可以發現產品推出后成功或者失敗的關鍵點。任何一個產品都不可能毫無瑕疵,也不可能得到每一位用戶的認可,所以產品很有可能是因為某一特征的成功而成功,也有可能是因某一特征的失敗而失敗,如價格、做工、性能等特征。所以,關鍵特征的對比分析有助于企業快速掌握產品行業用戶最為關心的核心部分,若關鍵特征為優勢,則代表產品的核心能夠抓住用戶需求,可以在今后產品研發上持續利用;若關鍵特征為劣勢,則代表產品的核心并不能使用戶滿意,在產品研發上需特別改進。

4 實驗研究

實驗以Business Intelligence Development Studio為數據挖掘工具,以中關村在線中手機小米3和錘子T1的用戶評論為數據挖掘對比研究對象,設計兩種類型的關聯規則數據挖掘模型,一類是用來挖掘產品的優勢特征和劣勢特征;另一類是用來挖掘影響產品整體評價的關鍵特征。在中關村在線小米3和錘子T1產品中的點評區里以默認排序選擇前20條用戶的評論作為具體的數據采集對象,選擇默認排序的目的是保證所采集的小米3和錘子T1評論盡可能在時間區域和熱度高低上保持一致性,從而保證對比研究的有效性。

4.1用戶評論數據確定與采集

由于中關村在線手機專區是我國目前規模較大的電子產品在線評測、評論網站,具有一定的可信任性,而且中觀村在線手機專區的評論信息格式較為規范,如圖2所示,方便采集和分析,所以確定中關村在線手機專區中的小米3和錘子T1點評區中的用戶評論為采集對象。利用數據采集器對網頁中的用戶評論內容進行采集,采集結果如表3所示。

圖2 中關村在線手機專區用戶評論采集示例

序號用戶名標 題優 點缺 點總 結評分時間1的方法是否錘子手機熱賣左右手是我最愛的地方…就是賣的太便宜 我感覺要是賣5000…外觀和系統 設計細節 很喜歡 惟一遺憾的是現在…5?2014/5/2310∶522種致遠就是蟲叔呀很少人感覺到老羅的用心良苦…細節決定成敗,著重用戶體驗可以說是國產機中的業界良心…電池續航雖然不錯但是估計年輕人是不夠用的…中國人被性價比慣壞了,其實很多機器在變成國行之后為了…4.72014/5/235∶273yyh116177647個人對錘子手機的個人看法先說配置:一部手機的良好體驗離不開配置的支持…手機下面三個實體鍵不是本人喜歡的…手機很出色,亮點也很多。可以看出錘子做了很多市場調查…52014/5/2111∶37……………………

4.2用戶評論數據預處理和產品特征提取

對采集的數據進行預處理,剔除重復、無效、異常的數據,并對得到的數據進行分詞處理,提取產品相關特征,如表4所示。

表4 用戶評論中小米3特征提取(部分)

4.3數據結構化處理及其關聯規則分析

將經過特征提取后的用戶評論數據進行結構化處理,形成與關聯規則挖掘需求相一致的結構化數據,如表5和表6所示。

表5 第一類型的用戶評論結構化數據表(部分)

表6 第二類型的用戶評論結構化數據表(部分)

在數據結構化處理結束后,將得到的4張表格(每個產品需進行兩種類型的數據挖掘,一共兩個產品)導入到SQL Server 2008數據庫中,利用Business Intelligence Development Studio進行關聯規則數據挖掘。在Business Intelligence Development Studio中建立Analysis Services項目,并與SQL Server 2008數據庫進行連接,然后通過連接數據庫中4張關于小米3和錘子T1用戶評論的數據表建立數據源,然后再建立包含這4張數據表對象的數據源視圖。

在數據源和數據源視圖建立完成之后,新建本次研究的數據挖掘結構。在數據挖掘技術選擇中選擇Microsoft關聯規則,同時選擇需要進行關聯規則挖掘的數據源視圖。在挖掘結構建立完成之后,便可以讓Business Intelligence Development Studio通過關聯規則的算法對已建立的挖掘結構進行部署和處理,之后便可以瀏覽關聯規則數據挖掘結果。

4.4實驗產品優劣勢特征及其關鍵特征的對比分析

關聯規則數據挖掘得出的規則較多,為了得到概率高、重要性大的規則,筆者對最小概率和最低重要性進行了相關設置,以過濾意義不大的規則。

4.4.1產品的優劣勢特征及其重要性分析

圖3、圖4是小米3和錘子T1用戶評論第一類型關聯規則挖掘得出的結果,按重要性由大到小排序。從圖中可以發現,小米3手機最大的優勢特征是“硬件配置”(0.398),其它比較重要的優勢特征有“價格”(0.309)和“屏幕”(0.265)。小米3手機的最大劣勢特征是“散熱”(0.449),其它比較重要的劣勢特征是“電池”(0.380)。而錘子T1手機最大的優勢特征是“硬件配置”(0.489),其它比較重要的優勢特征是音質(0.294)。錘子T1手機最大的劣勢特征是“價格”(0.360)。

圖3 小米3手機特征關聯規則和依賴關系網絡

圖4 錘子T1手機特征關聯規則和依賴關系網絡

通過對比小米3和錘子T1的手機特征,可以發現兩款手機在特征上的差異性,是企業需要收集的重要情報。圖5顯示的是高重要性規則結果,在優勢特征上,小米3優勢特征有硬件配置、價格、屏幕、系統軟件等,錘子T1優勢特征有硬件配置、音質、系統軟件、外觀設計和配件設置等,錘子T1手機的優勢特征多于小米3,而且同樣的優勢特征中,錘子T1的優勢特征重要性也略高于小米3。在劣勢特征上,小米3劣勢特征有散熱和電池,錘子T1劣勢特征只有價格。所以,從產品特征挖掘結果看,錘子T1的優勢明顯高于小米3,說明錘子T1在功能特征上更能迎合用戶的需求。

圖5 小米3和錘子T1手機特征對比圖圖表來源:筆者根據挖掘結果規則繪制

4.4.2影響產品整體評價的關鍵特征分析

圖6是小米3和錘子T1用戶評論第二類型關聯規則挖掘得出的結果,按重要性由大到小排序。

影響小米3整體評價的3條最重要的規則分別是“系統軟件=Positive->Opinion=Positive”(0.465)、“硬件配置=Positive->Opinion=Positive”(0.368)、“系統軟件=Positive,硬件配置=Positive->Opinion=Positive”(0.301)。所以,影響小米3整體評價的關鍵特征是“系統軟件”和“硬件配置”,而且作為優勢特征的“系統軟件”和“硬件配置”決定了用戶對小米3的積極認可。并且在其它關聯規則中同樣可以發現“系統軟件”和“硬件配置”對小米3整體評價的重要影響,如“電池=Negative,系統軟件=Positive->Opinion=Positive”(0.239)、“價格=Negative,硬件配置=Positive->Opinion=Positive”(0.239)、“外觀設計=Negative,系統軟件=Positive->Opinion=Positive”(0.239)、“拍照=Negative,硬件配置=Positive->Opinion=Positive”(0.239)、“拍照=Negative,系統軟件=Positive->Opinion=Positive”(0.239),這些規則說明了小米3的一些劣勢特征對小米3整體評價的影響不大。

影響錘子T1整體評價的四條最重要的規則分別是“價格=Negative->Opinion=Negative”(0.380)、“外觀設計=Negative,價格=Negative->Opinion=Negative”(0.322)、“外觀設計=Negative->Opinion=Negative”(0.322)、“系統軟件=Positive->Opinion=Positive”(0.301)。所以影響錘子T1整體評價的關鍵特征有“價格”、“外觀設計”、“系統軟件”。然而“價格”、“外觀設計”作為劣勢特征直接影響了用戶對錘子T1的消極評價,“系統軟件”雖然作為優勢特征對錘子T1的整體評價也有較強影響,但其重要性不及“價格”和“外觀設計”。而且在其它特征關聯規則中也證明了“價格”和“外觀設計”對錘子T1的決定性影響,如“圖像=Positive,價格=Negative->Opinion=Negative”(0.222)、“音質=Positive,價格=Negative->Opinion=Negative”(0.222)、“音質=Positive,外觀設計=Negative->Opinion=Negative”(0.222)、“圖像=Positive,外觀設計=Negative->Opinion=Negative”(0.222)。

綜上,在整體評價上,小米3以優勢關鍵特征“系統軟件”獲得用戶的好評,而錘子T1以劣勢關鍵特征“價格”失去用戶的好評,所以,關鍵特征的優劣是能否獲得用戶好評的核心。

小米3和錘子T1的優劣勢特征分析和關鍵特征分析的結果對比驗證了基于產品特征的關聯規則數據挖掘在企業競爭情報中的價值。第一,在產品優劣勢特征及其重要性大小挖掘中,發現了小米3和錘子T1各自產品的優勢特征和劣勢特征數量的多少和特征的重要性大小,而且通過共同特征和差異特征的對比分析,從用戶體驗角度全面了解了兩個產品的細節特征,以及它們在用戶心中的差距,為產品細節設計提供用戶偏好的數據支撐。第二,在產品關鍵特征挖掘中,實驗結果顯示,產品是否能夠獲得好評,受產品關鍵特征影響,與優劣勢特征的多少沒有必然的聯系,而且產品關鍵特征并不一定是重要性最大的優勢特征或劣勢特征。產品關鍵特征受用戶格外關注,能夠影響用戶對產品的整體評價。然而在產品被推出時,關鍵特征并不明確,只有在用戶充分體驗產品之后才能逐漸顯現。所以,關鍵特征不具有預見性,只能夠通過數據挖掘發現,并為產品的重新定義與銷售策略提供指導,為今后產品的定位、設計、決策提供數據支撐。

圖6 影響小米3和錘子T1整體評價的手機特征關聯規則(圖左:小米3,圖右:錘子T1)

5 結 語

基于產品特征關聯規則數據挖掘的企業競爭情報應用模型,對企業開展競爭情報工作、進行產品定位、制定戰略決策具有重要意義,尤其是產品關鍵特征的挖掘,對企業決策具有重要參考價值。隨著用戶評論價值的發現,以及大數據環境下用戶生成內容(微博、朋友圈等社交媒體信息)價值的利用,以網絡用戶生成內容為情報源的企業競爭情報研究將成為學界和業界研究的熱點問題,競爭情報模型的優化設計和用戶內容提取及分析算法的改進將成為今后企業競爭情報系統構建所關注的重點問題。

參考文獻

[1]Hu M,Liu B.Mining and summarizing customer reviews[C]∥Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,New York:ACM Press,2004:168-177.

[2]Popescu A M,Etzioni O.Extracting product features and opinions from review[C]∥Proceedings of the Human Language Technology Conference and the Conference on Empirical Methods in Natural Language Processing,Stroudsburg,USA:Association for Computational Linguistics,2005:339-346.

[3]周珍妮,黃曉斌.網絡用戶評論在企業競爭情報研究中的應用[J].情報理論與實踐,2012,(5):15-20.

[4]況莉莉.Microsoft關聯規則在高校圖書館中的應用[J].宿州學院學報,2011,(5):109-113.

[5]施國良,程楠楠.Web環境下產品評論挖掘在企業競爭情報中的應用[J].情報雜志,2011,(11):10-14,51.

[6]余傳明.從用戶評論中挖掘產品屬性——基于SOM的實現[J].現代圖書情報技術,2009,(5):61-66.

[7]王永,張勤,楊曉潔.中文網絡評論中產品特征提取方法研究[J].現代圖書情報技術,2013,(12):70-73.

[8]呂品,鐘珞,蔡敦波,等.基于CRF的中文評論有效性挖掘產品特征[J].計算機工程與科學,2014,(2):359-366.

[9]Zhao Hui Tang,Jamie MacLennan.數據挖掘原理與應用——SQL Server 2005數據庫[M].鄺祝芳,焦賢龍,高升,譯.北京:清華大學出版社,2007:191-205.

[10]劉慶紅,李碩,王晰巍.Web集成環境下企業競爭情報模型構建研究[J].情報科學,2006,(11):1713-1717.

[11]王軍.網絡競爭情報源的開發利用[J].情報科學,2004,(5):574-577.

(本文責任編輯:馬卓)

Application of Product User Review in Research on Enterprise Competitive Intelligence——Association Rules Data Mining Based on Product Features

Ji ShunquanZhou Yi

(School of Society,Soochow University,Suzhou 215123,China)

〔Abstract〕On the basis of summarizing the research on user reviews,this paper put forward the significance of mining user reviews with association rules.It included mining the positive features and the negative features of the products,and mining the key features which affect the overall evaluation of products.And then this paper put forward the model of enterprise competitive intelligence which based on the association rules data mining from product features.It contained four modules of user review searching and collecting,data preprocessing and features extracting,data structured processing and association rules data mining,and positive and negative features analyzing and key features analyzing.In the end,this paper demonstrated the value of the model by experiment.

〔Key words〕enterprise;user reviews;product features;association rules;data mining;competitive intelligence

〔中圖分類號〕G203;TP391;G250.25

〔文獻標識碼〕A

〔文章編號〕1008-0821(2015)06-0114-08

DOI:10.3969/j.issn.1008-0821.2015.06.021

作者簡介:吉順權(1990-),男,碩士研究生,研究方向:網絡信息資源開發利用。

基金項目:“十二五”江蘇省高校重點專業建設專項——圖書情報與檔案管理(項目編號:58315312)的階段性成果之一。

收稿日期:2015-03-09

·企業情報工作·

猜你喜歡
數據挖掘企業
企業
當代水產(2022年8期)2022-09-20 06:44:30
企業
當代水產(2022年6期)2022-06-29 01:11:44
企業
當代水產(2022年5期)2022-06-05 07:55:06
企業
當代水產(2022年3期)2022-04-26 14:27:04
企業
當代水產(2022年2期)2022-04-26 14:25:10
探討人工智能與數據挖掘發展趨勢
敢為人先的企業——超惠投不動產
云南畫報(2020年9期)2020-10-27 02:03:26
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 亚洲人成网站在线播放2019| 午夜日b视频| 58av国产精品| 欧美日一级片| 婷婷久久综合九色综合88| 激情无码字幕综合| 毛片网站在线看| 国产第一色| 久草视频中文| 亚洲香蕉在线| 国产日韩精品一区在线不卡| 在线中文字幕网| 成年午夜精品久久精品| 国产成人精品一区二区免费看京| 一区二区三区高清视频国产女人| 亚洲综合18p| 欧美成人怡春院在线激情| 国产女人水多毛片18| 成·人免费午夜无码视频在线观看| 成人a免费α片在线视频网站| 99无码熟妇丰满人妻啪啪| 国产精品免费p区| 国产微拍一区| 亚洲中文字幕国产av| 欧美黑人欧美精品刺激| 黄色网页在线观看| 国产91在线|日本| 嫩草国产在线| 91视频国产高清| 欧美α片免费观看| 久久中文电影| 免费看av在线网站网址| 亚洲乱码视频| 永久成人无码激情视频免费| 国产精品亚洲五月天高清| 美女无遮挡免费网站| 97超爽成人免费视频在线播放| 无码福利视频| 亚洲黄色网站视频| 五月激情综合网| 亚洲第一在线播放| 亚洲人成网18禁| 五月天久久综合| 99九九成人免费视频精品| 丰满人妻一区二区三区视频| 久久五月天综合| 国产精品入口麻豆| 99久久成人国产精品免费| 久久久精品无码一二三区| 国产色婷婷视频在线观看| 人人91人人澡人人妻人人爽| 国产成人精品高清在线| 99视频在线免费观看| 高清无码不卡视频| 久久综合九色综合97网| 亚洲综合亚洲国产尤物| 久久国产精品波多野结衣| 欧美日本在线播放| 精品无码一区二区三区在线视频| 国产白浆视频| 国产产在线精品亚洲aavv| 久草视频中文| 国产精品99r8在线观看| 99尹人香蕉国产免费天天拍| 国产成人精品18| 蜜芽国产尤物av尤物在线看| 国产成本人片免费a∨短片| 国产91精品最新在线播放| 六月婷婷综合| 2020国产精品视频| 亚洲视频二| 国产日本欧美在线观看| 日韩国产精品无码一区二区三区| 国产欧美另类| 伊人久久精品无码麻豆精品| 亚洲欧美另类日本| 妇女自拍偷自拍亚洲精品| 国产91导航| 精品无码人妻一区二区| 亚洲中文字幕国产av| 欧美成人精品在线| 午夜精品区|