[摘 要]由于部落格(Blogs)的普及,導致愈來愈多的企業希望能從大量的使用者文章中擷取出有用的信息,從中了解消費者需求及市場導向,以幫助企業改善商品及服務質量,抑或評估企業本身或同業競爭者的優劣勢。本研究針對部落格中的產品使用心得,提出一套FAIR 模塊,希望藉由該模塊得以達到在短時間內有效地分析產品評價,以利于企業或消費者在掌握商品重點特色及整體評價時,能避免閱讀大量文章的時間耗費并無從理出頭緒的情形。FAIR 模塊為模糊自適應共振理論(Fuzzy ART)結合隱含語意索引(LSI)的特性,將文章集予以分群并從中擷取出代表性關鍵詞,以達到信息檢索的目的,最終再通過關聯法則(AR)提升關鍵詞的解釋性。通過FAIR模塊所擷取出來的消費者心聲,我們更進一步地應用于質量機能展開,將顧客需求轉化為技術需求,以分別了解產品本身或同業之間的競爭力,使企業充分掌握顧客需求,并提升產品設計之適用性。最后,我們以美容保養品之部落格文章作為實驗對象,以說明并驗證所提出的FAIR 模塊之效力。
[關鍵詞]信息檢索;模糊自適應共振理論類神經網絡;隱含語意索引;關聯法則;質量機能展開
doi:10.3969/j.issn.1673-0194.2009.15.010
[中圖分類號]TP391[文獻標識碼]A[文章編號]1673-0194(2009)15-0031-05
1 前 言
部落格(Blogs)已成為時下流行的信息交流媒介之一,其普遍性可根據Technorati于2008年的統計數據,全球網絡的部落格讀者已達1.889億人之多,其成長的速度由2002年開始,平均每天至少有900 000篇新文章被發布。使用者可藉由部落格撰寫文章,為自己的生活做記錄,亦可分享本身經驗及對事物的評價和觀感[1]。
相關文獻指出,人們通過部落格傳播個人的意見及想法,可能將導致互相影響的效果,甚至因而產生被洗腦的現象[2],這意味著部落格儼然已成為日常生活中不可或缺的溝通管道之一。近年來,許多企業已掌握住部落格快速傳播訊息的特性,適時地將其應用于企業內外部或服務顧客,甚至藉由部落格導正企業形象,避免及減少負面評價的產生。許多廠商亦開始將部落格視為一種經營產品的管道,提供部落客免費試用及體驗商品,藉由部落格的高度感染力,進而提高產品的曝光程度、可信度、抑或對該商品作市場調查[3]。故公司企業如果能成功地運用部落格,依賴其快速且容易使人信服的口耳相傳特性,必定能達到有效的營銷效果[4]。以Nissan為例,該公司于2005年為新車Tiida成立了專屬部落格,提供車主們分享駕駛心得、經驗、以及影音照片的空間,使車主以及潛在消費者得以產生交流和互動,而部落格中所討論到的問題及評價,也幫助該公司作為參考,從中發掘對企業有用的信息[5]。
過去也曾有諸位學者對部落格進行網絡探勘的研究,Todoroki et al.建立一套以部落格為主的電子化系統,讓使用者可以通過簡易的操作平臺,對部落格加以管理、編輯及搜尋[6];Chau and Xu以半自動化的機制,針對部落格當中的特殊族群(如種族主義者)進行分析及監控,避免危害社會的可能性[2];Lin and Huang從分析個案中發現,部落格擁有強大的影響力,觀光業可藉由部落格的特性,開創市場商機[7];相關應用之文獻皆以Web Usage Mining[8]及Web Structure Mining[2]為主要導向,而近年來有關于部落格之Web Content Mining的應用,則主要通過資料之搜集,以分析當前部落格主要的議題及討論趨勢[9]。其中以Latent Semantic Analysis(LSA)最常被應用于部落格Content Mining之中。此外,針對部落格搜尋引擎的部分,亦常使用Probabilistic Latent Semantic Analysis(PLSA)于追蹤最熱門之部落格標題及關鍵詞。然而,通過此類信息檢索技術所擷取出來的關鍵詞,并不易于解讀其代表之含意,故本研究提出一套FAIR(Fuzzy Adaptive Resonance Theory based Information Retrieval scheme)模塊,結合自適應模糊理論(Fuzzy ART)類神經網絡[10]及隱含語意索引(LSI)[11]達到信息檢索之功效,并通過關聯法則(Association Rules)[12,13]技術,以提升其關鍵詞之可讀性。最后,我們以美容保養品之部落格文章作為實驗對象,以驗證所提出的FAIR模塊之有效性。
2 FAIR模塊
本章將針對所提出之FAIR模塊進行詳細的方法及流程介紹,將部落格之產品使用心得分享做內容探勘,利用分群技術將文章集劃分為若干群組,并通過探勘技術擷取出文章的代表性詞匯,以達到短時間內即可掌握相關評價信息。FAIR之研究流程可分為5個步驟:
(1)搜集部落格文章;
(2)數據之前置處理;
(3)文章分群;
(4)語意檢索;
(5)提升解釋性;
(5)質量機能展開。
各步驟之詳細介紹請參考2.1~2.6節之內容。
2.1 部落格之文章搜集
由于使用者從部落格參考特定內容之文章,勢必耗費大量的時間瀏覽閱讀,而文章內容及評價皆不一,使得獲得信息的過程變得冗長、無效率,進而使得參考的結果較為模糊化,讓部落客在擷取產品信息而言,成為一門耗時且耗力的工作。故本研究針對部落格文章進行內容探勘,故首要步驟為搜集部落格文章,而文章的篩選條件則以美容保養品為例,希望藉由資料探勘的過程,擷取出該產品的重點信息,以具代表性之關鍵詞表達該產品的優缺點,亦或備受關切的要項及特點。
2.2 數據之前置處理
在進行數據探勘之前,必須對資料做前置處理的動作,為避免太多噪聲的干擾,進而影響探勘的結果及效率,故于文章搜集后,逐篇針對其文字及注音文進行修改或刪除的動作。再者,我們利用中央研究院的中文斷字系統進行斷詞,該系統依據其定義的詞典,進而將特定詞匯切割為一個獨立字詞,斷詞后的文章,依名詞及動詞作為篩選條件,將符合其詞性之詞匯擷取出,以作為文章之關鍵詞。
詞匯-文件向量矩陣常被使用于信息檢索中,由于它能表達詞匯與文件間的關聯性,向量的結果亦方便進行群聚及分類的處理,故本研究根據斷詞后的篩選結果,進行建立詞匯-文件向量矩陣的步驟,以欄作為關鍵詞的向量表示,以列作為文章編號的向量表示,依據每篇文章的關鍵詞集合,在該文章編號所對應的關鍵詞向量當中,該關鍵詞未出現于文章中則填入0值,反之,該關鍵詞出現于文章中則填入1值。
2.3 文章分群
根據步驟二所建立的詞匯-文件向量矩陣,我們將其作為文章分群的依據,藉由模糊自適應共振理論(Fuzzy ART)類神經網絡將文章區分為若干個集合,將文章內容近似的文章視為同一個群組,希望從分群的結果中,觀察顧客對該產品的心得主要可劃分為哪些類別要項。
Fuzzy ART類神經網絡于1991年由Carpenter et al.所提出,屬于非監督式學習的網絡模式,其結合模糊集合理論(Fuzzy Set Theory)與自適應共振理論(Adaptive Resonance Theory,ART),以改善過去ART所面臨的輸入格式之限制。相較于Fuzzy ART,ART1僅接受二元值作為輸入數據的格式,不支持介于0至1之間的連續值;而整體執行架構方面,Fuzzy ART亦比ART2簡單得多,不須要經過數據正規化的程序,即可達到快速并穩定的收斂分群[14]。此外,Fuzzy ART不需要事先定義分群數,故可避免人為因素的干擾,進而影響分群結果的準確性。
Fuzzy ART的運作方式與人類的記憶系統相似[15],在學習新對象特性的同時(具可塑性),又必須保留舊對象特性的記錄(穩定性),但此兩項特性存在著沖突關系,而解決此項問題的方法即采用共振測試或稱警戒值測試(Vigilance test)。共振測試即通過警戒值判斷數據相似與否[16,17]。當向量數據輸入時,首先必須設定其相關參數:ρ(Vigilance parameter),定義群集相似度的標準;α(Choice parameter),在快速學習模式中,通常建議趨近于0。若α=1,則表示無條件通過共振測試;β(Learning rate),更新權重時所使用,其大小影響學習速度的快慢。
再者,通過計算選擇函數(1),確定元素執行共振測試時之順序,以最大值為優先(2),其計算方式如下列公式所示[11]:
Tj=|I∧Wj|α+|Wj|(1)
Tj=MAX{Tj∶j=1,N}(2)
其中,Wj為輸入向量數據I之權重;∧的定義為(X∧Y)=MIN(Xi, Yi);||之定義為|X|=∑mi=2Xi。確定優先級后,依公式(3)計算該值與群組之間的相似度,若大于等于ρ值,則表示通過共振測試,其條件符合該群組之特色,可歸納為同一群組。
|I∧Wj||I|≥ρ(3)
2.4 信息攫取
文章經由分群后,必須擷取出每個群組所表達的主旨,因此本研究利用隱含語意索引(Latent Semantic Index,LSI)進行文章內容分析,而經由奇異值分解(Singular Value Decomposition,SVD)后的結果,將可擷取出每篇文章最具代表性的關鍵詞,每個群組根據所屬的關鍵詞集合,便可輕易地觀察出哪些文章關切著什么重點,例如若干人認為該產品售價太貴、若干人認為該產品的味道很刺鼻等。
學者Deerwester et al.于1990年提出了隱含語意索引(Latent Semantic Index,LSI)的概念,為信息檢索領域中常被予以應用的一項技術,用以發掘文件之隱含語意。隱含語意索引利用向量空間的概念,將文件及索引詞以投影至向量空間的方式呈現,可表示出索引詞與索引詞、索引詞與文件、及文件與文件之間的關聯,其主要目的為有效縮減數據維度,減少信息檢索所必需秏費的時間,并可解決一字多義(polysemy)及多字一義(synonymy)之問題。
隱含語意索引主要仰賴奇異值分解(Singular Value Decomposition,SVD)的執行,其目的為將數據維度縮減100至300大小的維度空間[18]。假設A為m×n之矩陣,其rank(A)=r并滿足m≥n之條件,對A做奇異值分解則可表示為A=USVT,其中S=diag(σ1,…, σn),σ1>0 for 1≤i≤r,σj=0 for σj≥r+1,且UTU=VTV=In。U為詞匯之向量集合,其行向量稱之為左奇異向量(Left singular value)。V為文件之向量集合,其行向量稱之為右奇異向量(Right singular value),S為對角矩陣,其示意圖如圖1所示[19]。
圖1 奇異值分解之示意圖
2.5 提升解釋性
由上個步驟可得知每個群組的代表性關鍵詞,然而,關鍵詞的可讀性不甚理想,故本研究通過關聯法則,將詞匯做組合的動作,使得結果更具邏輯且精確,而使用者也能更輕易地解讀其最終結果。
關聯法則(Association rules)系由學者Agrawal et al.于1993年提出,其主要目的為找出項目之間所隱含的關聯性[12]。關聯法則應用于交易系統中,可輕易地從大量的顧客交易數據記錄里,依顧客的消費習性及購買商品清單,發掘出人為不易發現的隱藏信息。譬如購買了某產品的同時,通常也會伴隨另一項產品的購買欲,此類信息即可提供決策者擬定有效的產品組合或促銷活動,并有助于賣場動線規劃及控管進貨量的安排。
假設I為所有項目的集合,而X和Y各代表某些項目的集合,并且滿足X及Y皆包含于I、X∩Y不為空集之條件,如欲觀察消費者購買X與Y項目的關聯性,則可通過關聯法則之表示式X→Y[support%, confidence%]得知,而該法則成立與否則是依據事先定義的支持度(support)與信心度(confidence)之門坎值來判斷,支持度與信心度必須等于或大于門坎值,該法則才予以有效性及參考價值。支持度與信心度為關聯法則的主要評量指針,支持度可顯示特定的項目集在所有項目集中所占有的比率,其值愈高即表示該項目集出現的次數愈頻繁,計算方法如公式(4)所示;信心度則可顯示觸發X項目的情況下,Y項目亦伴隨發生的條件概率,計算方法如公式(5)所示。
Support(X→Y)=X∩YI(4)
Conridence(X→Y)=Support(X→Y)Support(X)(5)
2.6 質量機能展開
質量機能展開(Quality Function Deployment,QFD)為幫助企業了解顧客需求的一套工具,系由日本質量學家赤尾洋二與水野滋所提出[20]。QFD可將顧客之意見納入產品開發的過程,以確保公司產品在經過消費者需求之考慮后,可達到滿足甚至超越顧客之期望,進而提升企業競爭力與獲利。而QFD的主要結構是以一關系矩陣為基礎,如圖2所示,該矩陣包含了兩種向量概念,一為顧客需求(What),另一個則為技術需求(How)。顧客需求即企業通過問卷或市場調查所獲取并歸納出的顧客需要,技術需求則是為了衡量及具體化顧客需求所產生的要件和尺標,而這顧客需求及技術需求之間的關聯強度則是通過關系矩陣來表示,通常以◎、○、△表示其對應關系的強、中、弱,并分別以9、3、1作為其數值化的參考。每項顧客需求則需依顧客的角度定義其重要度,通常重要度由低至高以1到10表示之。于QFD結構最下層之加權重要性,則表示著每項技術需求的重要程度(影響力),計算方式為顧客需求之重要性與技術需求之關聯強度乘積之加總。
圖2 質量機能展開之主要結構
3 實 驗
3.1 部落格之文章搜集
本研究以美容保養產品“雪肌精化妝水”作為實驗范例,搜集該產品之相關部落格文章,以FAIR模塊實證研究目的之效益。數據來源以“無名小站部落格”以及“UrCosm化妝品使用心得分享網站”為主,以雪肌精化妝水為搜尋主題,搜集該產品之使用心得文章,文章筆數共300則,以下為文章內容之范例:
最近愛上雪肌精,我還滿愛它那個味道的~香香的,靠柜當天用完也沒有紅or其他事情發生,那天柜姊也有幫我上乳液,本來想說會很油,但是我個人覺得還ok耶,而且也是香香的~~,真的是買對了(感動~~~~),我很enjoy那個味道~呵,都是用化妝棉沾濕上全臉,大家說用完會很干,不過我不會耶~~,不黏不油,good~!!!
3.2 數據之前置處理
文章內容經由適當的修正后,即進行中文斷詞之處理,依斷詞后之詞性,擷取出符合名詞及動詞之詞匯作為文章關鍵詞之代表。300篇文章之斷詞結果共產生了736筆非重復詞匯,經由詞性篩選關鍵詞之步驟后,詞匯數則降至為466筆。最后依關鍵詞及文件之分布關系,建立詞匯-文件向量矩陣,其大小為300 × 466,該矩陣之部分范例結果如表1所示。
表1詞匯-文件向量矩陣之范例結果
美白透亮嗆鼻酒精效用…
Doc 111011…
Doc 201100…
Doc 301010…
…………………
3.3 文章分群之結果
之相關參數設定如下:α設置為0.000 1、β設置為1。而由于無法事先定義最終之分群數,故采取實驗不同ρ值之分群,其范圍從0.9至0.5,以0.05作為間隔單位,結果如圖3所示。
圖3 不同ρ值之分群數比較
當ρ=0.55時,其分群數開始達到收斂之效果,與其他分群數之差距甚小,故本實驗選擇分群數為4之結果作為依據。而根據Fuzzy ART之執行結果,群組一到群組四之文件數各別為84、47、66及103篇。
3.4 語意檢索
根據SVD之文件向量V矩陣(右奇異向量),于每個文件所對應到的關鍵詞集合中,取其最大值所對應之關鍵詞作為該文件之代表性詞匯。而根據Fuzzy ART之分群結果,可匯整出每個群組所對應之文件集合,而經由LSI之萃取文件代表性詞匯的過程,各群組則可表示為若干個代表性詞匯的集合,如表2所示,其結果為取代表性詞匯出現頻率大于5之部分范例。
表2各群組之代表性詞匯
群組一群組二群組三群組四
均勻刺激清爽痘痘
味道酒精味效果消炎
美白傷口明顯舒服
…………
3.5 關聯法則之提升解釋性
從表2中可發現,逐筆解讀每個關鍵詞之意義頗為困難,由于字匯缺乏該程度之描述,譬如以關鍵詞“功效”而言,意味著該產品具有功效?抑或該產品具有何種功效?其模糊性質導致無法從關鍵詞揣測其代表之意涵。為解決此一問題,本研究導入關聯法則以提升關鍵詞之可讀性。表3為群組一及群組二之實驗結果。
表3導入關聯法則之結果
組 別項 目關聯法則Sup%times
群組一
Item 1好→效果16.667% 14
Item 2味道→效果5.952% 5
Item 3變白→效果8.333% 7
Item 4痘痘→效果11.905% 10
群組二
Item 1刺激→變白6.383% 3
Item 2刺激→酒精味6.383% 3
Item 3刺激→臉8.511% 4
由分析結果可發現,關聯法則有效提升了關鍵詞之可讀性,比較于單一詞匯之結果,關聯法則以詞匯組合的方式呈現,有助于降低其模糊性質,同時亦能看出各群組之消費者所著重的概念為何,以表3結果為例,群組一之顧客群著重于效果的呈現,群組二之顧客群則著重于刺激性的描述。藉此,使得企業決策者或消費者更易于明白其涵義,對于改善產品或購買決策而言,該分析結果能提供更為精確之參考方針。
3.6 質量機能展開
本研究通過關聯法則的解釋作為顧客需求的依據,并根據關聯法則的解釋作為顧客需求的依據,并根據關聯規則所包含的詞匯,計算其出現頻率的總合并正規化,使其范圍落于1至10之間,作為重要性指標之值。而由于該保養品之顧客需求主要皆著重在質地及效果的部分,故本研究以產品成分作為技術要求的參考依據,質量機能展開之結果如表4所示。
表4雪肌精化妝水之質量機能展開
重要性
顧客面
技術面
GlycerinTriticumVulgare StarchGerm OilDipotassiumGlycyrrhizateHamanelisExtractTocopheryl Acetate
8質地很清爽 9
6擦起來冰冰涼涼
6皮膚感覺不油膩 3
6保濕度很好 999
6產品物超所值33
5感覺具有消炎作用999
4擦起來很保濕999
3幫助消炎抗痘999
加權重要性9090162909090
由結果可知,Germ Oil為影響力較大之技術需求,該成分之特性對于保濕及抗氧化皆有明顯功效,符合消費者所著重之需求,可視為該產品之優勢。企業能藉由QFD了解產品于市場中的表現,進一步發掘各項技術需求是否足以使得顧客滿意,進而繼續維持優勢,抑或改善表現較為不甚理想之技術需求。
4 結 論
隨著部落格使用性的普及,其儼然已成為一項不可或缺之溝通媒介,使用者藉由部落格與其他部落客分享彼此的生活及想法,輕易地便可從部落格當中,查詢到豐富的信息。然而,在信息過載的情況下,使用者及企業如何從中有效地發掘重點信息為其關鍵要項。本研究提出一套FAIR模塊,并以美容保養品-雪肌精為例,以探勘部落格之關鍵信息為目的。
本研究嘗試以FAIR模塊,利用Fuzzy ART將關于雪肌精化妝水之部落格文章做分群,內容性質相似的文章得以群聚,從各群組中也可觀察出消費者對于該產品有哪些主要的特征及認知,并以LSI及AR幫助解讀各群組之涵義。于實際執行該模塊流程后發現,FAIR模塊可確實擷取出該產品之主要特征,于未事先了解該產品信息之前,通過FAIR之分析結果,即可大約掌握其產品之特征信息,對于企業決策者而言,能以實時且最有效之方法,掌握消費者對于該產品之重點認知及產品動向。
此外,對于企業而言,FAIR與質量機能展開之結合,不僅可提供其了解質量要項對于產品之影響力,以作為日后產品改善的參考,更進一步地提升了企業獲取消費者意見的效力,以質量機能展開而言,傳統做法的前置步驟為必需先經由市場調查及問卷分析,然而該過程往往必須耗費大量的人力及時間,但藉由FAIR模塊的執行,企業可于短時間內處理并掌握消費者于部落格所發表的評價及意見,以延伸至質量機能展開之應用。
5 致 謝
本研究受到臺灣科技會計劃(契約編號 NSC 96-2416-H-324-003-MY2)部分贊助,作者在此表達感謝之意。
主要參考文獻
[1] A N Bonnie, J S Diane, et al. Why We Blog[J]. Communications of the ACM, 2004, 47(12): 41-46.
[2] M Chau and J Xu. Mining Communities and Their Relationships in Blogs: A Study of Online Hate Groups[J]. International Journal of Human - Computer Studies, 2007, 65(1):57-70.
[3] 安德魯#8226;基恩. 你在看誰的部落格[M]. 尤傳莉,譯. 臺北:早安財經文化有限公司,2008.
[4] 陳穆臻. 青蛙變身術 Blog 行銷有多行?![J]. 管理雜志,2005(376): 114-117.
[5] 蔡孟珈. 個人部落格內容出版之探討[D]. 臺北:世新大學圖文傳播暨數位出版系,2007.
[6] S Todoroki, T Konishi, and S Inoue. Blog-Based Research Notebook: Personal Informatics Workbench for Highthroughput Experimentation[J]. Applied Surface Science, 2006, 252(7): 2640-2645.
[7] Yu-shan Lin, and Jun-Ying Huang.Internet Blogs as A Tourism Marketing Medium: A Case Study[J]. Journal of Business Research, 2006, 59(10/11): 1201-1205.
[8] F M Facca and P L Lanzi. Mining Interesting Knowledge from Weblogs: A Survey[J]. Data Knowledge Engineering, 2005, 53(3): 225-241.
[9] Y Chen, F S Tsai, and K L Chan. Machine Learning Techniques for Business Blog Search and Mining[J]. Expert Systems with Applications, 2008, 35(3): 581-590.
[10] G A Carpenter, S Grossberg and D B Rosen. Fuzzy ART: Fast Stable Learning and Categorization of Analog Patterns by an Adaptive Resonance System[J]. Neural Networks, 1991, 4(6): 759-771.
[11] S Deerwester, S T Dumais, et al. Indexing by Latent Semantic Analysis[J]. Journal of the Society for Information Science, 1990, 41(6): 391-407.
[12] R Agrawal, T Imielinski, and A Swami. Mining Association Rules between Sets of Items in Large Databases[C]. ACM SIGMOD International Conference on Management of Data, 1993: 207-216.
[13] R Agrawal and R Srikant. Fast Algorithm for Mining Association Rules[C]. 20th International Conference on Very Large Data Bases, 1994: 487-499.
[14] P Sungjine. Neural Networks and Customer Grouping in E-commerce:A Framework Using Fuzzy ART[C]. Proceedings of Academia/Industry Working Conference, 2000: 331-336.
[15] 謝正嘉. 應用Fuzzy ART與啟發式規則偵測數據庫異常聯機[R]. 臺中: 朝陽科技大學信息管理系,2006.
[16] L Chen and C Su. Using Granular Computing Model to Induce Scheduling Knowledge in Dynamic Manufacturing Environments[J]. International Journal of Computer Integrated Manufacturing, 2008, 21(5): 569-583.
[17] C Su, L Chen and Y Yih. Knowledge Acquisition through Information Granulation for Imbalanced Data[J]. Expert System with Applications, 2006, 31(3): 531-541.
[18]彭華瑞. 應用潛在式語意分析于語言模型之研究[D]. 臺南:成功大學資訊工程系,2002.
[19] 吳佳升.使用貝氏潛在語意分析于文件分類及信息檢索[D]. 臺南:成功大學資訊工程系,2005.
[20] 徐世輝. 全面質量管理[M]. 臺北: 華泰文化事業服務有限公司,2006.
Discovering Customer Needs Based on Data Mining from Blogs
CHEN Long-sheng,LIN Zi-cheng
(Department of Information Management, Chaoyang University of Technology
Township, Taichung County 41349, Taiwan, China)
Abstract:Due to the popularization of blogs, more and more enterprises attempt to acquire useful information from the huge amount of bloggers’ articles to discover customer needs, to trace market shift, and to assist them in improving quality of products or services. In addition, based on these discovered commercial knowledge, enterprises can analyze their strength and weakness compared with their competitors. Therefore, focusing on evaluation comments of products, this study proposes a FAIR (Fuzzy Adaptive resonance theory network based Information Retrieval) scheme by introducing fuzzy ART network, Latent Semantic Indexing (LSI), and Association Rules (AR) discovery to analyze evaluation comments of product features. In FAIR scheme, Fuzzy ART network first has been employed to segment bloggers. For each customer segment, we use LSI technique to retrieve important keywords. Then, in order to make the extracted keywords understandable, AR is presented to organize these keywords to form concepts. Finally, for further applications of these extracted voices of customers, Quality Function Deployment (QFD) and homogeneity analysis have been employed to transform customers needs to technical requirements and to understand the ability of competitors, respectively. Finally, a real case of cosmetics products has been provided to demonstrate the effectiveness of the proposed FAIR scheme.
Key words: Information Retrieval; Fuzzy Adaptive Resonance Theory Neural Network; Latent Semantic Indexing; Association Rule; Quality Function Deployment