999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向應用比較的用戶評論挖掘工具的設計與實現

2017-04-27 16:11:38劉興旺
電子技術與軟件工程 2016年15期

劉興旺

摘 要 隨著智能手機的迅速發展,移動應用市場的規模也越來越大,市場上涌現出數百萬移動應用。對于用戶來說,面對海量的應用軟件,會糾結于如何選擇自己想要的應用。雖然Google Play市場上提供了移動應用的分類,可是對于同樣的功能,每個類別下仍舊包含大量的應用,Google Play中雖然對每個應用提供評分和下載量供用戶參考,但是僅通過這些信息不足以幫用戶找到自己滿意的應用。因此設計一個相似應用比較工具是有意義的。本文先對現有的用戶評論和情感分析的相關研究做了總結,并在此基礎上,設計與實現了一個相似應用比較的用戶評論挖掘工具。通過挖掘用戶評論,提取了相似應用的對比信息,從而能夠為用戶提供更快捷的途徑來找到自己想要的應用。工具的實現包括爬取應用評論信息、應用名稱的簡稱提取、用戶評論的方向分析、用戶評論的情感分析等幾個部分。最終本文通過一些實例測試,驗證了抽取包含應用比較信息的評論的有效性。

【關鍵詞】用戶評論 移動應用 情感分析

1 研究背景

隨著信息技術的迅速發展,智能手機很快占據了手機市場。智能手機的功能變得越來越全面,不同功能的移動應用也越來越多。甚至在近幾年,功能相似的移動應用在應用市場上都不計其數。當然,功能相同相似的每個應用也有著各自的特點,有些在用戶界面上給用戶更好的體驗,有些更省電給用戶帶來更多的方便,有些在功能上更強大。而不同的用戶可能也有著不同的需求,因此用戶想要某種功能的應用的時候,總會面臨不知如何選擇的煩惱。

應用下的用戶評論是很有研究價值的數據。因此,可以考慮從用戶評論下手,很多手機應用市場如Google Play的應用下都有用戶的評論,用戶會把自己的體驗和感受寫下來,如果能夠挖掘出所有這樣的信息,并將他們中包含的相似應用之間的關系提取出來處理并分析,那么可以很好的解決用戶不知如何選擇應用的問題。

2 工具的設計

2.1 應用簡稱提取

可以發現許多應用被大家認為的名字,可能只是他在應用市場上官方全名的一部分,很多名字可能包含free, pro等后綴,例如Calculator Plus Free,而這往往會被用戶在評論時所忽略,可能用戶在提到這個應用時就會Calculator Plus來表示。因此,可以認為一個應用全名的任何一個子串,都是有可能被作為用戶提到的名字出現的。那么可以考慮枚舉每個名字的任何一個字串,例如上述應用Calculator Plus Free,那么我們認為Calculator、Plus、Free、Calculator Plus、Plus Free、Calculator Plus Free這六種形式都是有可能作為該應用的別稱。接下來,需要進一步的篩選。因為很明顯,如果將Free、plus這種詞作為一個應用的簡稱去在評論庫中匹配,會發現無數的無用評論,因為這些詞太過于常見。

本文用的方法是,如果發現一個有可能的別稱有在不同的應用中出現太多,那么把它排除。因為數據庫中有Google play應用市場的115萬個應用,因此像free、plus這種詞語,就能很輕松地排除了。那么剩下的雖然不那么熱門,但是還是有些明顯不會成為該應用的簡稱,例如plus free。因此還需要進一步進行篩選。可以認為,在自己應用下的評論,會有更多的提到自己應用名字的可能,因此可以在該應用自己的評論中去探索。下一步篩選的方法是,在該應用下的評論中去匹配,檢查初步篩選剩下的這些詞組,如果匹配到的詞數超過一定值,那么認為這個詞組是有可能成為該應用的別稱或簡稱的。

2.2 用戶評論方向分類

在完成對應用名字簡稱的提取后,接下來還需對用戶評論進行方向分析,即判斷每條評論是在描述應用的哪個方向。將評論方向分成十個大類,那么這一節將描述如何將評論劃入這些類別中。

先對每個方面找了一些非常具有代表性的詞。例如有bug、fix的詞語的評論肯定是bug report。從這些精確度極高的詞出發,在用這些詞語找到的評論中,再從這些評論中找那些十分近似的詞語,例如在許多錯誤報告評論中出現會出現tap這個詞,因為這個詞出現的地方往往是在描述屏幕沒反應后,怎么點擊屏幕都沒反應。還有類似slow、wait的看似常見的詞,實際上出現在評論里一般是用來描述應用的運行性能的詞。這些詞雖然精確度可能沒有百分之百,但是也是很高的,并且加上這些詞,覆蓋的可以判斷出方向的評論就大大提高了。

總結出代表性的詞語后,已經可以分析出很大一部分的評論的方向。不過應該注意的是,每個詞都有不同的形式,不同的語境下會有不同的變化,如過去式,第三人稱等等變化。如果直接用完整的詞去匹配,必然有很多詞的變形的情況會導致漏掉。來自猶他州立大學的Phong等人發表的一篇文章里,總結了不同的類型的詞的變形規則,他用一個很詳細的表描述了這些規則,以處理詞的不同形態。這里可以借用他們的規則。

有了這樣的一個規則表后,接下來只需將前面處理出來的詞語,全部對應這個規則來獲得他們在不同情感下的形式。這樣將擴展出來的詞也對應原來的詞的方向。然后將他們一起去在用戶評論中匹配。

2.3 評論傾向分析

通過前兩節的工作,已經可以找出大量帶有比較信息的評論,并且已經可以獲得每條評論的描述方向。接下來則需要對找到的帶比較信息的評論進行情感分析,分析出評論作者的觀點,對于比較的兩個應用,作者認為哪個應用在描述的方面有更好的效果。

關于情感分析這一部分工作從第二章中可以看到在學術研究方面已經很成熟,本文主要用的SentiWordNet是一個開源的情感分析工具,SentiWordNet給每個同義詞集分配三個情感分數:正面性、負面性以及客觀性,然后圍繞這三個分數,完成了對評論的情感分析。

3 實驗結果分析

3.1 比較性評論抽取結果分析

首先,先看看比較性評論抽取的精確性。用應用數量比較多的圖片類工具做抽取樣本舉例檢查。在接口處輸入Google Photos,返回的評論數量有390條。并且可以發現幾乎所有的匹配出來的評論全都是明確直接與Google Photo相比較的。極少數的來自一些系統工具的應用中的評論是非比較評論,他們評論使用Google Photos時會出現什么樣的狀況,而這樣的顯然不是將應用和Google Photos比較的評論。

本文一共找了6個圖片類型的應用來分析,并分析了他們的精確度,結果如圖7所示。可以看到,對于VSCO和Google Photos這種名字簡介并且比較熱門的應用,比較評論的精確度十分高;而對于Snapseed和Retrica這樣的應用,名字不具有完全的代表性,返回的評論數量更多,但是精確度卻降低了;Afterlight屬于不那么熱門的應用,雖然相關的評論不太多,但是卻有著較高的精確度;QuickPic Gallery應該是三星自帶的圖片應用,這樣的應用容易與三星其他自帶應用相聯系,因此精確度不那么高。從返回的評論數量來看,召回率也同樣是非常不錯的。(之前沒有這樣的工作,無法在龐大數量的評論中驗證召回率)當然,對于名字特別普遍的應用(如Moments,Battery),則會對返回評論的精確度大大折扣。同樣,對于冷門的應用也幾乎找不到比較性的評論。然而,我們認為只有熱門的應用之間的比較才是真正有價值的,因為冷門的應用相對而言比較小眾,用戶極少將它們去和其他應用比較。

3.2 抽取評論的方向及其情感分析結果

為了對比更清晰,依然對比較熱門的圖片應用進行分析,我們分析圖片應用Afterlight,這是另一個比較流行的圖片應用。在接口輸入后,從返回的結果看,方向分析的結果準確性是比較高的;但是結合上情感分析的結果后,準確性有些下滑。

整體看來,我們抽取了一百條評論做觀察,發現方向性分析的準確率在應該在百分之七十到八十之間(有些評論方向性太模糊,或者太長太復雜)。而結合上情感分析后,完整結果的準確率大概在百分之六十到七十之間。

4 總結與后續工作

從實驗結果來看,整體精確度在百分之六十到七十之間。這樣的精確度不算很高,不過鑒于本文所研究的課題是學術界比較新的方面,這樣的精確度至少證明了從評論中挖掘相似應用關系是一個可行的研究方向。并且形如“找一類應用中的某項功能最好的應用”這樣的需求是十分常見的,因此這樣的研究也有著很高的實際價值。

整個實驗中,比較需要改善的地方是評論方向和情感分析的結合。情感分析部分應用的是現有的工具,尋找評論方向的方法是通過匹配代表詞的方法,這時候當評論較長的時候,情感分析就容易找不到分析的目標:是對整個評論進行分析,還是針對代表詞所在句子分析,抑或是對代表詞前后的句子一起進行分析。這一部分的工作,本文做的實驗和分析還不夠完備,也是精確度不夠高的主要原因。如果這一部分的研究能更加深入,必定能提高一定的精確度。

總而言之,本文提出的研究課題是一個比較新的方向,它以用戶評論為基礎細粒度地挖掘相似應用之間的信息。我們通過應用簡稱提取,評論方向分析,評論情感分析三個步驟完成了整個工作,并通過實驗結果證明了用本文提出的工具確實可以挖掘到很多應用比較的信息。

參考文獻

[1]Phong,Tam “Mining User Opining in Mobile App Reviews:A Keyword-based Approach” In proceeding of NASA ADS

[2]M.Hu and B.Liu.“Mining and summarizing customer reviews.” In Proceedings of the tenth ACM SIGKDD international conference on knowledge discovery and data mining, pages 168-177,2004

[3]B.Fu, J.Lin,L.Li,C.Faloutsos, J.Hong,and N.Sadeh. “Why people hate your app:Making sense of user feedback in a mobile app store” In proceedings of the 19th ACM SIGKDD international conference on knowledge discovery and data mining, pages 1276-1284,2013

[4]D.M.Blei,A.Y.Ng,and M.I.Jordan. “Laentdirichlet allocation” the Journal of machine Learning research, 3:993-1022

[5]L.V.GalvisCarreno and K.Winbladh. Analysis of user comments:an approach for software requirements evolution.In proceedings of the 2013 International Conference on Software Engineering,pages 582-591,2013

[6]XiaodongGu,“What parts of your apps are loved by user”In proceeding of Automated Software Engineering, IEEE/ACM International Conference. Pages 760-770.

[7]N.Chen,J.Lin,S.C.Hoi,X.Xiao,and B. Zhang.“Ar-miner:mining informative reviews for developers from mobile app marketplace”.In Proceedings of the 36th International Conference on software Engineerings,pages 767-778, 2014.

作者單位

湖南生物機電職業技術學院 湖南省長沙市 410127

主站蜘蛛池模板: 国产亚洲视频免费播放| 99久久精品国产精品亚洲| 在线国产欧美| 亚洲最大情网站在线观看| 中国精品自拍| 中文字幕伦视频| 亚洲无码高清一区| 免费在线一区| 国产亚洲精品在天天在线麻豆| 日本一区二区不卡视频| 国产96在线 | 人人妻人人澡人人爽欧美一区 | 美女免费精品高清毛片在线视| 亚洲天堂视频在线观看免费| 9啪在线视频| 国产成人精品无码一区二| 五月综合色婷婷| 18禁影院亚洲专区| 91成人在线观看| 成人福利视频网| 国产亚洲欧美在线人成aaaa| 欧美成人综合在线| 激情综合网激情综合| 久久亚洲中文字幕精品一区| 99re66精品视频在线观看| 国产亚洲视频免费播放| 波多野结衣中文字幕久久| 国产真实乱了在线播放| 黄色网页在线观看| 毛片基地美国正在播放亚洲| 国产Av无码精品色午夜| 免费观看精品视频999| 亚洲第一视频区| 国产成人一二三| 免费毛片全部不收费的| 国产精品久久久久久久久kt| 一级毛片免费播放视频| 国产美女一级毛片| 亚洲熟女中文字幕男人总站| 国产成人精品男人的天堂下载| 午夜一区二区三区| 久久国产精品麻豆系列| 亚洲国产精品久久久久秋霞影院| 国产一在线| 欧美中出一区二区| 国产成人综合网在线观看| 999福利激情视频| 成人午夜天| 欧美日韩精品一区二区视频| 亚洲精品自产拍在线观看APP| 日本三级黄在线观看| 一级片一区| 成色7777精品在线| 国产粉嫩粉嫩的18在线播放91| 成人精品视频一区二区在线| 亚洲第一成年人网站| 精品视频一区二区观看| 国产Av无码精品色午夜| 久久精品国产精品国产一区| 亚洲无码熟妇人妻AV在线| 粉嫩国产白浆在线观看| 国国产a国产片免费麻豆| 欧美亚洲国产一区| 黄片一区二区三区| 午夜无码一区二区三区| 伊人久综合| 免费毛片全部不收费的| 巨熟乳波霸若妻中文观看免费| 亚洲国产日韩在线成人蜜芽| 亚洲日韩国产精品无码专区| 国产精品永久久久久| 国产95在线 | 欧美国产在线精品17p| 国产91丝袜在线观看| 视频二区欧美| 在线观看亚洲国产| 国产在线观看人成激情视频| 日本免费一区视频| 91亚瑟视频| 91成人在线观看| 国产精品乱偷免费视频| 伊人丁香五月天久久综合|