999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于依存句法樹抽取APP軟件用戶評論的核心評價內容

2021-06-07 23:42:47羅壓瓊
現代信息科技 2021年24期

摘 ?要:隨著手機軟件的廣泛使用,應用市場中APP軟件用戶評論數據急劇增加,獲取用戶使用軟件真實反饋,能夠為開發者、下載者提供準確的修改意見和參考,減少時間花費。通過對大量APP軟件用戶評論進行研究,首先基于APP軟件用戶評論中的評價對象和評價觀點定義了核心評價內容,其次使用依存句法樹實現了對核心評價內容的抽取。實驗結果表明,能夠有效抽取APP軟件用戶評論中的核心評價內容,驗證了方法的有效性和可行性。

關鍵詞:APP軟件;用戶評論;評價對象;評價觀點;核心評價內容

中圖分類號:TP391.1 ? ? ? 文獻標識碼:A文章編號:2096-4706(2021)24-0016-05

Abstract: With the widespread use of mobile phone software, there is a sharp increase in the user comment data of APP software in the application market. Obtaining the real feedback of users using the software can provide accurate modification opinions and reference for developers and downloaders, and reduce their time cost. Through the research on a large number of APP software user comments, firstly, the core evaluation content is defined based on the evaluation object and evaluation viewpoint in APP software user comments. Secondly, the dependency syntax tree is used to extract the core evaluation content. The experimental results show that it can effectively extract the core evaluation content of APP software user comments, and verify the effectiveness and feasibility of the method.

Keywords: APP software; user comment; evaluation object; evaluation viewpoint; core evaluation content

0 ?引 ?言

APP軟件應用的普及,使得APP軟件用戶評論急劇增加,通過APP軟件用戶評論抽取評價內容,并形成用戶使用軟件之后的綜合反饋成為當前研究熱點。

姜巍等人[1]認為從海量、非結構化、有噪聲的評論中抽取出有用性的軟件特征及用戶觀點對于評論分析是尤為重要。Jiang等人[2]認為APP軟件的用戶評論中意見表達方式復雜多樣,為了獲取有意義的用戶反饋,對用戶評論的軟件功能意見表達進行自動挖掘是非常必要的。崔建苓等人[3]提出基于評論挖掘的需求獲取方法,針對APP存在的相關問題分類匯總,得到更多軟件相關的價值信息。錢宇等[4]認為APP市場上用戶發表的評論在APP軟件更新和重新設計中極其重要,且開發者對于用戶評論主要是軟件功能方面的意見被采納較多。

綜上所述,應用市場APP軟件的用戶評論,具有數量大、更新快、內容多樣等特點,海量的APP軟件用戶評論中包含了較多冗余內容,造成分析處理困難和反饋結果代表性不強等問題。為了獲得具有代表性的APP用戶使用綜合反饋,需要進一步抽取出APP軟件用戶評論中的核心評價內容,即以評價對象為中心,在整條APP軟件用戶評論中,抽取出既能體現評價觀點,又具有和評價對象間存在句法相關性的,稱為核心評價內容。所以我們對APP軟件用戶評論中核心評價內容的抽取主要是基于評價對象和評價觀點進行深層次的挖掘。該內容不僅可以引導未下載APP軟件的用戶看完核心評價內容后對APP軟件進行下載使用,而且也可以從另一方面反映出APP軟件存在的具體問題,給予開發者較確切的反饋結果。

文章的主要貢獻有:

(1)針對評價對象和評價觀點,給出了更深層次的核心評價內容的定義。

(2)應用核心評價內容的定義,針對APP軟件用戶評論特性采用依存句法樹的方法進行核心評價內容的抽取。

1 ?相關工作

針對用戶評論的評價內容抽取,國內外學者開展了相關研究。Suprayogi等[5]認為大量的評論會讓人很難找到和理解評論所包含的信息,提出了一個利用機器學習技術對評論內容分類的信息抽取模型。Poche等人[6]使用一種基于抽取頻率的冗余控制摘要技術SumBasic,去捕捉視頻中用戶評論中的主要關注點,提供高質量的評價內容。紀志偉[7]設計了一種基于初始觀點詞性規則自動迭代發現新的用戶觀點詞性規則的方法,以此抽取用戶評論觀點形成評價內容。劉偉[8]等針對Web用戶評論,使用深度加權的樹相似性算法將評論記錄從網頁中抽取出來,然后通過比較DOM(Document Object Model)樹中節點的一致性來實現對用戶評論內容的抽取。陳琪等[9]為了從用戶抱怨評論中提取有效信息,提出一種基于支持向量機和主題模型的評論分析方法 RASL(review analysis method based on SVM and LDA)。

當前研究針對用戶評論進行評價內容抽取,其抽取出的結果僅針對某一方面的信息,并不包含用戶評論中針對評價對象的詳細說明,或是評價觀點產生的原因。例如,文獻[6]通過識別用戶評論中的關注點,認為用戶評論中的關注點就是評價內容,并未包含原因。文獻[7,8]只通過評價觀點或者評價對象就代表評價內容這是一種片面的反饋。文獻[5,9]抽取評價內容基于類別的劃分,再進行評價內容抽取,導致內容抽取受到分類的局限性較大。

文章針對上述研究存在的不足,為進一步抽取APP軟件用戶評論中對評價對象的詳細說明,基于評價對象和評價觀點,提出了一種應用依存句法樹抽取APP軟件核心評價內容的方法。

2 ?核心評價內容的定義

在線網絡環境下,由于APP軟件用戶評論表達隨意、形式多種多樣,其用戶評論中所包含的信息讓人難以理解。通過閱讀大量抽取出評價對象及評價觀點的APP軟件用戶評論,我們發現,基于APP軟件用戶評論的特性,只有評價對象和評價觀點代表整條用戶評論的核心內容,是不完整的,沒有解決用戶的核心痛點問題。因此,為了便于挖掘APP軟件用戶評論的核心評價內容,得到高質量的用戶反饋,本文將給出核心評價內容的定義如下:

核心評價內容(content):體現對評價對象的詳細說明,抽取出用戶對評價對象產生評價觀點的原因的評論表達方式,包含詞、詞性、詞之間的關系3個屬性。評論庫中共有n條用戶評論,每條評論都有核心評價內容組成。

content=(1≤i≤n);

contenti=(1≤j≤m).

其中,word代表與評價對象相關的詞,speech代表相關詞的詞性,relation代表依存句法中與核心詞之間存在的關系。從定義可以看出,要確定一條APP軟件用戶評論的核心評價內容,評價對象和評價觀點是不可或缺的。

在APP軟件用戶評論中,從詞性的角度分析,評價對象主要以名詞或是名詞短語的形式出現,多為APP軟件的功能點。而評價觀點多傾向于形容詞或是副詞等各種組合情況去描述對APP軟件使用之后的態度。

胡甜媛等制定的評價對象及評價觀點抽取規則能實現對用戶評論的自動抽取[10],具有較高的準確率,因此本文采用該抽取規則識別APP軟件用戶評論中的評價對象和評價觀點。基于核心評價內容的定義,可以結合評價對象和評價觀點,得到具有代表性強,高質量的評價內容。

3 ?基于評價對象和評價觀點抽取核心評價內容

根據現有研究中對APP軟件用戶評論的處理方法技術,其中使用依存句法分析用戶評論能夠詳細描述詞與詞之間的關系,通過對大量APP軟件用戶評論中的評價對象和評價觀點進行觀察總結,發現用戶評論中基于評價對象和觀點中抽取評價內容是滿足一定的句法關系的,且這些句法關系是有規律可循的、可總結的、而非雜亂無章的,其中短語是構成句子的基礎[11],發現用戶評論的句法關系中包含的短語是描述整條用戶評論的主要核心內容。其中依存句法樹對于中文用戶評論分析效果是簡單高效的,不僅能得到詞與詞之間的關聯程度,還能表示詞的重要性,故本文選取依存句法樹的方法來描述詞與詞之間的關系。

若僅使用依存句法樹進行分析,樹中結點包含太多的冗余結點,即用戶評論中沒有實際意義的詞。這些詞都存在于依存句法樹中,造成抽取核心評價內容復雜困難。因此,為了能抽取出整條用戶評論中的對評價對象的詳細說明,即產生評價觀點的原因,需要對原始的依存句法樹進行剪枝處理。

剪枝處理需要先對結點進行標記操作。由于核心評價內容是對評價對象的詳細說明,需要先定位出評價對象所在的詞的位置。通過分析大量APP軟件用戶評論發現,距離中心詞越近,詞之間的關聯度越高。因此,查找其周圍的詞與評價對象的相關性,需要利用樹的特性,先查找到以評價對象為中心的親戚結點信息。查找到所有親戚結點之后,依然存在冗余問題,還需要對各類結點進行分析,分析過程如下。

首先在原始的依存句法樹中找到包含評價對象的結點,然后以此結點為中心查找其親戚結點(父親結點、兄弟結點、孩子結點)作為與評價對象相關的結點進行標記。

對于親戚結點中的結點,若結點信息中包含的關系是“標點符號”,則都不進行標記。其中對于兄弟結點,若包含了“并列關系”,我們就更改中心位置為該結點,查找該兄弟結點的親戚結點,若在此親戚結點中查找到了包含“主謂關系”的結點,將該結點與APP軟件簡介的特征詞計算相似度,若閾值大于0.5,說明發現了未被識別的評價對象,再次以新評價對象為中心,查找各結點進行相關詞標記。若未查找到包含“主謂關系”的結點,我們認為該兄弟結點是針對原始評價對象進行評論,也屬于相關詞,應該進行標記。

若是在原始的依存句法樹中就未找到評價對象的結點,我們就查找包含“主謂關系”的結點,利用上述軟件簡捷方法查看是否存在新的評價對象,對該評論進行合理標記。

經過結點標記之后,我們通過遍歷整棵依存句法樹,將未被標記的結點進行剪枝操作,然后由此結點產生的邊也進行相應的刪除,調整棵樹的結構,將評價對象所在的結點調整至根結點位置,其他相關結點保持關系不變。例如,用戶評論“都是非常好,就是歌曲有點少”,其中評論對象為“歌曲”,評價觀點為“有點少”,其畫出的原始依存句法樹如圖1(a)所示,通過標記之后剪枝留下的處理后的依存句法樹如圖1(b)所示。

根據處理后的句法依存樹,我們發現,部分依存句法樹上結點并不是核心表述,抽取APP軟件用戶評論核心評價內容時還需要充分考慮評價對象、評價觀點、詞性以及詞間依存關系。因此,我們通過遍歷整棵處理后的依存句法樹構建抽取算法思想如下:

首先我們遍歷整棵處理后的依存句法樹,通過判斷當前結點是否為APP軟件用戶評論中的相關評價對象,若是評價對象,我們繼續往下遍歷,若不是,我們查看是否屬于APP軟件的評價觀點或者最后的樹結點,若符合則認為核心評價內容就為整棵樹的結點信息組成,若以上都不滿足,我們通過查找當前結點的下一結點加入詞性判斷,即是否為否定副詞,合并新的評價對象,若不存在該詞性且該結點為新的評價對象,則計算該結點與軟件簡介之間的語義相似度,判斷是否為與軟件相關的評價對象,然后計算兩個評價對象間的最短路徑,其路徑通過的結點信息就是我們的核心評價內容的組成。

4 ?實驗結果與分析

4.1 ?實驗設置

實驗設置具體如下:

實驗數據。本文采用的實驗數據來自網絡爬蟲爬取的APP應用市場所有軟件的用戶評論,選取其中的66 001條評論進行實驗,其中人工標注的評論為24 532條作為驗證集。

(1)文本預處理。本文先將用戶評論中進行粗粒度篩選去除部分垃圾評論,再用Jieba分詞將用戶評論進行分詞及詞性識別,根據詞性組合規則得到用戶評論的評價對象和評價觀點,然后使用Hanlp工具包得到依存句法樹等預處理工作。

(2)評價標準。評價標準主要采用準確率(Accuracy)來驗證本文方法的有效性。準確率的計算公式如式1所示:

Accuracy=TP/(TP+FP) (1)

其中,TP表示本文方法的實驗抽取與人工標注抽取的評價內容是一致的評論條數,FP表示本文方法的實驗抽取與人工標注抽取的評價內容不是一致的評論條數,(TP+FP)表示總的人工標注的評論條數。

4.2 ?結果分析

4.2.1 ?本文方法分析

在本文實驗中,我們共選取了66 001條APP軟件用戶評論進行實驗,首先對這66 001條用戶評論進行識別評價對象和評價觀點存入數據庫備用。然后根據每一條識別出評價對象和評價觀點的用戶評論應用本文方法,抽取出APP軟件用戶評論核心評價內容。部分用戶評論經過標記后的結點信息如表1所示。

基于標記后的結點,對原始依存句法樹進行剪枝,調整樹結構等操作得到一顆處理過后的依存句法樹。最終,根據處理過后的依存句法樹結合APP軟件用戶評論的特性抽取核心評價內容。最后抽取結果如表2所示。

4.2.2 ?對比實驗

基于句法語義依存分析的中文金融事件抽取的算法[12]如下:首先對某一條財經新聞標題進行依存句法分析,然后定義一條核心動詞鏈,關于核心動詞鏈的構建是基于依存句法結構制定規則抽取,之后基于核心動詞鏈加入語義依存關系,構建一棵SSDP樹,之后在SSDP樹的基礎上通過制定規則,對該樹進行剪枝或是添加結點連線,生成一個SSDP圖,最后基于SSDP圖抽取出事件內容的主謂賓。

選取上述論文做對比實驗是由于該方法使用了依存句法,且基于該句法,變換樹或者圖的形式處理實驗對象,然后基于變換形式,總結規則抽取出實驗結果。為了進一步驗證我之前實驗的有效性,將該對比實驗的方法應用于中文用戶評論數據集。本文方法與對比實驗方法的實驗結果準確率如表3所示。其中SSDP為對比實驗方法的簡稱,Deal_DPtree為本文實驗方法的簡稱,由表3可以看出,當同一批數據集采用不同的方法抽取其核心評價內容,本文方法的抽取準確率較對比實驗的準確率高了10.56%,效果顯著。

5 ?結 ?論

文章提出一種基于依存句法樹抽取APP用戶評論中核心評價內容的方法,通過評價對象結合句法分析調整依存句法樹,并進行剪枝等操作。然后基于處理后的依存句法樹加入詞性,評價觀點等抽取出核心評價內容。最后在中文APP用戶評論數據集上驗證了本文方法的有效性。下一步將完善結點標記,精簡結點信息作為用戶評論的核心評價內容,并進一步的研究自動化抽取方法,降低規則制定的局限性。

參考文獻:

[1] 姜巍,張莉,戴翼,等.面向用戶需求獲取的在線評論有用性分析 [J].計算機學報,2013,36(1):119-131.

[2] WEI J,RUAN H,LI Z,et al. For User-Driven Software Evolution: Requirements Elicitation Derived from Mining Online Reviews [C]//Pacific-Asia Conference on Knowledge Discovery and Data Mining.Tainan:Springer International Publishing,2014:584-595.

[3] 崔建苓,楊達,李娟.RERM:一種基于評論挖掘的需求獲取方法 [J].計算機應用與軟件,2015,32(8):28-33.

[4] 錢宇,曹恩葉,鄧文君,等.海量用戶評論在APP更新設計中的參與作用挖掘 [J].系統工程理論與實踐,2021,41(3):554-564.

[5] SUPRAYOGI E,BUDI I,MAHENDRA R. Information Extraction for Mobile Application User Review[C]//2018 International Conference on Advanced Computer Science and Information Systems (ICACSIS).Yogyakarta:IEEE,2018:343-348.

[6] POCHE E,JHA N,WILLIAMS G,et al. Analyzing User Comments on YouTube Coding Tutorial Videos [C]//2017 IEEE/ACM 25th International Conference on Program Comprehension (ICPC).Buenos Aires:IEEE,2017:196-206.

[7] 紀志偉.基于描述和用戶評論的App應用市場信息挖掘 [D].杭州:浙江大學,2018.

[8] 劉偉,嚴華梁,肖建國,等.一種Web評論自動抽取方法 [J].軟件學報,2010,21(12):3220-3236.

[9] 陳琪,張莉,蔣競,等.一種基于支持向量機和主題模型的評論分析方法 [J].軟件學報,2019,30(5):1547-1560.

[10] 胡甜媛,姜瑛.體現使用反饋的APP軟件用戶評論挖掘 [J].軟件學報,2019,30(10):3168-3185.

[11] 王治敏,朱學鋒,俞士汶.基于現代漢語語法信息詞典的詞語情感評價研究 [J].中文計算語言學期刊,2005,10(4):581-591.

[12] 萬齊智,萬常選,胡蓉,等.基于句法語義依存分析的中文金融事件抽取 [J].計算機學報,2021,44(3):508-530.

作者簡介:羅壓瓊(1997.11—),女,壯族,云南個舊人,碩士研究生在讀,研究方向:軟件工程。

主站蜘蛛池模板: 国产精品香蕉在线| 国产精品第三页在线看| 亚洲国产午夜精华无码福利| 国产鲁鲁视频在线观看| 在线免费a视频| AV片亚洲国产男人的天堂| 亚洲第一区欧美国产综合| 久久精品国产91久久综合麻豆自制| 久久久久久久97| 国产另类视频| 亚洲AⅤ综合在线欧美一区| 亚洲一级毛片在线观| v天堂中文在线| 91av成人日本不卡三区| 91国内在线视频| 久久久久亚洲精品成人网| 91福利在线看| 国产精品所毛片视频| 狠狠色综合网| 日本人妻丰满熟妇区| 91视频首页| 婷婷六月在线| a网站在线观看| 国产精品主播| 99国产在线视频| 啪啪国产视频| 亚洲欧洲日产国码无码av喷潮| 国产精品自拍露脸视频| 91在线激情在线观看| 国产成人精品免费视频大全五级| 综合社区亚洲熟妇p| 国产剧情伊人| 国产在线视频欧美亚综合| 国产va免费精品观看| 欧美三级视频网站| 亚洲狠狠婷婷综合久久久久| 久久www视频| 伊人欧美在线| 国产玖玖视频| 午夜小视频在线| 久久亚洲美女精品国产精品| 亚洲国产成人麻豆精品| 日韩乱码免费一区二区三区| 国产免费观看av大片的网站| 欧美激情视频一区二区三区免费| 在线看片中文字幕| 19国产精品麻豆免费观看| 99激情网| 中日韩一区二区三区中文免费视频| 国产精品久久久免费视频| 日韩精品无码不卡无码| 精品视频第一页| 久久一色本道亚洲| 国产日本欧美在线观看| 亚洲第一精品福利| 欧美日韩动态图| 无码国内精品人妻少妇蜜桃视频| 亚洲日本韩在线观看| 国产导航在线| 黄色网站在线观看无码| 毛片免费在线| www.av男人.com| 成人无码区免费视频网站蜜臀| 久草网视频在线| 国内自拍久第一页| 好紧太爽了视频免费无码| 五月激情婷婷综合| 国产黄色爱视频| 精品久久久久无码| 国产精品久线在线观看| 婷婷综合亚洲| 91亚洲精选| 91麻豆精品国产91久久久久| 99久久性生片| 全午夜免费一级毛片| 国产成人91精品免费网址在线| 国产女人18水真多毛片18精品| 国产美女无遮挡免费视频| 久青草网站| 国产成人91精品免费网址在线| www.国产福利| 91偷拍一区|