999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于boosting算法的中文情感分類(lèi)研究

2017-07-05 17:47:23黃彬
電子技術(shù)與軟件工程 2017年12期

摘 要現(xiàn)如今對(duì)文本情感分類(lèi)的方法多種多樣,將語(yǔ)義理解與統(tǒng)計(jì)學(xué)方法相結(jié)合的機(jī)器學(xué)習(xí)算法是目前比較可取的方法之一。這種算法的步驟是,首先對(duì)文本中的情感詞匯進(jìn)行匯總,作為特征應(yīng)用,通過(guò)統(tǒng)計(jì)學(xué)方法衡量出這些特征的初始權(quán)重,然后通過(guò)對(duì)文本語(yǔ)義結(jié)構(gòu)進(jìn)行分析修改特征權(quán)重,最后應(yīng)用以Bayesian作為基本分類(lèi)算法的Boosting算法對(duì)文本最終進(jìn)行分類(lèi)。實(shí)驗(yàn)結(jié)果表明,基于語(yǔ)義理解的Bayesian分類(lèi)算法的分類(lèi)準(zhǔn)確率遠(yuǎn)遠(yuǎn)的高于基于統(tǒng)計(jì)學(xué)的Bayesian分類(lèi)算法,這種算法的分類(lèi)準(zhǔn)確率最高可以達(dá)到百分之九十。

【關(guān)鍵詞】語(yǔ)義理解 情感分類(lèi) Boosting算法

以情感為基礎(chǔ)開(kāi)展的文本分類(lèi)活動(dòng)也就是文本情感分類(lèi),主要是在分類(lèi)的過(guò)程當(dāng)中,分析文本當(dāng)中體現(xiàn)的情感傾向,并以此為基礎(chǔ)加以分類(lèi)。它在眾多方面都有廣泛應(yīng)用,例如智能問(wèn)答、商品推薦、股票預(yù)測(cè)以及報(bào)刊編輯等領(lǐng)域,都體現(xiàn)出潛在的應(yīng)用價(jià)值。在分析文本當(dāng)中語(yǔ)義傾向性的前提下,借助于判斷基準(zhǔn)詞同詞匯之間相似度的這一方法,來(lái)有效判斷詞匯體現(xiàn)出的感情傾向性。除此之外,通過(guò)分析詞匯當(dāng)中的語(yǔ)義傾,還能夠體現(xiàn)出新聞文本的態(tài)度。部分研究人員改進(jìn)SO-PMI算法,并且嘗試應(yīng)用到文本的情感分類(lèi)當(dāng)中,取得比較理想的成果,給了他人很多的新思路。以語(yǔ)義當(dāng)作基礎(chǔ)進(jìn)行分類(lèi)的方法,在很大程度上減少了樣本訓(xùn)練量,同時(shí)減輕對(duì)特定專(zhuān)業(yè)知識(shí)的依賴程度。當(dāng)前情況下,大量的研究人員在該領(lǐng)域嘗試進(jìn)行研究,已經(jīng)有了很大的突破,但仍然存在一個(gè)問(wèn)題,那就是還不能具體有效分析詞匯在傾向性方面的強(qiáng)度。在統(tǒng)計(jì)機(jī)器學(xué)習(xí)領(lǐng)域,有研究人員嘗試應(yīng)用機(jī)器學(xué)習(xí)技術(shù)來(lái)解決文本的情感分類(lèi)難題,其中應(yīng)用比較廣泛的包括樸素貝葉斯算法以及最大熵技術(shù)等,來(lái)分類(lèi)電影評(píng)論。為了把基于統(tǒng)計(jì)學(xué)技術(shù)的優(yōu)勢(shì)發(fā)揮到極致,但同時(shí)還不能過(guò)分的依賴于統(tǒng)計(jì)學(xué)方法,本篇文章利用自然的語(yǔ)言處理算法,介紹語(yǔ)義分析技術(shù)以及統(tǒng)計(jì)學(xué)技術(shù)綜合應(yīng)用的優(yōu)點(diǎn),借助于分析語(yǔ)義并且確定特征權(quán)重,外加利用Bayesian算法進(jìn)行情感分類(lèi)。為了進(jìn)一步減少文本在情感分類(lèi)過(guò)程當(dāng)中的誤差,改進(jìn)分類(lèi)的效果,在此嘗試應(yīng)用Boosting算法到文本的情感分類(lèi)當(dāng)中,實(shí)現(xiàn)基于語(yǔ)義的Boosting情感分類(lèi),進(jìn)一步改進(jìn)情感傾向性處理水平。

1 語(yǔ)義傾向性分析

語(yǔ)義傾向指的是某個(gè)詞匯同詞匯體現(xiàn)的概念詞之間主要內(nèi)涵的偏離程度,可以說(shuō)是度量語(yǔ)言的重要標(biāo)尺。通常情況下應(yīng)用兩個(gè)不同的維度來(lái)分析特定詞匯的傾向性,也就是偏離方向的判斷以及偏離強(qiáng)度的判斷,這些度量方法在現(xiàn)實(shí)生活當(dāng)中已經(jīng)得到廣泛應(yīng)用。在文本情感分類(lèi)環(huán)節(jié),偏離方向是判斷詞匯含義于貶義或者是褒義,具體而言就是確保文本可以更通俗易懂進(jìn)行表達(dá),因此也叫做情感方向。所謂偏離強(qiáng)度是指褒義程度或者是或貶義程度的大小,也叫做情感強(qiáng)度。分析語(yǔ)義的傾向性也就是分析不同詞語(yǔ)體現(xiàn)的情感傾向,來(lái)具體分析文檔整體上的情感傾向,在這其中需要測(cè)定的便就是情感強(qiáng)度以及情感方向。

2 Boosting算法

Boosting算法是由最早由Schapire提出,并且在發(fā)展過(guò)程當(dāng)中不斷有研究人員對(duì)其進(jìn)行改進(jìn),是近些年應(yīng)用最為廣泛的學(xué)習(xí)算法之一,同時(shí)也是應(yīng)用最廣泛的,其所應(yīng)用的理念類(lèi)似于合并不同的學(xué)習(xí)模型并完成輸出。因?yàn)檫@一算法簡(jiǎn)單易用,除了調(diào)解迭代次數(shù)之外不需要調(diào)解其它的參數(shù),也不需要了解特定領(lǐng)域。只要數(shù)據(jù)足夠充分,就可以滿足預(yù)測(cè)的精度。如今,Boosting算法正漸漸的得到了人們重視,在圖像識(shí)別以及模式處理當(dāng)中得到應(yīng)用,并生成了一系列的分類(lèi)器,不過(guò)每個(gè)分類(lèi)器還依舊有著之前一個(gè)的影子,因此,為了減少錯(cuò)誤率的累加,就給予上一次分類(lèi)器錯(cuò)誤分類(lèi)的樣例更高的權(quán)重。

3 Bayesian—Boosting情感分類(lèi)

通過(guò)采用的是Bayesian分類(lèi)方法對(duì)情感特征進(jìn)行選取及權(quán)重計(jì)算,首先要做的是對(duì)文本的特征空間有著非常清晰的界定,可以應(yīng)用特征來(lái)來(lái)替代文本。不過(guò)文本當(dāng)中的情感傾向主要是由文本當(dāng)中的情感詞來(lái)確定的,同其他的詞匯沒(méi)有太大的聯(lián)系。所以在情感分類(lèi)的時(shí)候,特征空間需要篩選情感詞匯,而不需要囊括全部詞匯組成特征空間。目前而言對(duì)于這種算法的研究成果已經(jīng)在眾多的國(guó)家863計(jì)劃項(xiàng)目中出現(xiàn),在情感模塊當(dāng)中應(yīng)用效果理想。本文基于語(yǔ)義理解的學(xué)習(xí)方法,是文本進(jìn)行情感分類(lèi)的新思路。從理論角度而言,對(duì)詞匯進(jìn)行褒貶的時(shí)候,僅僅依靠統(tǒng)計(jì)學(xué)措施無(wú)法實(shí)現(xiàn),必然會(huì)對(duì)情感分類(lèi)的標(biāo)準(zhǔn)產(chǎn)生結(jié)構(gòu)性的影響,也就是說(shuō)單純應(yīng)用語(yǔ)義理解計(jì)算來(lái)情感分類(lèi),也無(wú)法將機(jī)器學(xué)習(xí)的成果應(yīng)用的活靈活現(xiàn)。

通過(guò)語(yǔ)文理解對(duì)訓(xùn)練樣本集中300篇文本進(jìn)行分類(lèi),然后選擇出感情傾向明顯的前150篇作為SVM的訓(xùn)練文本,之后進(jìn)行三組數(shù)據(jù)分析,在特征選擇過(guò)程中分別判斷文檔頻率、X2統(tǒng)計(jì)法進(jìn)行統(tǒng)計(jì),如表1所示。

通過(guò)應(yīng)用統(tǒng)計(jì)學(xué)方法衡量出這些特征的初始權(quán)重,然后通過(guò)對(duì)文本語(yǔ)義結(jié)構(gòu)進(jìn)行分析修改特征權(quán)重,最后應(yīng)用以Bayesian作為基本分類(lèi)算法的Boosting算法對(duì)文本最終進(jìn)行分類(lèi)。實(shí)驗(yàn)結(jié)果表明,基于語(yǔ)義理解的Bayesian分類(lèi)算法的分類(lèi)準(zhǔn)確率遠(yuǎn)遠(yuǎn)的高于基于統(tǒng)計(jì)學(xué)的Bayesian分類(lèi)算法,這種算法的分類(lèi)準(zhǔn)確率最高可以達(dá)到百分之九十。

綜上所述,本篇文章通過(guò)介紹語(yǔ)義理解以及統(tǒng)計(jì)學(xué)技術(shù)相結(jié)合起來(lái)進(jìn)行文本分類(lèi)的效果,可以實(shí)現(xiàn)理想的情感分類(lèi),讓我們對(duì)這種分類(lèi)方法有了具體了解的同時(shí)還能夠解決文本的情感分類(lèi)。Boosting集合不同分類(lèi)算法,通過(guò)訓(xùn)練迭代來(lái)改進(jìn)分類(lèi)效果,最終能夠得到理想的分類(lèi)器。

參考文獻(xiàn)

[1]翟璐.一種基于Boosting算法的新模型在銀行信用評(píng)級(jí)中的應(yīng)用[D].北京交通大學(xué),2016,6(20):39-40.

[2]Romano Y,Elad M.Boosting of Image Denoising Algorithms[J].Siam Journal on Imaging Sciences,2015,8(02):1187-1219.

[3]Wu J,Pan S,Zhu X,et al.Boosting for multi-graph classification.[J].IEEE Transactions on Cybernetics,2015,45(03):430.

[4]Schreiner T,Rasch B.Boosting Vocabulary Learning by Verbal Cueing During Sleep.[J].Cerebral Cortex,2015,25(11):4169.

[5]Korytkowski M,Rutkowski L,Scherer R.Fast image classification by boosting fuzzy classifiers[J].Information Sciences,2015,327(C):175-182.

[6]Liu L,Zou P,Zheng L,et al.Tamoxifen reduces fat mass by boosting reactive oxygen species[J].Cell Death & Disease,2015,6(06):e1586.

作者簡(jiǎn)介

黃彬(1992-),男,長(zhǎng)江大學(xué)計(jì)算機(jī)科學(xué)學(xué)院在讀研究生。主要研究方向?yàn)榇髷?shù)據(jù)技術(shù)。

作者單位

長(zhǎng)江大學(xué)計(jì)算機(jī)科學(xué)學(xué)院 湖北省荊州市 434023

主站蜘蛛池模板: 91九色最新地址| 丝袜美女被出水视频一区| 尤物国产在线| 亚洲国产精品日韩欧美一区| 乱人伦中文视频在线观看免费| 九九免费观看全部免费视频| 蜜桃视频一区二区| 日本黄色a视频| 精品国产乱码久久久久久一区二区| 国产成人精品一区二区三在线观看| 国产aⅴ无码专区亚洲av综合网| 日韩大片免费观看视频播放| 久久综合九色综合97婷婷| 一级片一区| 中文成人在线视频| 精品国产黑色丝袜高跟鞋| 人妻丰满熟妇αv无码| 国产精品自在线拍国产电影| 日韩无码视频播放| 久久精品人人做人人| 国产黄色免费看| 国产伦片中文免费观看| 国产精品无码AV中文| 成人午夜在线播放| 一区二区欧美日韩高清免费| 国产18在线| 亚洲高清日韩heyzo| 亚洲天堂首页| 欧美亚洲激情| 国产成人综合日韩精品无码首页 | 亚洲天堂视频在线免费观看| 国产拍揄自揄精品视频网站| 亚洲开心婷婷中文字幕| 亚洲91在线精品| 日本午夜网站| 亚洲国产成人超福利久久精品| 青青草国产一区二区三区| 国产日韩欧美中文| JIZZ亚洲国产| 二级特黄绝大片免费视频大片| 91精选国产大片| 国产欧美日韩在线在线不卡视频| 亚洲国产日韩视频观看| 91黄视频在线观看| 精品久久香蕉国产线看观看gif| 午夜色综合| 国产日韩欧美在线播放| 亚洲天堂成人在线观看| 人禽伦免费交视频网页播放| 九色在线观看视频| 欧美在线综合视频| 国产亚洲视频免费播放| 日本高清免费一本在线观看| 嫩草在线视频| 亚洲色中色| 国产精品女人呻吟在线观看| 国产成人免费观看在线视频| 日本欧美视频在线观看| 99青青青精品视频在线| 伊人久久大线影院首页| 国产va在线| 国产亚洲欧美日韩在线一区| 国产日韩精品欧美一区喷| 国产无码性爱一区二区三区| 亚洲欧洲一区二区三区| Jizz国产色系免费| 本亚洲精品网站| 国产在线小视频| 黄片一区二区三区| 国产免费久久精品44| 久久黄色免费电影| 午夜小视频在线| 国产亚洲高清在线精品99| 国产91线观看| 国产亚洲高清视频| 99久久99这里只有免费的精品| 国产精品亚洲精品爽爽| 精品国产香蕉伊思人在线| 奇米影视狠狠精品7777| 国产欧美精品专区一区二区| 国产99视频在线| AV天堂资源福利在线观看|