999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

結(jié)合機(jī)器學(xué)習(xí)提升規(guī)則維護(hù)效率

2018-02-26 16:09:39鄧杰
科技視界 2017年36期
關(guān)鍵詞:機(jī)器學(xué)習(xí)

鄧杰

【摘 要】在大數(shù)據(jù)的領(lǐng)域中,對(duì)大量數(shù)據(jù)的文本分析是基石,后面的所有數(shù)據(jù)的解析都是依賴與此,規(guī)則維護(hù)的效率以及準(zhǔn)確率至關(guān)重要。本文主要是對(duì)比了目前常用的幾種語義分析的方法,提出了相對(duì)來說效率更高,準(zhǔn)確率也能得到保障的方法。

【關(guān)鍵詞】文本分析;手工編寫規(guī)則;機(jī)器學(xué)習(xí)

1 背景內(nèi)容

規(guī)則維護(hù)的辦法,目前主要思路如下:先整理大量的樣本數(shù)據(jù),先手工打上各種分類標(biāo)簽或者關(guān)鍵字,然后以這些手工梳理好后的樣本數(shù)據(jù)或者關(guān)鍵字為基準(zhǔn)去手工編寫規(guī)則。

但是后期隨著關(guān)鍵字的變化或者樣本數(shù)據(jù)的豐富,會(huì)發(fā)現(xiàn)現(xiàn)有規(guī)則的準(zhǔn)確性、覆蓋率越來越低,甚至出現(xiàn)大量的樣本數(shù)據(jù)都匹配不到現(xiàn)在的分類中。定期對(duì)現(xiàn)有規(guī)則的維護(hù)是一項(xiàng)很重要并且很必須的工作。

隨著規(guī)則的積累和樣本量的增加,手工維護(hù)規(guī)則的工作量會(huì)越來越來,為了保證語義分析的效果,規(guī)則開發(fā)維護(hù)的人員會(huì)越來越多,會(huì)使得成本增加;另一方面因?yàn)橐?guī)則的積累,導(dǎo)致規(guī)則混亂,在累加規(guī)則中,甚至?xí)霈F(xiàn)在手工維護(hù)規(guī)則后,規(guī)則的準(zhǔn)確性和覆蓋性越來越低。

2 文本分析常用方法

2.1 手工編寫規(guī)則

1)提供大量的樣本數(shù)據(jù);

2)通過人工手動(dòng)去打上相應(yīng)的標(biāo)簽、關(guān)鍵字;

3)數(shù)據(jù)分析師根據(jù)關(guān)鍵詞,輸出分類對(duì)應(yīng)的規(guī)則;

4)再用另外一部分樣本去驗(yàn)證手工編寫規(guī)則的準(zhǔn)確率、覆蓋率;

5)對(duì)于有明顯某些分類的準(zhǔn)確率覆蓋率較低的分類,需要專項(xiàng)再重新去分析優(yōu)化。

優(yōu)點(diǎn):

相應(yīng)分類樣本充足的情況下,準(zhǔn)確率覆蓋率都可以達(dá)到較高的值。

缺點(diǎn):

需要大量的業(yè)務(wù)人員,能夠?qū)颖緮?shù)據(jù)歸納分類;

需要大量的分析師,并且對(duì)分析師要求還較高,需要了解業(yè)務(wù),能夠通過大量數(shù)據(jù)識(shí)別關(guān)鍵字進(jìn)行分析;

編寫規(guī)則的周期較長(zhǎng);

規(guī)則需要定期維護(hù),否則準(zhǔn)確率覆蓋率會(huì)逐漸降低;

由于樣本局限性,在實(shí)際應(yīng)用場(chǎng)景中,會(huì)有大量的數(shù)據(jù)匹配不到分類;

2.2 機(jī)器學(xué)習(xí)通過訓(xùn)練生成數(shù)據(jù)模型

1)提供樣本數(shù)據(jù)(對(duì)比手工編寫規(guī)則的量要?。?;

2)用樣本數(shù)據(jù)做訓(xùn)練,生成數(shù)據(jù)模型;

3)用訓(xùn)練后的數(shù)據(jù)模型驗(yàn)證新的樣本數(shù)據(jù);

4)對(duì)于準(zhǔn)確性較差的分類,需要再次調(diào)整優(yōu)化數(shù)據(jù)模型,提高準(zhǔn)確率。

優(yōu)點(diǎn):

規(guī)則周期短;

需要的人力少;

需要樣本量相對(duì)來說少;

缺點(diǎn):

整體的準(zhǔn)確率達(dá)不到手工編寫規(guī)則的值;

3 機(jī)器學(xué)習(xí)結(jié)合人工編寫規(guī)則

3.1 方法論的產(chǎn)生

純手工維護(hù)規(guī)則,可以使得某些分類的準(zhǔn)確率達(dá)到很高,但是輸出規(guī)則需要很長(zhǎng)的周期,并且也很多人力支撐,輸出的規(guī)則很有局限性,不在樣本范圍內(nèi)的規(guī)則或者關(guān)鍵字,無法識(shí)別,后期需要很高的維

成本;

機(jī)器學(xué)習(xí)通過訓(xùn)練,能夠很快速的生成數(shù)據(jù)模型,對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行分析。但是準(zhǔn)確率無法達(dá)到手工收工維護(hù)規(guī)則的程度。

手工維護(hù)規(guī)則精度夠,但是周期長(zhǎng)、可擴(kuò)展性不強(qiáng);機(jī)器學(xué)習(xí)可擴(kuò)展性好,周期短,但是精度不夠。

那何不集合這兩種方法的優(yōu)點(diǎn),提升規(guī)則維護(hù)效率,縮短規(guī)則生成周期,并且后期維護(hù)成本也不用那么高。

3.2 方法步驟

1)提供樣本數(shù)據(jù)(對(duì)比手工編寫規(guī)則的量要?。?;

2)通過樣本數(shù)據(jù)做訓(xùn)練,生成數(shù)據(jù)模型;

3)用訓(xùn)練后的數(shù)據(jù)模型驗(yàn)證新的樣本數(shù)據(jù);

4)對(duì)于準(zhǔn)確率較差的分類,需要再次調(diào)整優(yōu)化提高準(zhǔn)確性5)模型訓(xùn)練后準(zhǔn)確性還是較差的分類,手工編寫規(guī)則,提供準(zhǔn)確性;

6)機(jī)器學(xué)習(xí)可以輸出相應(yīng)的關(guān)鍵字,提高了編寫規(guī)則的效率;

7)對(duì)于后期新增的業(yè)務(wù)場(chǎng)景和數(shù)據(jù),機(jī)器學(xué)習(xí)可以及時(shí)識(shí)別,降低了無法識(shí)別分類的概率。

3.3 方法論總結(jié)

機(jī)器學(xué)習(xí)和傳統(tǒng)的手工編寫規(guī)則相結(jié)合的方法,既提高了規(guī)則輸出的效率,又保障了一定的準(zhǔn)確性;既減少了維護(hù)工作的人力訴求,也保障了維護(hù)工作的準(zhǔn)確率的穩(wěn)定性。兩者相互取長(zhǎng)補(bǔ)短,互相融合使用,可以有效得提升規(guī)則維護(hù)得效率。

猜你喜歡
機(jī)器學(xué)習(xí)
基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
前綴字母為特征在維吾爾語文本情感分類中的研究
下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機(jī)的金融數(shù)據(jù)分析研究
基于Spark的大數(shù)據(jù)計(jì)算模型
基于樸素貝葉斯算法的垃圾短信智能識(shí)別系統(tǒng)
基于圖的半監(jiān)督學(xué)習(xí)方法綜述
機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
極限學(xué)習(xí)機(jī)在圖像分割中的應(yīng)用
主站蜘蛛池模板: 国产成人AV综合久久| 日本成人不卡视频| 亚洲成综合人影院在院播放| 亚洲一区二区三区麻豆| 国产打屁股免费区网站| 在线欧美国产| 午夜视频日本| 国产成人精彩在线视频50| 亚洲美女一级毛片| 97国产成人无码精品久久久| 欧美视频二区| 久久精品丝袜| 国产青青草视频| 玖玖免费视频在线观看| 女人av社区男人的天堂| 亚洲中文在线看视频一区| 午夜毛片福利| 久久久久国产精品熟女影院| 美女毛片在线| 亚洲第一区在线| 国产福利微拍精品一区二区| 精品久久久久久成人AV| 久久亚洲美女精品国产精品| 激情综合婷婷丁香五月尤物| 国产原创演绎剧情有字幕的| 无码丝袜人妻| 熟妇人妻无乱码中文字幕真矢织江| 久久久久中文字幕精品视频| 中文字幕欧美日韩| 欧美在线导航| 精品人妻一区无码视频| www.99在线观看| 国产成人精品视频一区视频二区| 国产激情在线视频| 久久人体视频| 高清色本在线www| 久久情精品国产品免费| 国产一区成人| 任我操在线视频| 国产欧美日韩精品综合在线| 久青草网站| 午夜一级做a爰片久久毛片| 日韩黄色在线| 日韩成人高清无码| 午夜精品区| 免费一极毛片| 国产男女免费完整版视频| 国产无码制服丝袜| 精品国产免费观看一区| 内射人妻无码色AV天堂| 国产人成午夜免费看| 熟妇丰满人妻av无码区| 亚洲天堂视频网站| 国产福利微拍精品一区二区| 无码啪啪精品天堂浪潮av| 免费激情网址| 亚洲第一福利视频导航| 国产美女在线观看| 国产国产人成免费视频77777| 国产精品美女在线| 国产18在线播放| 国产黑丝视频在线观看| 国产精品99久久久| 欧美午夜网| 久久香蕉国产线| 91欧美在线| 91麻豆国产在线| 亚洲国产91人成在线| 午夜国产在线观看| 欧美19综合中文字幕| 亚洲一级毛片| 国产亚洲美日韩AV中文字幕无码成人| 免费看av在线网站网址| 亚洲人在线| 亚洲精品视频免费看| 在线观看91香蕉国产免费| 国产毛片久久国产| 亚洲欧洲AV一区二区三区| 国产三级精品三级在线观看| 亚洲欧洲日韩综合色天使| 欧美97欧美综合色伦图| 免费啪啪网址|