999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于N—gram模型的中文分詞前k優算法

2017-05-08 12:33:25李書豪陳宇呂淑寶張猛治
智能計算機與應用 2016年6期

李書豪++陳宇++呂淑寶++張猛治

摘要:本文首先從中文輸入法應用的角度出發,在闡述了N-gram模型的基礎上對中文輸入法的分詞進行了詳細的剖析,進一步根據訓練數據的稀疏問題,使用Back-off模型進行數據的平滑處理。針對系統詞庫數量受限的問題,在構建詞圖的前提下,使用基于A*的算法求解前k優路徑。最后實驗結果表明,本文所使用的基于A*的算法與改進Dijkstra算法、基于DP的算法等常用的求前k優路徑的算法相比,具有較高的效率和準確率,為中文分詞及求取k-best算法的研究開拓了新的思路。

關鍵詞:中文輸入法; N-gram模型; k優路徑; A*算法

中圖分類號: TP391

文獻標志碼:A

文章編號: 2095-2163(2016)06-0031-05

0引言

[JP2]中文輸入法(Chinese input method)是指為了將漢字輸入計算機或手機等電子設備而采用的編碼方法,是中文信息處理的重要技術。時下的中文輸入法可分為基于音標(Phonetic-based)和基于字形(Shape-based)兩種類型[1],本文使用的方法則屬于第一類。一個具有整句輸入功能的輸入法主要包括著以下部分:首先是語言模型,語言模型將提供輸入法其他部分所需要的信息;其次是輸入處理(拼音流切分)[2],該部分把輸入的拼音流切分為單個音節的序列,供音-字轉換部分設計使用;最后是音-字轉換部分,該部分將處理好的單音節序列轉化為漢字編碼進行結果輸出。其中,漢語的語言模型大體上可劃定為基于字和基于詞的這樣2個研究進展方向。[JP3]

而為了提供整句輸入,并減少輸入成本,基于詞的語言模型即已成為本次分析處理首選。……

登錄APP查看全文

主站蜘蛛池模板: 国产福利拍拍拍| 亚洲精品在线影院| 自拍偷拍欧美日韩| 伊人国产无码高清视频| 在线视频精品一区| 国产精品专区第1页| 亚洲色大成网站www国产| 午夜日b视频| 国产丝袜无码精品| 色综合天天操| 91国语视频| 免费又黄又爽又猛大片午夜| 91精品啪在线观看国产| 99精品伊人久久久大香线蕉| 黄片一区二区三区| 亚洲精品国产综合99久久夜夜嗨| 国产精品欧美在线观看| 精品福利网| 狠狠v日韩v欧美v| 国内精品小视频在线| 人妻21p大胆| 九月婷婷亚洲综合在线| 久久香蕉国产线| 蜜桃视频一区| 久久精品亚洲热综合一区二区| 亚洲成人网在线观看| 亚洲中文在线视频| 免费AV在线播放观看18禁强制| 精品国产自在现线看久久| 国产精品久久精品| 伦伦影院精品一区| 国产区在线观看视频| 国产成人久久777777| 国产精品妖精视频| 欧美一区二区精品久久久| 亚洲乱亚洲乱妇24p| 成人欧美在线观看| 欧美高清国产| 999国产精品永久免费视频精品久久 | 国产乱论视频| 中字无码精油按摩中出视频| 久久青草精品一区二区三区 | 一区二区偷拍美女撒尿视频| 国产国产人在线成免费视频狼人色| 国产亚洲欧美在线中文bt天堂| 欧美全免费aaaaaa特黄在线| 四虎亚洲精品| 就去吻亚洲精品国产欧美| 国产精品亚洲一区二区三区z| 国产在线98福利播放视频免费| 91久久夜色精品国产网站| av无码一区二区三区在线| 伊人婷婷色香五月综合缴缴情| 久久综合丝袜长腿丝袜| 免费高清毛片| 亚洲综合中文字幕国产精品欧美| 亚洲精品国产自在现线最新| 黄色福利在线| 色悠久久久久久久综合网伊人| 色噜噜在线观看| 91精品专区| 婷婷色中文| 欧美第九页| 久久美女精品国产精品亚洲| 日本亚洲成高清一区二区三区| 免费看美女毛片| 国产人人射| 亚洲一级毛片免费看| 伊在人亚洲香蕉精品播放 | 亚洲五月激情网| 国产精品极品美女自在线看免费一区二区| 天堂成人在线| 99热这里只有免费国产精品| 欧美国产日韩在线| 无遮挡国产高潮视频免费观看| 国产精品自在在线午夜区app| 亚洲天堂在线免费| 高清久久精品亚洲日韩Av| 国外欧美一区另类中文字幕| 亚洲色精品国产一区二区三区| a级毛片网| 国产男人的天堂|