999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

用Python對常用字進行多維度特征分析

2020-04-01 15:08:07溫且姆·薩迪克布合力齊姑麗·瓦斯力熱依漢古麗·薩迪克木合塔爾·沙地克
教育教學論壇 2020年10期

溫且姆·薩迪克 布合力齊姑麗·瓦斯力 熱依漢古麗·薩迪克 木合塔爾·沙地克

摘要:文章用Python實現對常用字的詞性、拼音、韻母與聲調之間的多維度特征分析,從開發環境搭建開始詳細介紹了每個步驟和代碼。

關鍵詞:Python;Jieba;python-docx-master;python-pinyin-master

中圖分類號:G642.0? ? ?文獻標志碼:A? ? ?文章編號:1674-9324(2020)10-0120-02

一、環境的搭建

用Python對漢字進行分析不僅要安裝Python開發環境,還需要安裝Python中文分詞組件jieba,Python Word文本處理組件python-docx-master,Python處理漢字轉拼音組件python-pinyin-master。本文用Anaconda Spyder作為開發環境,從相關網站下載以上各組件壓縮包,解壓到工作目錄,在命令行分別進入各組件解壓目錄,執行python setup.py install即可完成環境的準備。

二、主要代碼解釋

(一)引入相關組件,并以gb18030編碼格式打開常用字txt文件

(引入相關組件代碼略)

#打開常用字txt文件

text=open('sys_Char2500.txt',encoding='gb18030').read()

#從text中篩選字符部分

char_changyong=[char for char in text if char.isalpha()]

(二)定義一個函數,獲取漢字的詞性,把詞性英文簡稱轉換中文名稱

def get_peg(arg):

#獲取arg的詞性

pegc=peg.cut(arg)

flag2=''

#把詞性英文簡稱轉換漢字名稱

for peg1,flag1 in pegc:

if 'n' == flag1[0]:

flag2='名詞'

elif 't' == flag1[0]:

flag2='時間詞'

else:

flag2=flag1

return flag2

(三)獲取漢字的詞性、拼音和韻母特征,把他們存儲在一個詞典里,并進行排序統計

for char in char_changyong:

#獲取漢字帶聲調的拼音

yin3=''.join(lazy_pinyin(char,style=Style.TONE3))

#獲取漢字不帶聲調的拼音

pyin=''.join(lazy_pinyin(char))

#獲取漢字的韻母

yunm=''.join(lazy_pinyin(char,style=Style.FINALS))

#把以上獲取的特征存放在詞典和列表里

char_flag_dict[char]=(tone,pegc,pyin,yunm)

(四)對漢字的詞性與聲調進行統計分析,將統計結果存入Document對象的表格中

#游歷所有詞性統計列表

for pegc,count in pegc_all_count:

#游歷存放漢字特征的詞典

for char,val in char_flag_dict.items():

if pegc == val[1]:

tones = tones + str(val[0])

chars = chars + str(char)

pegc_tones[pegc]=tones

#定義Document對象

doc_new = Document()

doc_new.add_heading('一、詞性統計:',0)

#定義表格

table = doc_new.add_table(rows=1,cols=8)

hdr_cells = table.rows[0].cells

#創建表格列名

hdr_cells[0].text = '序號'

#對漢字的詞性與聲調進行統計

#將統計結果存入表格中

for key,val in pegc_tones.items():

len_tones=len(pegc_tones[key])

count=Counter(pegc_tones[key])

row_cells = table.add_row().cells

row_cells[0].text = str(i)

(五)對漢字的拼音與聲調進行統計分析,將統計結果存入Document對象的表格中

#游歷所有拼音統計列表

for pyin,count in pyin_all_count:

#游歷存放漢字特征的詞典

for char,val in char_flag_dict.items():

if pyin == val[2]:

tones = tones + str(val[0])

chars = chars + str(char)

pyin_tones[pyin]=tones

#添加標題

doc_new.add_heading('二、拼音統計:',0)

#定義表格

table = doc_new.add_table(rows=1,cols=8)

hdr_cells = table.rows[0].cells

hdr_cells[0].text = '序號'

#對漢字的拼音與聲調進行統計

#將統計結果存入表格中

for key,val in pyin_tones.items():

len_tones=len(pyin_tones[key])

count=Counter(pyin_tones[key])

row_cells = table.add_row().cells

row_cells[0].text = str(i)

row_cells[7].text = str(count6)

(六)對漢字的韻母與聲調進行統計分析,將統計結果存入Document對象中

#游歷所有韻母統計列表

for yunm,count in yunm_all_count:

#游歷存放漢字特征的詞典

for char,val in char_flag_dict.items():

if yunm == val[3]:

tones = tones + str(val[0])

chars = chars + str(char)

yunm_tones[yunm]=tones

#添加標題

doc_new.add_heading('三、韻母統計:',0)

#創建表格

table = doc_new.add_table(rows=1,cols=8)

hdr_cells = table.rows[0].cells

hdr_cells[0].text = '序號'

#對漢字的韻母與聲調進行統計

#將統計結果存入表格中

for key,val in yunm_tones.items():

count=Counter(yunm_tones[key])

len_tones=len(yunm_tones[key])

row_cells = table.add_row().cells

row_cells[0].text = str(i)

row_cells[7].text = str(count6)

(七)把統計結果存入Word文檔中,用于下一步分析

doc_new.save('漢字統計分析.docx')

Multi-dimensional Feature Analysis of Common Words with Python

Wynchem Sadiq1,Buzhiguri Vasley2,Hayhanguri Sadiq3,Muhtar Shadick4

(1.Kashgar Shule County Secondary Vocational and Technical School,Kashgar,Xinjiang 844200,China;

2.College of Mathematics and Science,Xinjiang Institute of Education,Urumqi,Xinjiang 830043,China;

3.Hanan Like Town Middle School,Kashgar Shule County,Kashgar,Xinjiang 844207,China;4.Education Management Information Center of Xinjiang Uygur Autonomous Region,Urumqi,Xinjiang 830049,China)

Abstract:In this paper,Python is used to analyze the multi-dimensional features of common characters,such as part of speech,pinyin,vowel and tone.Start with the development environment building and introduce each step and code in detail.

Key words:Python;Jieba;python-docx-master;python-pinyin-master

主站蜘蛛池模板: 国产手机在线观看| 国产亚洲欧美在线中文bt天堂 | 伊在人亚洲香蕉精品播放| 日本少妇又色又爽又高潮| 国产自在线拍| 欧美成人a∨视频免费观看| 亚洲无码37.| 色屁屁一区二区三区视频国产| 97精品久久久大香线焦| 久久婷婷人人澡人人爱91| 99热免费在线| 99re在线视频观看| 国产成人调教在线视频| 精品久久久久久成人AV| 精品国产成人av免费| 黄片一区二区三区| 欧亚日韩Av| 亚洲IV视频免费在线光看| 日韩AV手机在线观看蜜芽| 亚洲一区二区成人| 亚洲综合精品第一页| 毛片久久久| 日韩欧美国产另类| 亚洲美女高潮久久久久久久| 九九免费观看全部免费视频| 日韩大片免费观看视频播放| 激情综合网址| 熟女视频91| 亚洲美女视频一区| 国产性生交xxxxx免费| 激情综合网激情综合| 日韩色图在线观看| 国产成人av大片在线播放| 无码一区二区三区视频在线播放| 无码中文字幕乱码免费2| 成人午夜精品一级毛片| 97无码免费人妻超级碰碰碰| 在线a视频免费观看| AV老司机AV天堂| 中文字幕在线视频免费| 波多野一区| 亚洲久悠悠色悠在线播放| 欧美在线中文字幕| 精品福利视频网| 亚洲一区无码在线| 99久久精品久久久久久婷婷| 国模沟沟一区二区三区| 亚洲一欧洲中文字幕在线| 色精品视频| 91无码国产视频| 美女被躁出白浆视频播放| 国产亚洲精品在天天在线麻豆| 欧美亚洲国产一区| 国产乱人激情H在线观看| 亚洲精品天堂自在久久77| 国产精品成人AⅤ在线一二三四| 国产女人在线观看| 91色综合综合热五月激情| 久久这里只有精品23| 亚洲AⅤ波多系列中文字幕| 91免费国产高清观看| 日韩毛片免费| 97一区二区在线播放| 久久青草热| 中日韩一区二区三区中文免费视频| 在线免费不卡视频| 亚洲一级毛片在线观播放| 99热国产这里只有精品无卡顿"| 亚洲中文字幕精品| 1024国产在线| 99r在线精品视频在线播放| 99视频在线看| 亚洲无码视频一区二区三区| 久久精品这里只有国产中文精品| 婷婷午夜影院| 亚洲人成人无码www| 精品国产成人a在线观看| 国产乱码精品一区二区三区中文| 99久久国产精品无码| 91在线激情在线观看| 日韩欧美在线观看| 四虎在线高清无码|