999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

論打印類匿名信所用漢字輸入法的判定

2015-04-09 09:05:40歐陽國亮
山西警察學院學報 2015年3期
關鍵詞:匿名信輸入法特點

□歐陽國亮, 何 琳

(1.中國刑警學院 文件檢驗技術系,遼寧 沈陽 110035; 2.湖南省郴州市永興縣公安局,湖南 郴州 423300)

論打印類匿名信所用漢字輸入法的判定

□歐陽國亮1, 何琳2

(1.中國刑警學院 文件檢驗技術系,遼寧 沈陽 110035; 2.湖南省郴州市永興縣公安局,湖南 郴州 423300)

摘要:探索不同輸入法產生的言語錯誤類型,把握其規律,為打印類匿名信所用輸入法的判定提供依據。方法:對拼音輸入法、五筆輸入法、手寫輸入法的言語錯誤類型進行比較分析和分類統計。結果與結論:不同輸入法的言語錯誤類型不盡相同,根據文字材料中錯別字詞的類型與特征,可以推斷打字者所用的漢字輸入法,這對某些案件的偵查具有縮小范圍的作用。

關鍵詞:文件檢驗;匿名信;輸入法;特點

打印形成的匿名信給檢驗鑒定工作帶來了諸多麻煩,一是這類信沒有手寫字跡,造成排查嫌疑人困難;二是國內打印機具、打印材料及文字字庫都比較單一,造成確定打印來源困難,這都給案件的辦理增加了難度。但從另一個角度看,凡是打印的文件,就不得不涉及漢字輸入法。我國的漢字輸入法相比其他國家而言種類要多,大致可以分為三大類:五筆類、拼音類、手寫類。不同的人,對這三類輸入法的掌握及使用情況有所不同,匿名信制作者也不例外。這就為我們推斷匿名信制作者使用的輸入法提供了可能。

一、判定漢字輸入法的偵查學價值

對于某些打印類匿名信案件,如果能判定出該信制作者所用的漢字輸入法,那么對整個案件的偵查來說有其特殊的價值。這種價值主要表現在兩方面:

(一)可以推斷匿名信制作者的漢字錄入習慣,從而縮小偵查范圍

個人使用漢字輸入法具有很強的穩定性,也就是說某個人習慣使用一種輸入法之后,在很長的一段時間內都會選擇這種輸入法,從而形成既定的習慣。[1]對于某些具體案件而言,在嫌疑對象較多的情況下,如果能夠根據信文中的言語特征判定出匿名信作者的漢字錄入習慣,那么就可以起到縮小偵查范圍的作用。如東北某縣一散布虛假恐怖信息案,犯罪嫌疑人制作了多封匿名信郵寄往學校、政府機關,造成不良影響。警方經過對信紙、信封、信文打印痕跡進行分析,初步判定該系列匿名信出自該縣教育局人事股。但人事股有七、八個人,難以確定具體是何人作案,于是將匿名信送檢至我部門。在檢驗過程中,我們發現信文有幾處錯別字比較扎眼:“響應號召”打成了“響應號如”,“聯合簽名”打成了“聯合答名”。這應該是五筆輸入法輸錯字根所致,因為“召”和“如”的字根分別是“VKF”“VKG”,“簽”和“答”的五筆字根分別是“TWGI”“TWG”,它們的字根都非常接近,據此判定匿名信制作者使用的是五筆字型輸入法。經警方進一步調查,平時人事股只有曲某一人有五筆打字習慣。事后,曲某對匿名信事件供認不諱,交代了作案的動機和過程。

(二)有助于推斷匿名信制作者的年齡及文化水平,為案件偵查提供線索

有些漢字輸入法跟文化水平以及年齡有較大的關系,如文化水平中上者一般對拼音輸入法較為熟悉,而年齡較大或者文化水平較低的人,一般習慣使用手寫輸入法。前幾年,山西一鐵路公安部門聯系到筆者,表示他們一部門領導連續兩年收到匿名恐嚇信,給其身心帶來很大影響。盡管多次進行了排查,但由于恐嚇信系打印形成,沒有發現特殊線索。于是希望我們能對匿名信做進一步分析,協助調查。我們對檢材進行分析后發現,信文中出現了較多的錯別字,量化統計后發現這些錯別字多為筆畫多的復雜字形,如“道德敗壞”寫成“道徝敗壞”,“世事繁雜”寫成“世事擎雜”等。我們對這些字進行了反復的錄入實驗,實驗結果表明無論是拼音還是五筆均不可能出現上述錯別字,只有手寫輸入法會造成這種識別錯誤(下文將論述)。據此我們推斷匿名信制作者使用了手寫輸入法,同時結合信文內容多涉及內部事情以及多處言語表達錯誤等情況,進一步推斷匿名信作者應該是一名文化水平不高的老年人。建議以此為線索,重點排查內部文化水平不高但已退休的人員。不久嫌疑人聶某浮出水面,該嫌疑人年齡65歲,兩年前退休,因對退休后的待遇問題不滿,于是想出了恐嚇領導的辦法以發泄情緒。

綜上所述,判定打印類匿名信所用的漢字輸入法,可以用來推斷匿名信制作者的文字錄入習慣以及年齡甚至文化水平,進而為案件的偵查偵破工作起到縮小偵查范圍、提供偵查線索的作用。

二、各種漢字輸入法的判定

為什么根據言語特征就能夠推斷作者所用的漢字輸入法呢,原理又是怎樣的?這是因為今天的電腦普遍使用拼音輸入法、五筆字型輸入法、手寫輸入法等。匿名信制作者在運用這些輸入法輸入漢字的過程中,難免會造成一些言語錯誤,如錯別字、錯誤詞語、標點等。輸入法不同,造成的言語錯誤類型也會有所不同,比如五筆輸入法造成形近別字,拼音輸入法容易造成音近別字等。這些言語錯誤,可作為判定匿名信作者使用何種輸入法的基本根據。

(一)五筆字型輸入法的判定

五筆字型輸入法是一種非常高效的漢字輸入法,它將文字拆分為不同的字根,因此重碼率低,使用者較多。運用五筆字形輸入法錄入漢字容易產生的錯別字有三類:

一是形近別字。如“進入”打成“進人”,“休息”打成“體息”,“竅門”打成“竊門”等。這些字都是由于形體過于相近,錄入者一時不注意輸入識別碼或者選錯詞條造成的。

二是偏旁部首相同的別字。如“信息”打成“停息”,“團結”打成“圖結”,“營運”打成“管運”等。這類錯別字的形體差別較大,但因偏旁部首相同,而且結構相近,運用五筆輸入法錄入時容易輸錯字根從而造成錯別字。

三是字根部件相似的別字。如“學生”打成“沉重”,這是因為“學”與“沉”都有三點和“冖”的字根部件,只是位置不同。此外,“生”與“重”在字根部件上也有很大的相似性。運用五筆輸入法錄入“學生”“沉重”這兩個詞語時輸入的字根都是“IPTG”,稍不注意就會造成錯詞。

判定匿名信作者使用的輸入法是否為五筆輸入法,主要看信文中的錯別字(或打錯的詞語)是否屬于上述三類。尤其是第三類,價值非常高。此外,五筆輸入法打錯的字或詞,很容易導致整個句子不通順,如“這件事我不想讓它變得熱搞(鬧)”“一把手大變樣,沉(學)習作風大變樣”“如(召)集上訪群眾”。因此,在檢驗分析匿名信時,凡是碰到這種情況,首先應該考慮該字是否由五筆輸入法錄入,同時要注意結合五筆字根的特點予以辨別,不能當成普通的錯別字來看待。必要的時候,應該在電腦上用五筆輸入法自己試驗幾次,檢驗一下錯別字是不是因為它與本字在字根上趨同造成的。

(二)拼音輸入法的判定

拼音輸入法是普及面最廣、種類最全的一種輸入法。使用拼音輸入法打字,容易產生的言語錯誤主要有兩類:第一類是單個的同音別字或音近別字,如“不許報景(警),否則撕票”“感(趕)緊去辦”“只做弟(第)一次”;第二類是音同或音近的詞語,如“在這樣的北京(背景)下”“一把火把涼褲(糧庫)燒了”“這件事情不是敬茶(警察)能管得了的”,拼音輸入法中的整詞輸入功能很容易產生這類錯詞現象。

從判定拼音輸入法的價值看,上述言語錯誤中的第二類的使用價值相對更高。通常而言,信文中只要出現了一個音同或音近的詞語,基本上就可以判定該信文系拼音輸入法錄入而成。因為其他輸入法(如五筆、手寫、鄭碼)一般是不會產生音同或音近詞語的。

需要注意的是,拼音輸入法也是使用人口最多的一種漢字輸入法。我們曾經對37封打印匿名信的文字錯誤類型做過統計分析,[2]在265個錯別字中,多數錯別字是由同音輸入造成。統計情況如下表:

從上表可以看出,音近別字是形近別字的7倍。這實際上反映出制作打印類匿名信的人多采用拼音輸入法。這種情況與當前社會上普遍使用拼音輸入法的現狀完全相符。從言語識別的角度看,如果確定了匿名信的制作者使用的是拼音輸入法,這客觀上也反映出言語人接受過漢語拼音教育,因此對推斷言語人的文化水平甚至年齡都有參考作用。

(三)手寫輸入法的判定

手寫輸入法是近年來產生的一種文字輸入法,廣泛應用于計算機和手機等設備。有些打印類匿名信制作者由于不懂五筆和拼音(從使用手寫輸入法的社會群體看,主要是年紀較大的及文化水平較低的群體),因此在制作匿名信時常常選擇手寫輸入法打字,手寫的工具主要是鼠標或手寫筆。

手寫輸入法需要電腦進行圖形識別,然后形成文字。[3]由于手寫體與印刷體存在較大的差異,這無形中提高了電腦識別的錯誤率,因此運用手寫輸入法錄入而成的文檔容易出現形近別字,如“看-著”“快-塊”“徘-排”。我們統計發現,字形越復雜,手寫輸入法識別的錯誤率就越高,比如“蕭-瀟”“鼓-豉”“襄-囊”“纂-篆”。除文字外,手寫輸入法打成的文檔常常出現標點符號使用錯誤,例如將“,”“、”識別成一類符號從而造成混用、誤用。甚至將標點符號識別成英文字母或數字,如將句號“。”識別成“O”,將感嘆號“!”識別成“l”“1”“L”等。這些言語特征可作為判定言語人使用的輸入法是否為手寫輸入法的基本依據。

三、判定漢字輸入法需要注音的問題

(一)注重言語特征的數量

有些打印形成的匿名信,信文中可能只有一個形近別字或一個同音字,這是孤證現象,不足以判定匿名信作者使用的就是五筆輸入法或拼音輸入法。因為單個錯別字的出現具有很大的偶然性,盡管不排除單個錯別字具有判定輸入法的價值,但分析時應該看文中的形近別字或同音字數量是否較多,錯別字出現的頻率是否較高。原則上來說,應該在兩個以上方能作為判斷的依據,而且不能是重復的錯別字。總之,只有注重特征的數量,才能保證推斷結果的質量。

(二)注意甄別形近別字

如前所述,使用五筆字型輸入法或手寫輸入法打字都可能產生形近別字。實際上拼音輸入法打字偶爾也會出現形近別字,這是因為許多字不但字音相近而且形體也相近,如“請”“晴”“情”“青”。但拼音輸入法產生的形近別字與五筆字型輸入法、手寫輸入法產生的形近別字是有差別的:五筆字型輸入法產生的形近別字一般語音上沒聯系,只是形體上相似,如“體”“休”、“營”“管”、“秦”“奏”;手寫輸入法產生的形近別字多是筆畫多且結構復雜的字(電腦識別復雜筆畫和結構常常出現誤差);而拼音輸入法產生的形近別字不但形體相似而且語音也相似。因此要注意結合輸入法的基本特性甄別形近別字,不能一刀切。

(三)注意區別對待方音別字

匿名信中的有些錯別字實際上屬于方音別字,這與輸入法不一定存在聯系。比如我們曾經檢驗過的一封發生在東北地區的匿名信,其中有這樣幾句話“找領導辦事不好死”、“不只道還會不會燒”。句中的“不好死”應該是“不好使”,“不只道”應該是“不知道”,這與東北官話語音特征相符。許多匿名信都會出現這類方音別字,這是受言語人文化水平、方言背景等因素綜合制約的結果。一般而言,根據前后文語義關系就能判斷某個字是否屬于方音現象。因此,在判定言語人使用何種輸入法時,不宜將這類方音別字納入考察的范疇。

(四)注意結合言語識別方法進行綜合識別

對打印類匿名信進行檢驗,我們認為一個必不可少的內容就是從言語識別的角度對言語人進行人身分析,其具體內容包括分析言語人的性別、年齡、文化水平、職業、地區籍貫等,這也是檢驗匿名信的一般思路。[4]在根據語言文字特征推斷匿名信制作者使用的輸入法時,要注意同言語識別方法相結合,相互印證。例如低文化水平的人多使用手寫輸入法,反過來說,使用手寫輸入法的人多為文化水平相對較低的群體。如是,“文化水平低”與“使用手寫輸入法”可以起到相互印證結果的作用。

四、討論

本文所探討的判定匿名信漢字輸入法的方法和依據,對判定某些涉案的QQ訊息和網絡帖子也有參考作用,因為它們在很多情況下都需通過電腦錄入,都會使用到漢字輸入法。當然,也有一些涉案的QQ信息、短信、微信不一定是用電腦編輯文字,比如還可通過手機、平板等設備輸入,但在判定的方法和依據上仍有很大的相通性。因為不論是手機還是平板電腦,都有拼音輸入法、筆畫輸入法、手寫輸入法,在使用這些輸入法編輯文字時,難免會產生錯別字,這些錯別字不外乎音近別字、形近別字兩大類。因此,同樣可以借鑒本文提到的方法和依據來辨別言語人采用的是何種輸入法,從而為排查、鎖定嫌疑對象提供線索。

【參考文獻】

[1]李寧.漢字輸入法對漢字輸入技能水平的影響[J].心理研究,2010(5).

[2]歐陽國亮.論統計法在案件書面言語風格鑒定中的運用[J].政法學刊,2012(6).

[3]鄧俊.基于計算機視覺的手寫輸入法研究[D].鎮江:江蘇科技大學,2010.

[4]岳俊發.言語識別與鑒定[M].北京:中國人民公安大學出版社,2007.

(責任編輯:王戰軍)

2015年7月第23卷 第3期 山西警官高等專科學校學報JournalofShanxiPoliceAcademy Jul.,2015 Vol.23 No.3

中圖分類號:D918.92

文獻標識碼:A

文章編號:1671-685X(2015)03-0074-03

收稿日期:2015-04-07

作者簡介:李永哲(1990-),男,山東淄博人,中國人民公安大學2013級碩士研究生,研究方向為偵查學。

Judgment of Chinese Character Input Method Used in Printed Anonymous Letter

OU YANG Guo-liang1, HE Lin2,

(1.DepartmentofDocumentInspectionTechnique,ChinaCriminalPoliceUniversity,Shenyang110035,China;

2.YongxingCountyPublicSecurityBureauChenzhouHunan,Chenzhou423300,China)

Abstract:The exploration on verbal mistake types resulted from different input method and the following of rule provide foundation for judging the input method used in printed anonymous letter Verbal mistake types caused by spelling input method, five-stroke input method and hand-writing input method were analyzed and had been made classification statistics. The verbal mistake types caused by different input method are different. The Chinese character input method used by typist could be judged according to the type and features of wrong characters, which could help to narrow investigation scope.

Key words:document inspection; anonymous letter; input method; feature

【刑事偵查與技術】

猜你喜歡
匿名信輸入法特點
要命的輸入法
妙答
領導文萃(2018年13期)2018-08-13 09:48:16
百度被訴侵犯商標權和不正當競爭
高壓輸配電線路工程施工技術控制之我見
中低壓配網桿塔防撞措施淺析
微信輔助對外漢語口語教學研究
科技視界(2016年21期)2016-10-17 17:18:00
從語用學角度看英語口語交際活動的特點
考試周刊(2016年76期)2016-10-09 09:16:03
iOS中為什么找不到安裝的第三方輸入法
電腦迷(2012年22期)2012-04-29 23:34:02
匿名信
意林(2006年1期)2006-05-14 14:47:46
妙答
主站蜘蛛池模板: 国产成人精品一区二区三在线观看| 欧美国产日韩另类| 成人免费午间影院在线观看| 无码国产偷倩在线播放老年人| 黄色网页在线观看| 欧洲极品无码一区二区三区| av免费在线观看美女叉开腿| 永久免费av网站可以直接看的 | 国产99久久亚洲综合精品西瓜tv| 少妇精品在线| 91欧美亚洲国产五月天| 中文字幕永久在线观看| 日本免费新一区视频| 欧美不卡视频在线观看| a网站在线观看| 精品1区2区3区| 色综合成人| 97国产在线视频| 91小视频在线观看| 欧美日韩精品一区二区在线线| 91免费国产高清观看| 一本综合久久| 青青草一区| 亚洲色欲色欲www在线观看| 在线国产你懂的| 天天躁日日躁狠狠躁中文字幕| 亚洲一本大道在线| 成人久久精品一区二区三区| 亚洲日韩AV无码一区二区三区人| 久久77777| 天天做天天爱天天爽综合区| 亚洲性影院| 国产精品污视频| 久久精品亚洲专区| 在线观看无码a∨| 天堂中文在线资源| 国产在线观看成人91| 国产00高中生在线播放| 东京热一区二区三区无码视频| 亚洲国产成人自拍| 亚洲无码高清一区| 黄色网址免费在线| 久久这里只精品国产99热8| 18黑白丝水手服自慰喷水网站| 亚洲无码37.| 91精品人妻一区二区| 欧美一级在线播放| 一区二区三区在线不卡免费| 亚洲不卡网| 国产精品主播| 青青国产成人免费精品视频| 国产成人亚洲欧美激情| 网友自拍视频精品区| 一级在线毛片| 亚洲男人天堂网址| 91丨九色丨首页在线播放| 国产精品蜜芽在线观看| 国产日韩欧美在线播放| 国产对白刺激真实精品91| 国产男人的天堂| 国产丝袜丝视频在线观看| 亚洲国产清纯| 亚洲成网站| 97影院午夜在线观看视频| 国产黄网永久免费| 国产成人精品免费视频大全五级| 黄色三级网站免费| 性网站在线观看| 国产成人精品综合| 免费av一区二区三区在线| 日韩少妇激情一区二区| 亚洲无码电影| 97久久精品人人| 5555国产在线观看| 亚洲综合色婷婷| 少妇精品在线| 九九线精品视频在线观看| 日韩欧美一区在线观看| 国产视频一区二区在线观看| 综合天天色| 五月天福利视频| 色AV色 综合网站|