999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于數據分析的錄音文件來源識別方法

2016-12-27 08:39:42盧啟萌施少培卞新偉李巖曾錦華奚建華
中國司法鑒定 2016年1期

盧啟萌,施少培,卞新偉,李巖,曾錦華,奚建華

(司法部司法鑒定科學技術研究所,上海200063)

鑒定實踐
Forensic Practice

一種基于數據分析的錄音文件來源識別方法

盧啟萌,施少培,卞新偉,李巖,曾錦華,奚建華

(司法部司法鑒定科學技術研究所,上海200063)

目的 分析常見的30種錄音筆錄制的音頻,通過考察音頻文件自身的數據情況,對音頻屬于何種設備錄制進行識別。方法 使用UltraEdit、WinHex等軟件對音頻的文件頭和文件數據結構進行分析和比較,研究不同錄音筆錄制的音頻文件格式、參數和數據結構之間的差異。結果 通過錄音文件的文件名、文件格式、文件頭和文件結構能夠較好地區分文件來源,其中,WMA和REC格式文件能達到100%的識別準確率,MP3格式文件的區分率為96.67%,WAV格式文件區分率為88.1%,說明該方法具有較強的區分性能。結論 實驗結果顯示該方法使用常見工具,分析步驟簡單,考察點清晰,識別率高,能夠廣泛應用于錄音真實性鑒定實踐中。

錄音真實性;錄音筆;文件格式;分類

隨著消費型電子產品的迅速發展,錄音筆、MP3、攝像機等錄音設備廣泛普及,在需要進行錄音時,這些便攜、錄音效果良好的設備往往成為人們固定聲音證據的首選。

在目前的錄音真實性(完整性)鑒定案件中,錄音筆錄制的音頻文件占有較大比例。在民商事案件的鑒定實踐中,依據SF/Z JD0300001-2010《聲像資料鑒定通用規范》第二部分《聲像資料鑒定通用程序》規定[1],需要先獲得錄音證據提交方對于送檢音頻文件的形成過程陳述,即該音頻文件是使用何種錄音器材以何種模式錄制[2]。若檢驗發現該音頻文件并非提交方聲稱的錄制設備錄制,則送檢音頻的真實性值得懷疑[3]。因此,對音頻文件的錄制設備進行判斷,是錄音真實性(完整性)鑒定的重要組成部分。

1 材料與方法

考慮到方法的實際運用,在電商網站京東上以搜索優先級為主要參考標準,準備錄音筆共30支,具體型號如表1所示。按照產品說明書中的錄音模式說明,每支錄音筆的每種模式各錄制2次。錄制后,使用UltraEdit、WinHex等常見代碼讀取軟件對錄制的音頻文件進行分析。

表1 實驗所用錄音筆型號

2 結果

錄制得到有效錄音共111種。分析錄音文件的格式、文件頭、屬性參數等,進行統計和分類,得到以下結果。

2.1 文件格式

錄音共出現了MP3、mp3、WAV、wav、WMA、REC共計6種后綴名,4種格式,具體出現次數如表2所示。統計出現次數可以發現,目前MP3格式占據主流地位,其次是WAV格式,約占四成。由于格式名稱不以大小寫為區分,因此下文中均以MP3指代后綴名為MP3和mp3的文件格式,WAV指代WAV和wav后綴。

表2 實驗錄音后綴名和格式情況

2.2 文件名

不同型號的錄音筆命名規則不同,命名規則有VOICE+3位序數、ATR_4位序數、LININ+3位序數、rec+4位序數、REC+5位序數、REC+6位序數、4位年.2位月.2位日_2位時.2位分_2位序數、3位序號M_6位年月日_4位時分、3位序號_6位年月日_4位時分 A0、6位年月日_3位序號、8位年月日_3位序號、3位型號_4位序號DVT_B+3位序數、RNC+3位序數、REC+6位時分秒、REC+3位序數、VR+4位序數和V+2位月+2位日+2位序數等。命名規則中較為通用的是REC+3位序數的命名方式,在30支錄音筆中有11支采用了此種方式,其他命名方式不具有通用性。

2.3 格式參數

2.3.1 MP3格式

根據MP3格式定義[2],分析格式中具有區分價值的參數如下:

(1)ID3V2。MP3文件理論上應當分為三部分:TAG_V2(ID3V2),Frame和TAG_V1(ID3V1)ID3V2。其中,位于文件頭的ID3V2作為ID3V1的擴充,兩者均為包含有曲名、演唱者、專輯、音軌數等信息的metadata容器[4]。60個MP3格式錄音中,文件頭含ID3V2域的共有10個,來自4支錄音筆。

表3 含ID3V2文件情況

10個文件起始處均為4944330300,即版本號ID3V2.3。但不同文件的后續結構不同。如圖1所示為Sony-ICDTX50錄音筆錄制的MP3格式音頻文件頭,至幀開始前為4096字節,其中第65~2788字節及第2874~4096字節為00,第2788~2874字節記錄有音軌、藝術家、編碼器(含品牌信息)等。而Sony-ICDFX8所錄制的文件中,該部分與Sony-ICDTX50除編碼器版本號不同外無其他本質區別。

圖2則為Olympus-VN712錄音筆錄制的MP3文件頭,可見至幀開始前為1536字節。其中,第12~14字節為品牌信息,第33~35字節為型號信息,第59~70字節為錄制起始時間(年月日時分秒),第71~82字節為錄制結束時間,之后為錄音時長,第337~1 536字節為FF。Olympus-WS811所錄制的文件中,文件頭信息除型號標識與Olympus-VN712不同外,文件頭結構無其他本質區別。

圖1 型號為Sony-ICDTX50錄音筆錄制的MP3文件頭局部

圖2 型號為Olympus-VN712錄音筆錄制的MP3文件頭局部

(2)格式版本。由于本次實驗中未出現可變位率的文件,因此對于固定位率的MP3文件,根據選用的版本不同,MP3幀頭中第12、13位為00、10或者11可以讀取為使用的格式版本是2.5、2或1[5]。幀頭前11位恒為1,第14、15位為01即layer3,第16位CRC校驗則為1即不校驗,因此可以簡單地通過MP3幀頭為 FFFB、FFF3或 FFE3判斷版本為MPEG2.5、MPEG2或MPEG1。在實驗得到的60個MP3文件中,使用Version2.5、Version2和Version1的分別有9、20和31個。由于格式版本與采樣率等參數相關,因此,進一步分類可以參考采樣率等參數。

(3)聲道模式。幀頭的第25、26位為聲道模式,00為立體聲(Stereo),01為聯合立體聲(Joint Stereo),10為雙路單聲道(Dual Mono),11為單聲道(Mono)。當聲道模式為01(Joint Stereo)時,第27、28位則為聯合立體聲為IS或M/S編碼的擴充模式[6]。在實驗音頻中,有26個立體聲,7個雙路單聲道,27個單聲道,有5個(來自PhilipsDVT1000、Olympus-VN712和Olympus-WS811)音頻文件為Joint Stereo模式,其中M/S編碼4個。

(4)采樣率、碼率。采樣率是音頻的主要特征參數,單位為KHz,在60個MP3格式音頻中,共涉及8種采樣率。對于未經壓縮的pcm音頻流而言,碼率等于采樣率、采樣精度和聲道數的乘積,對于MP3格式音頻而言則不然,在60個實驗音頻中,共出現9種不同的碼率

綜合考察采樣率和碼率數值,實驗音頻中有11個唯一組合,如表4所示。

除(1)中含ID3V2及上述采樣率和碼率唯一組合外,結合聲道數、聲道模式的分類,實驗得到的MP3音頻中另有7個唯一組合,如表5所示。

表4 采樣率和碼率唯一組合

表5 采樣率、碼率、聲道、聲道模式組合

(5)文件標記分析。在規則的MP3格式外,可能出于品牌標識或者生產上的需要,部分文件具有非常特殊的文件頭形態。

①Ann C200錄音筆。該款錄音筆可調麥克風噪音高、中、低三個檔次,碼率和采樣率僅有192Kbps和44.1KHz一種。錄制的文件自第一字節始,填充512字節的0值,內容則后移至第513字節,起始2字節為FFFB。

②Aigo愛國者R5580錄音筆。該款錄音筆具有線錄和麥克風錄音兩種功能,線錄模式的碼率和采樣率僅有32Kbps和 44.1KHz一種,麥克風錄音則有8Kbps64Kbps128Kbps三種碼率,采樣率均為16KHz。在線錄模式錄音、麥克風64Kbps和128Kbps碼率錄制的模式下,文件中多次重復出現“NexiaDevice Skylark3RA 2010 Apr”字樣,如圖4所示。查詢得知,該字樣為韓國NEXIA Device公司的錄音芯片標識。此外,該錄音筆在麥克風模式下錄制的碼率為8Kbps文件,在距離文件尾6 144字節之前填充了2048字節的1。

③Panasonic松下RR-XS420錄音筆和RRUS300錄音筆。松下RR-XS420錄音筆可以錄制6種不同參數的MP3格式音頻,RR-US300錄音筆可以錄制3種不同參數的MP3格式音頻。碼率和采樣率如表6所示。

圖3 Ann C200錄音筆文件頭

圖4 Aigo愛國者R5580錄音筆芯片標識

表6 實驗中松下錄音筆錄制音頻的碼率和采樣率

序號為1、2、3、4、6、9的錄音文件中出現標記。1、2、3、4、9文件頭部出現二進制“……001101001000……10010110100110110101010……”字樣,“1010”長度不等。其中“10010111101”即“4B4D”可以轉為ASCII碼“KM”,與6尾部多次出現的“KM1.86.1.8”字樣及其后填充AA字節可能具有相關性。此外,3號音頻尾部亦出現“4B4DAAAA”字樣標識,但未能找到KM字樣所表達的含義。

序號為5、7、8的音頻文件頭部第5至第9字節為“0000000000000000000000000000001101001000”即“0000000348”,其中“348”在前述文件“KM”標示的前后(多為前4字節處)均有出現。

此外,松下RR-XS420錄音筆錄制的每一文件均生成一INX后綴名的同名文件,336字節,起始16字節為“INDEX_ICRECORDER”字樣,其余為0。

(6)小結。在60個MP3格式文件中,綜合上述采樣率、碼率、聲道、文件頭標識等參數,同時考慮文件名命名方式,能夠區分的文件共計58種(有3個文件是同一種類),區分率為96.67%。

2.3.2 WAV格式

WAV格式是一種RIFF文件,因此每個WAV文件的頭四個字節是 “RIFF”[7]。根據WAV格式定義,考察格式中具有區分價值的若干要素如下:

(1)調制方式和位深度。實驗錄音中,文件分為脈沖編碼調制(Pulse Code Modulation,PCM)和自適應差分脈沖編碼調制(Adaptive Differential Pulse Code Modulation,ADPCM)兩種編碼形式。位深度即每個聲道中各個樣本的數據位數。在42個實驗音頻中,ADPCM4位和PCM16位各出現21次。

(2)編碼設置ID。PCM形式的WAV文件編碼設置ID為1,ADPCM形式的編碼設置ID則有2和11兩種,在21個ADPCM形式實驗音頻中分別出現5次和16次。

(3)組合參數。讀取實驗錄音的碼率、采樣率和聲道數,在總計42個WAV格式的實驗錄音中,具有唯一組合的錄音共17個,其錄音筆型號及相關參數如表7所示。

表7 WAV格式碼率、采樣率和聲道數的唯一組合

續表7

(4)文件標記分析。①Sony索尼ICD-TX50錄音筆。該型號錄音筆錄制的WAV格式音頻在文件頭上具有其他錄音筆沒有的音軌、導演等信息,雖然較同一錄音筆錄制的MP3格式音頻缺少編碼軟件標識,也因此沒有品牌顯示,但以文件名為音軌名、以“My Recording”為導演信息亦能幫助識別錄制設備。

②ANN安UV100和Allbar奧巴UB10錄音筆。除Sony索尼ICD-TX50錄音筆外,ANN安UV100和Allbar奧巴UB10錄音筆亦包含音軌信息“Audio1”。此兩款錄音筆除品牌和型號不同外,包裝、機身外型、說明書樣式、內容及錄制的音頻參數等均完全相同,可能出自同一工廠生產。

此外,Shinco新科V-31和Akal雅佳A20亦具有完全相同的參數及結構。

③Hyundai現代C100錄音筆。標準WAV文件文件頭由RIFF WAVE和fmt兩個CHUNK組成,后接data CHUNK[8],但也有Hyundai現代C100錄音筆在 fmt和 data兩個 CHUNK之間,另有一個fact CHUNK(如圖5所示)。

圖5 文件頭中的fact CHUNK

④Panasonic松下RR-XS420錄音筆。該錄音筆錄制的WAV格式文件中,data CHUNK出現在第37字節,在“data”ID及4字節的文件大小后,填充了約9700字節的0。除上述WAV文件外,Philips飛利浦DVT1000錄音筆和Newsmy紐曼RV21錄音筆的data CHUNK起始于第37字節,其他文件則起始于第505字節,之前填0。

(5)小結。在42個WAV格式文件中,綜合上述采樣率、碼率、聲道、文件頭標識等參數,同時考慮文件名命名方式,能夠區分的文件共計37種(其中1組4個相同,2組2個相同),區分率為88.1%。

2.3.3 其他格式

除MP3和WAV外,實驗音頻中還出現WMA格式8次[9]、REC格式1次。WMA格式音頻由Olympus奧林巴斯WS-811和VN-712兩款錄音筆生成。Olympus奧林巴斯 WS-811和 VN-712錄制的WMA格式錄音在文件頭部分均有品牌、型號和錄制時間標識,容易識別,如圖6所示。REC格式由Newsmy紐曼RV68錄音筆生成。

圖6 Olympus奧林巴斯VN-712錄制的WMA格式錄音文件頭

3 討論

實驗證明,根據文件名、文件格式、文件頭和文件結構的不同,可以有效地從文件本身區分出該錄音是否由某型號錄音筆錄制形成。在本實驗中,WMA和REC格式文件達到100%的識別準確率,MP3格式文件的區分率為96.67%,WAV格式文件區分率為88.1%。

如果不考慮文件名,只通過文件格式、文件頭和文件結構進行分析,錄音能夠限定在2~4種錄音筆錄制的范圍內。因此,分析數據結構的方法在本實驗中能得到較高的識別率。

在實驗中還發現,采樣率和碼率是區分音頻來源的兩個重要特征,尤其是碼率,由于其種類較多,具有較高的區分價值。其他參數,如編碼格式、參數ID等,雖然無法唯一性區別不同文件,但與采樣率、碼率、聲道數和文件結構等其他類型參數進行組合有助于進一步提高音頻文件來源識別率。

4 結論

本文分析了常見錄音筆錄制的音頻,通過考察音頻文件自身的數據情況,對音頻來源于何種設備錄制進行識別。提出了通過對音頻文件的文件名、文件格式、文件頭和文件結構的差別對音頻進行分類的方法,在鑒定實踐中能夠以較為簡單的方法迅速判斷檢材音頻來源情況,有助于錄音真實性鑒定工作的進一步展開。

本方法的識別局限于是否同一型號錄音筆,對于同一型號的不同錄音筆錄制的音頻文件區分情況則需要通過本底噪聲等相關數據的計算進行分析。

[1]SF/Z JD0300001-2010.聲像資料鑒定通用規范[S].2010.

[2]ISO/IEC 11172-3:1993/Cor 1:1996,Information technology— Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s— Part 3: Audio TECHNICAL CORRIGENDUM 1[S].ISO/IEC 1996.

[3]張敬懷,馬道鈞.WAV語音文件格式的分析與處理[J].北京電子科技學院學報,2004(02):47-50.

[4]曾錦華,施少培,楊旭,等.錄音設備識別司法鑒定技術研究[J].中國司法鑒定,2015(06):22-25.

[5]Dongen W S V.Case study:Forensic analysis of a Samsung digital video recorder[J].Digital Investigation the International Journal of Digital Forensics&Incident Response,2008,5(s 1-2):19-28.

[6]Zhang Z,Liu X,Zhang J.Combinatorial Testing on ID3v2 Tags of MP3 Files[C]//IEEE Fifth International Conference on Software Testing.IEEE Computer Society,2012:587-590.

[5]Taylor S K,Yusof M I E B.Forensic acquisition on MP3 players[C]//Pattern Analysis and Intelligent Robotics(ICPAIR),2011InternationalConferenceon.IEEE,2011:143-147.

[7]汪勇,熊前興.MP3文件格式解析[J].計算機應用與軟件,2005,21(12):126-128.

[8]Bhatnagar G,Mehta S,Mitra S.Chapter 7-The WAV File Format[M]//IntroductiontoMultimediaSystems.ElsevierInc.,2004.

[9]王若鈞,何杉.WAV文件格式分析與詳解[J].數字技術與應用,2014(3):93-94.

[10]Surhone L M,Tennoe M T,Henssonow S F,et al.Windows Media Audio[M].Betascript Publishing,2013.

(本文編輯:楊 旭)

A Method for Identifying Audio File Sources Based on Data Analysis

LU Qi-meng,SHI Shao-pei,BIAN Xin-wei,LI Yan,ZENG Jin-hua,XI Jian-hua

(Institute of Forensic Science,Ministry of Justice,Shanghai 200063,China)

Objective To establish a method for the identification of audio file sources based on data analysis.Method The audio files recorded by 30 common portable audio recorders were analyzed with decoding software,such as UltraEdit and WinHex.The file head and structure of audio files recorded by different recorders were analyzed comparatively to study the difference in the formats,parameters and structures of these files.Results The audio files can be well classified by the combination of file name,format,file head and structure.The recognition rates were 100%for WMA and REC files,96.67% for MP3 files,and 88.1%for WAV files.Conclusion The established method is simple and efficient,as it acquires high recognition rate using common software.It can be widely used in the forensic practice of audio authentication.

forensic authentication of audio recording;recorder;file format;classification

D918.9

A

10.3969/j.issn.1671-2072.2016.01.006

1671-2072-(2016)01-0037-08

2015-05-15

中央級科研院所公益研究項目(GY2014Z-3)、(GY2014G-2)、(GY2014Z-5)

盧啟萌(1989—),女,研究實習員,碩士,主要從事聲像、電子數據鑒定技術研究工作。E-mail:luqm@ssfjd.cn。

施少培(1962—),男,高級工程師(正高級),主要從事刑事技術研究工作。E-mail:shisp@ssfjd.cn。

通信作者:卞新偉(1965—),男,高級工程師,主要從事刑事技術研究工作。E-mail:bianxw@ssfjd.cn。

主站蜘蛛池模板: 日本成人在线不卡视频| 国产精品成人一区二区不卡| 亚洲一区二区三区麻豆| 欧美一级夜夜爽www| 久久一色本道亚洲| h视频在线观看网站| 日本影院一区| 久久国产高清视频| 这里只有精品免费视频| 国产免费看久久久| 色偷偷综合网| 99在线观看视频免费| 免费看a级毛片| 日韩欧美国产综合| 国产噜噜在线视频观看| 国产亚洲美日韩AV中文字幕无码成人| 亚洲综合经典在线一区二区| 中文字幕 欧美日韩| 国产午夜一级毛片| 欧美日本在线播放| 天天摸夜夜操| 日本草草视频在线观看| 欧美a√在线| 欧美成人影院亚洲综合图| 91小视频在线观看免费版高清| 国产日韩精品欧美一区灰| 欧美自慰一级看片免费| 亚洲一区免费看| 国产欧美日韩在线在线不卡视频| 五月天丁香婷婷综合久久| 农村乱人伦一区二区| 精品人妻AV区| 精品福利一区二区免费视频| 伊人五月丁香综合AⅤ| 亚洲欧美不卡| 91啦中文字幕| 国产真实乱了在线播放| 91免费观看视频| 综合社区亚洲熟妇p| 国产好痛疼轻点好爽的视频| 欧美国产在线看| 午夜成人在线视频| 精品国产欧美精品v| 99久久亚洲综合精品TS| 久久黄色免费电影| 国产第一页免费浮力影院| 日本一本在线视频| 亚洲日韩久久综合中文字幕| 亚洲精品国产自在现线最新| 18禁色诱爆乳网站| 99久久99这里只有免费的精品| a级毛片免费看| 日韩国产亚洲一区二区在线观看| 97视频精品全国免费观看| 亚洲黄色视频在线观看一区| 在线另类稀缺国产呦| 熟女日韩精品2区| 中文字幕色在线| 亚洲精品免费网站| a级毛片免费网站| 国产成人福利在线| 欧美在线视频不卡| 欧美色视频在线| 高清精品美女在线播放| 无码中字出轨中文人妻中文中| 成人日韩欧美| 无码AV日韩一二三区| 国产日韩欧美中文| 欧美成人午夜视频| 国产精品免费入口视频| 久久成人国产精品免费软件| 成人91在线| 不卡无码h在线观看| 亚洲精品午夜无码电影网| 国产在线精彩视频二区| a级毛片免费在线观看| 亚洲精品免费网站| 制服丝袜亚洲| 欧美一区二区人人喊爽| 国产精品偷伦在线观看| 5555国产在线观看| 成人在线第一页|