田棟蕓,吳曉光
(①天津市排水管理處,天津 300060;②武警警種學(xué)院,北京 102202)
通信過程需要一定的協(xié)議進行支持,根據(jù)開放式系統(tǒng)互聯(lián)(OSI,Open System Interconnect)協(xié)議分層模型,一般分為 7層[1]。通過分析各層協(xié)議,可以得到一些基本情況,而這些基本情況對于數(shù)據(jù)的截獲,干擾等工作具有重要的意義。例如我們熟知的傳輸控制協(xié)議(TCP,Transmission Control Protocol)協(xié)議,如果成功分析其包結(jié)構(gòu),就可以告訴我們發(fā)送數(shù)據(jù)的目的端口地址、遠端口地址以及數(shù)據(jù)的順序號、確認號等基本信息,而這些基本信息就可以實現(xiàn)對協(xié)議數(shù)據(jù)的剝離、截獲、跟蹤和干擾等操作[2]。因此,進行協(xié)議識別與解析,對于數(shù)據(jù)分析有著重要的作用,是分析協(xié)議數(shù)據(jù)的至關(guān)重要一步。本文闡述的就是在某通信協(xié)議族協(xié)議分析的基礎(chǔ)上,利用孤立批抽樣檢驗的方法進行協(xié)議完備性論證。
在進行某通信協(xié)議族識別與解析過程中,某次抓取了4 081 263 000 字節(jié)數(shù)據(jù)進行協(xié)議分析實驗。根據(jù)該協(xié)議族的相關(guān)理論以及幀結(jié)構(gòu),已經(jīng)判定該協(xié)議為X協(xié)議。經(jīng)分析數(shù)據(jù)中存在符合X協(xié)議同步標(biāo)準(zhǔn)的同步頭共1 573 928個,除59 232個幀長不符合要求之外,其余均滿足固定幀長的要求,實驗結(jié)果表 1所示(本文中所有程序編制均使用Matlab[3])。
協(xié)議成功識別后,按照X協(xié)議的幀結(jié)構(gòu),對其進行了協(xié)議解析,但157萬個幀全部解析是不現(xiàn)實的,因此我們先對前50幀進行解析,試驗結(jié)果表明,該數(shù)據(jù)很好的滿足了X協(xié)議的要求,基本上可以判定為X協(xié)議。然而50幀相對于157萬幀來說代表性太差,如何應(yīng)用相關(guān)理論來證明其完備性是擺在面前的一大難題。經(jīng)過討論分析,我們將157萬幀看成是一批產(chǎn)品,決定采用質(zhì)量專業(yè)中的孤立批抽樣檢驗理論進行完備性論證。

表1 X協(xié)議識別實驗結(jié)果
抽樣檢驗是按照規(guī)定的抽樣方案,隨機的從一批或一個過程中抽取少量個體作為樣本進行的檢驗,根據(jù)樣本檢驗的結(jié)果判定一批產(chǎn)品或一個過程是否可以被接收。
抽樣檢驗特點是檢驗對象是一批產(chǎn)品,根據(jù)抽樣結(jié)果應(yīng)用統(tǒng)計原理推斷產(chǎn)品批的接收與否,但是在接收批中可能存在不合格品,不接收批中可能存在合格品。抽樣檢驗可以用在破壞性試驗、全數(shù)檢驗工作量很大、散裝或流程性材料等場合。根據(jù)協(xié)議分析結(jié)果,實驗中抓取的未知數(shù)據(jù)共有157萬幀,全數(shù)檢驗工作量很大且不切實際,因此,可以采用抽樣檢驗進行完備性論證。
抽樣檢驗中有一種檢驗方法即為孤立批抽樣檢驗。孤立批是相對于連續(xù)批而言的,它是指脫離了生產(chǎn),對生產(chǎn)方或接受方的一方或兩方不是連續(xù)生產(chǎn)或接收的。此時的抽樣方案往往從使用方的利益出發(fā),著眼于使用方的利益,使用的國家標(biāo)準(zhǔn)為GB/T15239-1994《孤立批計數(shù)抽樣程序及抽樣表》。
該標(biāo)準(zhǔn)對產(chǎn)品批的來源分成A、B 2種模式,模式A指的是對于生產(chǎn)方和接收方均為孤立批的情況。如新產(chǎn)品的試制,接收方式是孤立取得的,而新產(chǎn)品生產(chǎn)方前期沒有生產(chǎn)過,后期也不能連續(xù)生產(chǎn),因此對于生產(chǎn)方也是孤立的,所以是模式 A。模式 B指的是對于生產(chǎn)方式連續(xù)的,接收方式孤立的,如某工廠從連續(xù)生產(chǎn)的供應(yīng)商中偶爾購買一批產(chǎn)品。
孤立批抽樣檢驗方案GB/T15239的抽樣檢驗程序有:①規(guī)定單位產(chǎn)品須檢驗的質(zhì)量特性,并規(guī)定不合格的分類;②根據(jù)產(chǎn)品批的來源選擇合適的抽樣模式;③規(guī)定檢驗方案所需的要素,檢測抽樣方案。
不同的抽樣檢驗?zāi)J剿枰臋z驗要素不同,模式A必須規(guī)定極限質(zhì)量LQ、批量N和抽樣類型。模式B除規(guī)定以上要素外,還要規(guī)定檢驗水平[4]。
由于該數(shù)據(jù)為臨時抓取,可以看成孤立批產(chǎn)品。根據(jù)第2節(jié)抽樣檢驗及孤立批抽樣檢驗的相關(guān)理論和程序,我們對X協(xié)議數(shù)據(jù)進行了完備性實驗。
實驗過程:①數(shù)據(jù)為隨即抓取,相當(dāng)于新產(chǎn)品的試制,因此使用模式A;②確定批量N=1 573 928;③經(jīng)過研究討論,確定極限質(zhì)量LQ=5%。
查 GB/T15239-1994一次抽樣方案表,批量N>500 000的孤立批一次抽樣方案為(500,18),即樣本量n=500,接收數(shù)AC=18。根據(jù)該抽樣方案,我們在數(shù)據(jù)中隨機抽樣500個,其中有0個錯誤幀,小于接收數(shù)AC,滿足GB/T15239-1994規(guī)定的(500,18)的抽樣方案,結(jié)果真實可信。
本次實驗中,如果應(yīng)用統(tǒng)計學(xué)的方法進行統(tǒng)計,將會付出很大的勞動量和理論準(zhǔn)備時間,而我們巧妙的把通信數(shù)據(jù)看成是一批待檢產(chǎn)品,應(yīng)用了孤立批抽樣檢驗的方法對通信協(xié)議解析中的大量的幀進行了完備性實驗與證明,使用質(zhì)量檢驗的方法,通過國家標(biāo)準(zhǔn)的查詢很快得出結(jié)論,事半功倍。本文除了告訴讀者學(xué)會使用抽樣的檢驗方法以外,更重要的是闡述學(xué)科的互通性,將所學(xué)的知識應(yīng)用到不同領(lǐng)域,可以得到良好的效果。在進行協(xié)議分析研究中,我們就應(yīng)用了很多跨學(xué)科理論進行工作[5]。例如在進行協(xié)議衍生分析的時候,我們擬采用工程造價中的 0-4評分法,利用專家資源,相信必定可以找到很多可能的協(xié)議衍生情況,解決了協(xié)議衍生分析的難題[6]。
[1] 吳曉光,雷菁,黃英. CCSDS分包遙控協(xié)議分析[J]. 信息安全與通信保密,2010(11):28-30.
[2] 王輝,王凌云,吳震. 面向衛(wèi)星網(wǎng)絡(luò)的TCP傳輸性能的研究[J]. 通信技術(shù),2008,41(09):145-146,149.
[3] 陳懷琛,吳大正,高西全.Matlab在電子信息課程中的應(yīng)用[M].北京:電子工業(yè)出版社,2005.
[4] 全國質(zhì)量專業(yè)技術(shù)人員職業(yè)資格考試辦公室.2008版質(zhì)量專業(yè)理論與實務(wù)[M]. 北京:中國人事出版社,2008.
[5] 蘇凱峰,雷菁,吳曉光.基于DV-Hop算法的地質(zhì)災(zāi)害預(yù)警應(yīng)用研究[J].通信技術(shù),2011,44(04):152-154.
[6] 何遠杭,王效武,張國波.通信設(shè)備協(xié)議實現(xiàn)框架研究[J].信息安全與通信保密,2011(07):37-39.