摘要:提出了一種基于Crossbar互連的可重構(gòu)分簇式分組密碼處理模型RCCPA和面向RCCPA的任務(wù)映射方法.所建立的任務(wù)就緒列表避免了任務(wù)劃分的死鎖問題,通過開發(fā)分組密碼組間并行及組內(nèi)流水特性,提高了RCCPA架構(gòu)的單元利用率和密碼處理性能.在RCCPA架構(gòu)上使用自動(dòng)化映射方法適配了AES/DES/IDEA等密碼算法,結(jié)果表明,該模型與方法有效提高了分組密碼算法的處理性能.
關(guān)鍵詞:分組密碼;可重構(gòu);分簇;任務(wù)映射
中圖分類號(hào):TN 492 文獻(xiàn)標(biāo)識(shí)碼:A
Research on Reconfigurable Clustered Architecture Model
and Task Mapping Targeted at Block Cipher Processing
CHEN Tao1,2, LUO Xing-guo2, LI Xiao-nan1, CHEN Xun1, CHANG Zhong-xiang1
(1.The PLA Information Engineering Univ, Zhengzhou, Henan 450004, China;
2.National Digital Switching System Engineering Technological Research Center, Zhengzhou, Henan 450004, China)
Abstract: A Reconfigurable Clustered Architecture Model named RCCPA and Task mapping method were proposed. Based on task ready list, this technique avoids the deadlock problem of the division of tasks. Through the development of block cipher's parallelization between packets and pipeline characteristic of the group, the unit utilization and cryptographic processing performance of the RCCPA architecture were improved. AES / DES / IDEA .etc cryptographic algorithm used automated method of mapping adaptation in RCCPA architecture, and the results show that the proposed model and method effectively improve the processing performance of the block cipher algorithm.
Key words: block cipher; reconfigurable; cluster; task mapping
隨著可重構(gòu)設(shè)計(jì)技術(shù)的發(fā)展,面向分組密碼處理的可重構(gòu)計(jì)算系統(tǒng)日益增多.針對(duì)分組密碼處理的可重構(gòu)系統(tǒng)主要包括:1)基于FPGA實(shí)現(xiàn)的可重構(gòu)處理芯片[1],該類芯片能夠獲得接近ASIC的處理性能,但是算法更換時(shí)需要重新設(shè)計(jì)電路、重新配置,存在配置信息多、布局布線復(fù)雜、處理粒度與分組密碼處理粒度不相符、對(duì)開發(fā)設(shè)計(jì)人員要求高等問題.2)面向密碼應(yīng)用的專用指令處理器,如RCBCP[2]和SophSEC[3]等基于VLIW結(jié)構(gòu)的處理芯片,通過開發(fā)分組密碼算法的指令級(jí)并行度,將可并行執(zhí)行的指令組合成一條指令,在一個(gè)指令周期內(nèi)完成,提高了分組密碼算法的實(shí)現(xiàn)性能.另一方面通過軟件編程的方式實(shí)現(xiàn)密碼算法,降低了編譯器的設(shè)計(jì)復(fù)雜性和用戶的開發(fā)難度.但是該架構(gòu)每個(gè)時(shí)鐘周期處理單元最多只能有一種運(yùn)算邏輯工作,存在資源利用率低的問題.3)基于配置流的粗粒度可重構(gòu)密碼處理架構(gòu),如RCPA[4]和RHCA[5]等基于陣列的處理架構(gòu).陣列結(jié)構(gòu)能夠以較大的并行度和流水深度進(jìn)行密碼處理,但是文獻(xiàn)[4]和[5]均沒有給出面向其架構(gòu)的任務(wù)劃分及映射方法,用戶開發(fā)難度大.另一方面陣列結(jié)構(gòu)存在互聯(lián)資源多、布局布線復(fù)雜的問題,并且其功能單元采用同構(gòu)化設(shè)計(jì),利用率低下.文獻(xiàn)[6]提出的ProDFA結(jié)構(gòu),通過執(zhí)行上下文快速更改數(shù)據(jù)流計(jì)算結(jié)構(gòu),在一定程度上提高了單元的利用率和密碼處理性能,通過定義一種配置描述語言,用戶可以使用此語言手動(dòng)完成任務(wù)的劃分與映射,但是這要求用戶對(duì)ProDFA結(jié)構(gòu)有深入的了解,同樣存在開發(fā)難度大的問題.
為提高可重構(gòu)分組密碼架構(gòu)的單元利用率,降低用戶使用的復(fù)雜性,實(shí)現(xiàn)分組密碼算法的在動(dòng)態(tài)可重構(gòu)架構(gòu)上的自動(dòng)任務(wù)映射,本文提出了一種基于分級(jí)互連結(jié)構(gòu)的可重構(gòu)分簇式密碼處理架構(gòu)的模型RCCPA(Reconfigurable Clustered Cipher Processing Architecture),RCCPA通過動(dòng)態(tài)配置數(shù)據(jù)處理路徑,提高了密碼算法處理性能和單元利用率.在此基礎(chǔ)上研究了任務(wù)的自動(dòng)映射問題,提出了面向RCCPA架構(gòu)的自動(dòng)映射方法,并在并行優(yōu)化和流水優(yōu)化兩個(gè)方面進(jìn)行了策略調(diào)整,實(shí)現(xiàn)了分組密碼算法的自動(dòng)化映射.完成了RCCPA的原型設(shè)計(jì),并評(píng)估了常用分組密碼算法在該架構(gòu)上的實(shí)現(xiàn)性能.
1 可重構(gòu)分簇式分組密碼處理架構(gòu)
分組密碼算法適于分組(或分塊數(shù)據(jù))內(nèi)并行、分組間并行或流水處理,并且具有分組(或分塊數(shù)據(jù))間數(shù)據(jù)交互少的特點(diǎn)[5].結(jié)合分組密碼算法處理特點(diǎn),本文提出的可重構(gòu)分簇式分組密碼處理模型如圖1所示.架構(gòu)采用分簇式設(shè)計(jì),包含4個(gè)處理簇、配置單元、通用寄存器堆、子密鑰寄存器堆、控制邏輯和I/O接口.
各個(gè)簇設(shè)置了相同的可重構(gòu)功能單元(Reconfiguable computer unit,RCU),并采用相似的互連方式,每個(gè)簇內(nèi)包含6種32 bit的操作單元:S盒替代、移位、GF(2n)上的矩陣乘法、算術(shù)乘法、算術(shù)模加/減、邏輯運(yùn)算等單元.為了支持超長位寬的處理需求,設(shè)計(jì)了兩類128 bit位寬的操作單元:比特置換、長移位單元,超長位寬單元通過將其輸入、輸出信號(hào)分為4組32 bit接入到4個(gè)處理簇中.功能單元設(shè)置的依據(jù)是可以快速支持分組密碼算法的9種基本操作[2].為滿足密鑰及臨時(shí)數(shù)據(jù)的存儲(chǔ)需求,專門設(shè)置了通用寄存器堆和密鑰寄存器堆.為降低寄存器堆的資源消耗,結(jié)合分組密碼算法分組(或分塊)內(nèi)的數(shù)據(jù)交互較少,設(shè)計(jì)了分簇式的寄存器堆結(jié)構(gòu).每個(gè)簇均包含一個(gè)容量為64×32 bit的通用寄存器堆,通用寄存器堆包含一個(gè)任意讀端口和一個(gè)任意寫端口.密鑰寄存器堆的設(shè)置與通用寄存器堆相似,只是存儲(chǔ)容量為128×32 bit,以及用途不同.
RCCPA可以根據(jù)密碼處理的需要,通過動(dòng)態(tài)可重構(gòu)互連網(wǎng)絡(luò)可靈活配置簇內(nèi)、簇間的互連結(jié)構(gòu),充分滿足密碼處理的并行及流水需求.各處理簇內(nèi)的RCU通過基于Crossbar互連的Level-1總線進(jìn)行數(shù)據(jù)交互,任一RCU的輸出可以接到任一RCU的輸入上,不同簇間的數(shù)據(jù)交互通過基于部分Crossbar互連的Level-2總線完成.數(shù)據(jù)路徑通過多個(gè)RCU的協(xié)同并行工作,構(gòu)成多級(jí)流水線,可以同時(shí)處理多個(gè)密碼分組,提高RCU資源利用率.在Level-2互連總線的配合下,還可以將數(shù)據(jù)路徑動(dòng)態(tài)地重構(gòu)成4個(gè)32 bit簇、2個(gè)64 bit簇和1個(gè)128 bit簇,充分滿足分組密碼處理靈活性的要求.
2 面向RCCPA的任務(wù)映射策略研究
為降低用戶的開發(fā)難度,提高RCCPA任務(wù)映射的效率,需要研究面向RCCPA的任務(wù)映射技術(shù).現(xiàn)階段針對(duì)動(dòng)態(tài)可重構(gòu)系統(tǒng)的任務(wù)映射算法研究較多[7-9],但集中在同構(gòu)系統(tǒng)上.針對(duì)異構(gòu)系統(tǒng)的映射研究又以不同處理器構(gòu)成的多核架構(gòu)為基礎(chǔ),映射技術(shù)以任務(wù)的軟硬件合理劃分為研究對(duì)象.雖然針對(duì)同構(gòu)系統(tǒng)的映射算法經(jīng)過修改可以應(yīng)用于異構(gòu)系統(tǒng),但存在調(diào)度成功率低、映射算法效率不高的問題,另外由于RCCPA架構(gòu)基于分簇的Crossbar互連,與現(xiàn)有的可重構(gòu)架構(gòu)存在較大區(qū)別,因此必須研究基于RCCPA架構(gòu)的任務(wù)映射算法.
2.1 相關(guān)定義
在動(dòng)態(tài)可重構(gòu)系統(tǒng)的任務(wù)映射過程中,需要建立相應(yīng)的應(yīng)用模型,以反映密碼處理任務(wù)的功能、屬性、任務(wù)間的約束關(guān)系等特征,以準(zhǔn)確描述任務(wù)分配與映射的對(duì)象.
定義1密碼處理任務(wù)可以表示為有向無環(huán)圖Gf={V,E,P,W}.其中
1)V={vi|1≤i≤n}是子任務(wù)的集合,vi表示可面向密碼編碼環(huán)節(jié)的基本操作任務(wù),每個(gè)vi均對(duì)應(yīng)一個(gè)任務(wù)屬性pi∈P.
2)E={eij}表示任務(wù)之間存在通信約束,即任務(wù)與任務(wù)之間存在依賴關(guān)系,任務(wù)vj必須在任務(wù)vi完成后才能執(zhí)行.ei的值表示任務(wù)vi與vj之間的數(shù)據(jù)通信量.
3)P={pi|1≤i≤n}為所有任務(wù)節(jié)點(diǎn)屬性的集合,用于描述任務(wù)節(jié)點(diǎn)的類型、數(shù)據(jù)來源、密鑰需求等,當(dāng)系統(tǒng)同時(shí)處理多個(gè)Gf分組時(shí),不同分組間子密鑰的使用特點(diǎn),如不同分組的Gf是否使用同一密鑰,如不是則需要指出下一分組的密鑰使用與上一分組的密鑰使用存在的關(guān)系.
4)W為任務(wù)節(jié)點(diǎn)的處理粒度,包括3種類型:32 bit, 64 bit, 128 bit,對(duì)于處理粒度小于32 bit的任務(wù),在任務(wù)劃分時(shí)通過將多個(gè)任務(wù)并行組合,將其作為32 bit的任務(wù)處理.
定義2 初始配置序列是完成密碼處理任務(wù)Gf的一個(gè)多重上下文序列,執(zhí)行可以完成Gf表示的一個(gè)分組數(shù)據(jù)的加(解)密任務(wù),配置序列={1,2,…,s}共需要執(zhí)行s個(gè)時(shí)鐘周期,i∈為單個(gè)配置上下文,該上下文執(zhí)行需要一個(gè)時(shí)鐘周期,每個(gè)上下文中均包含了子任務(wù)在該時(shí)刻的計(jì)算資源、存儲(chǔ)資源和互連資源占用情況.設(shè)T(i)為配置上下文i所完成的子任務(wù)集合,若此i中只是完成了操作數(shù)的提取,則此時(shí)T(i)=,N(i)表示i所對(duì)應(yīng)的資源占用情況,ni[y][x]∈N(i)表示i所占用的處理簇y中x類型的功能單元的總數(shù),主要包括:計(jì)算資源以及互連資源消耗等,Rtotal[y][x]表示可重構(gòu)處理架構(gòu)RCCPA處理簇y可以提供的x類型的功能單元數(shù)量或?yàn)榇貀提供x類型的通信帶寬.MR(i)表示執(zhí)行到i時(shí),需要占用的通用存儲(chǔ)空間的大小,MK(i)則表示任務(wù)執(zhí)行需要的密鑰存儲(chǔ)空間的大小,MRtotal和MKtotal為系統(tǒng)為各個(gè)簇提供的通用存儲(chǔ)空間及密鑰存儲(chǔ)空間的大小.一個(gè)可行的初始配置應(yīng)該滿足以下條件.
1)任務(wù)約束:
即初始配置序列必須完成Gf包含的所有子任務(wù),且每個(gè)子任務(wù)只能由某種功能單元完成一次.
2)資源約束:
i∈,ri[y][x]∈N(i),ni[y][x]≤Rtotal[y][x].
即每個(gè)配置上下文所占用的任意簇中任意功能單元的數(shù)量不能超過系統(tǒng)所提供的計(jì)算資源數(shù)量,存儲(chǔ)帶寬、簇間通信帶寬、輸出帶寬需求不能超過系統(tǒng)所提供的通信帶寬.由于各個(gè)處理簇內(nèi)的互連單元采用全Crossbar互連,能夠保證任意時(shí)刻任何功能單元的輸出可以連接到任意功能單元的輸入上,不管如何配置密碼處理路徑,簇內(nèi)帶寬肯定可以滿足需要,因此計(jì)算資源約束時(shí)不必考慮簇內(nèi)通信帶寬的約束.
3)存儲(chǔ)約束:
mri[y]∈MR(i),mk[y]∈MK(),則mri[y]≤MRtotal,mk[y]≤MKtotal.
存儲(chǔ)資源約束要求任務(wù)執(zhí)行的任意時(shí)刻,需要占用的通用寄存器數(shù)量、密鑰寄存器數(shù)量,不能超過系統(tǒng)提供的寄存器空間.由于RCCPA沒有設(shè)計(jì)專門的子密鑰計(jì)算電路,密鑰需要預(yù)先計(jì)算存儲(chǔ)于子密鑰寄存器堆,密碼處理時(shí)由運(yùn)算單元從密鑰寄存器中提取密鑰完成相應(yīng)操作,因此密鑰存儲(chǔ)空間的需求相對(duì)固定,生成初始配置序列時(shí),密鑰空間肯定可以滿足運(yùn)算需求,不需要對(duì)存儲(chǔ)資源進(jìn)行判斷.當(dāng)進(jìn)行多分組并行或流水處理時(shí),根據(jù)各分組是否使用相同密鑰的情況,首先進(jìn)行密鑰存儲(chǔ)空間是否滿足需求的判斷,如不滿足則不需要再進(jìn)行映射序列調(diào)整.
2.2 基于任務(wù)就緒列表的基本映射策略
基于任務(wù)就緒列表的無死鎖基本映射策略根據(jù)輸入的密碼處理任務(wù)Gf和RCCPA的結(jié)構(gòu)模型,在滿足約束條件的前提下,通過建立任務(wù)就緒列表避免死鎖,輸出為能夠處理一個(gè)分組的基本配置序列.主要分為以下步驟:
Step1 建立未分配任務(wù)集合、已分配任務(wù)集合,初始情況下未分配任務(wù)集合Gn=Gf,已分配任務(wù)集合Gp=.
Step2 根據(jù)未分配任務(wù)集合Gn和已分配任務(wù)集合Gp,生成就緒任務(wù)列表Gr,其過程是對(duì)Gn中的每個(gè)節(jié)點(diǎn)v,考查該節(jié)點(diǎn)的所有前驅(qū)節(jié)點(diǎn)prev(v)是否已經(jīng)被分配到相應(yīng)的模塊,即判斷prev(v)是否屬于Gp,如果所有的前驅(qū)節(jié)點(diǎn)屬于Gp,則該節(jié)點(diǎn)為就緒節(jié)點(diǎn).就緒列表建立算法如下描述.
輸入:未分配任務(wù)集合Gn和已分配任務(wù)集合Gp
輸出:就緒任務(wù)節(jié)點(diǎn)集合Gr
Gr=;初始化就緒節(jié)點(diǎn)集合為空集
For each node v∈Gndo;遍歷未分配任務(wù)集合Gn中的所有節(jié)點(diǎn)
sign←0; //初始化標(biāo)記
For each node u∈prev(v) do;
If uGp; //尚未分配節(jié)點(diǎn)
sign←1;//標(biāo)記為非就緒節(jié)點(diǎn)
Break;
Endif
Endfor
If sign=0then //v為就緒節(jié)點(diǎn)
Gr=Gr∪v; //將v加入到節(jié)點(diǎn)就緒集合中
Endif
endforStep3 根據(jù)就緒任務(wù)集合Gr,RCCPA的資源約束情況,確定第i次(第1次執(zhí)行此步驟時(shí)i=1)任務(wù)分配生成的配置序列2i-1,2i.為就緒集合中的任務(wù)分配單元時(shí),需要按照一定的規(guī)則進(jìn)行.本文設(shè)置的分配規(guī)則為:1)盡量將存在通信關(guān)系的任務(wù)分配到相同的處理簇中;2)任務(wù)分配按照優(yōu)先分配處理簇1, 然后分配處理簇2,3,4中單元的順序進(jìn)行.為硬件任務(wù)分配資源時(shí),盡量滿足規(guī)則1),在不能滿足規(guī)則1)的情況下按照規(guī)則2)進(jìn)行分配.分配算法的偽碼描述如下.
輸入:就緒任務(wù)集合Gr,RCCPA的資源約束Rtotal[y][x],MRtotal,未分配任務(wù)集合Gn和已分配任務(wù)集合Gp
輸出:配置序列2i-1,2i,更新后的未分配任務(wù)集合Gn和已分配任務(wù)集合Gp
2i-1=,2i=;初始化配置序列為空集
n=card(Gr);提取就緒列表中的任務(wù)個(gè)數(shù)
For j=0, j++, j v∈Grdo; (sign,2i-1,2i)←map(v,2i-1,2i); //根據(jù)分配原則、資源約束,2i-1,2i的資源使用情況為任務(wù)v分配資源,生成新的配置序列.若v分配成功,則置sign=0,更新2i-1,2i,否則sign=1,2i-1,2i序列不變. If sign=0 then {Gr,Gn,Gp}←updata{v,Gr,Gn,Gp}; //分配成功,更新各任務(wù)集合 Else Gr=Gr-v;分配失敗,更新就緒任務(wù)集合 Endif Endfor Step4 判斷未分配任務(wù)集合是否為空集.若Gn≠表示尚有任務(wù)未分配,則返回Step2繼續(xù)執(zhí)行.若Gn=則表明任務(wù)分配完畢,將Step3生成的配置序列={1,2,…,s}依次輸出,即為生成的初始配置上下文序列. 基本映射策略采用建立任務(wù)就緒列表的方式進(jìn)行任務(wù)分配,保證了每次分配的任務(wù)均是就緒節(jié)點(diǎn),杜絕了任務(wù)分配時(shí)死鎖的出現(xiàn).按照約定的分配原則進(jìn)行任務(wù)分配,保證了每次循環(huán)至少可以完成一個(gè)任務(wù)節(jié)點(diǎn)的分配,并保證了不會(huì)出現(xiàn)資源沖突,經(jīng)多次循環(huán)后可以完成所有任務(wù)的分配. 設(shè)輸入任務(wù)圖的節(jié)點(diǎn)數(shù)目和邊數(shù)分別為|V|和|E|,對(duì)于基本映射策略的主循環(huán),每次搜索就緒任務(wù)列表,至少可以分配一個(gè)子任務(wù),因此最壞情況下只需要搜索|V|次就緒列表就可以完成任務(wù)分配.對(duì)于每次循環(huán)都需要計(jì)算一次就緒任務(wù)列表,建立就緒列表需要搜索任務(wù)中的所有節(jié)點(diǎn)和每個(gè)節(jié)點(diǎn)的所有前驅(qū),因此復(fù)雜度為O(|V|+|E|).另外,每次循環(huán)都需要搜索就緒列表,其時(shí)間復(fù)雜度為|L|,其中|L|為就緒列表中包含的任務(wù)個(gè)數(shù),|L|≤|V|.因此基本映射策略的時(shí)間復(fù)雜度上界為(|V|)(|V|+|E|+|V|),即基本策略的復(fù)雜度為O(|V|2+|V||E|). 2.3 基于并行優(yōu)化的映射策略 RCCPA基本架構(gòu)提供了4個(gè)32 bit的處理簇,通過基本映射策略進(jìn)行任務(wù)分配時(shí),會(huì)出現(xiàn)4個(gè)處理簇沒有完全占用的情況;為開發(fā)分組密碼組內(nèi)的并行性,充分利用各處理簇硬件資源,在基本映射策略的基礎(chǔ)上,提出了基于并行優(yōu)化的映射策略.該策略是為了利用基本配置策略沒有占用的處理簇資源,因此并行優(yōu)化映射序列時(shí),不需要考慮系統(tǒng)的資源約束和存儲(chǔ)約束.并行優(yōu)化策略描述如下. Step1 搜索初始配置序列={1,2,…,s}中占用的功能單元所對(duì)應(yīng)的處理簇的最大編號(hào)max,max即為初始配置序列共占用的處理簇個(gè)數(shù),其偽碼描述如下: max =1; //初始化最大編號(hào) for each i∈ do //遍歷所有的配置序列 for each ri[y][x]∈i do if y Break; else max =y; //更新max endif endfor RCBCP是一款采用VLIW結(jié)構(gòu)具有4路并行的可重構(gòu)分簇式密碼處理器,Crypto-nite為兩路并行的64 bit位寬RISC結(jié)構(gòu),RCPA是基于陣列結(jié)構(gòu)的可重構(gòu)密碼處理架構(gòu).通過對(duì)多種分組密碼算法的適配,從表2的對(duì)比結(jié)果可以得出,RCCPA結(jié)構(gòu)可以靈活適配分組密碼算法,并且對(duì)不同設(shè)計(jì)結(jié)構(gòu)、不同處理位寬、不同操作位寬的分組密碼算法均有較高的處理性能,與其他專用可重構(gòu)密碼處理結(jié)構(gòu)相比處理性能提高了1.3~5.8倍. 考慮到RCCPA架構(gòu)使用crossbar進(jìn)行互連,一定程度上降低了互連資源的約束,增大了電路實(shí)現(xiàn)面積.為更好地衡量RCCPA面向分組密碼的處理性能,定義面積效率來評(píng)估不同可重構(gòu)系統(tǒng)的優(yōu)劣.RCBCP和RCPA在0.18 μm CMOS工藝下的等效門數(shù)分別為:121.25萬門和148.99萬門.RCCPA與RCBCP和RCPA架構(gòu)在該工藝條件下分組密碼算法的面積效率對(duì)比如表3所示. 如表3所示,通過對(duì)比常見的分組密碼算法在不同架構(gòu)上的面積效率可知,RCCPA架構(gòu)在增強(qiáng)的互連資源約束下的面積效率仍可達(dá)RCPA和RCBCP的1.6~3.1倍,表明RCCPA具有相對(duì)更優(yōu)的架構(gòu)、更高的單元利用率. 4 結(jié) 論 本文在總結(jié)分組密碼處理特征、分析可重構(gòu)分組密碼處理架構(gòu)優(yōu)勢(shì)及不足的基礎(chǔ)上,針對(duì)現(xiàn)有可重構(gòu)系統(tǒng)資源利用率低、用戶開發(fā)使用難度大等問題,提出了可重構(gòu)分簇式分組密碼處理架構(gòu)RCCPA,并在此基礎(chǔ)上研究了任務(wù)的自動(dòng)映射策略;結(jié)合分組密碼橫向上可并行、縱向上可深度流水的特性,研究了基于并行和流水的策略優(yōu)化,分析了策略的正確性和實(shí)現(xiàn)的時(shí)間復(fù)雜度;任務(wù)映射策略的設(shè)計(jì)實(shí)現(xiàn),降低了用戶的開發(fā)難度.通過與其他架構(gòu)進(jìn)行處理性能與面積效率等指標(biāo)的對(duì)比分析,更加合理地評(píng)估了可重構(gòu)密碼處理架構(gòu)的性能.從分析結(jié)果中可以看出,基于Crossbar互連的RCCPA架構(gòu),通過動(dòng)態(tài)組織處理路徑,具有更高的功能單元利用率和密碼任務(wù)的處理性能. 參考文獻(xiàn) [1] XU Jian,LIU Yuan-feng,DAI Zi-bin, et al.Design and implementation of reconfigurable AES IP core using FPGAs[C]//Proceedings of 6th International Conference on ASIC. New York: IEEE, 2005:765-768. [2] 孟濤,戴紫彬.分組密碼處理器的可重構(gòu)分簇式架構(gòu)[J]. 電子與信息學(xué)報(bào),2009,32(2):453-456. MENG Tao,DAI Zi-bin.Reconfigurable clustered architecture of block cipher processor[J]. Journal of Electronics Information Technology,2009,32(2):453-456.(In Chinese) [3] 黃偉.面向云計(jì)算的性能與功耗可配置安全終端技術(shù)研究[D].上海:復(fù)旦大學(xué),2011. HUANG Wei. The research of the performance and power configurable security terminal for cloud computing[D]. Shanghai: Fudan University, 2011.(In Chinese) [4] 楊曉輝,戴紫彬,張永福.可重構(gòu)分組密碼處理結(jié)構(gòu)模型研究與設(shè)計(jì)[J]. 計(jì)算機(jī)研究與發(fā)展,2009,46(6):962-967. YANG Xiao-hui,DAI Zi-bin,ZHANG Yong-fu.Research and design of reconfigurable computing targeted at block cipher processing[J]. Journal of Computer Research and Development,2009,46(6):962-967.(In Chinese) [5] 姜晶菲.可重構(gòu)密碼處理結(jié)構(gòu)的研究與設(shè)計(jì)[D].長沙:國防科學(xué)技術(shù)大學(xué),2004. JIANG Jin-fei. The research and design of reconfigurable cipher processing architecture[D]. Changsha:National University of Defense Technology,2004.(In Chinese) [6] 嚴(yán)明.面向領(lǐng)域應(yīng)用的異構(gòu)多核SoC系統(tǒng)結(jié)構(gòu)設(shè)計(jì)與優(yōu)化[D].長沙:國防科學(xué)技術(shù)大學(xué),2011. YAN Ming.Design and implementation of heterogeneous multicore SoC system focused on domain applications[D].Changsha:National University of Defense Technology,2011.(In Chinese) [7] 潘雪增,孫康,陸魁軍,等.動(dòng)態(tài)可重構(gòu)系統(tǒng)任務(wù)時(shí)域劃分算法[J].浙江大學(xué)學(xué)報(bào):工學(xué)版,2007,41(11):1841-1844. PAN Xue-zeng,SUN Kang,LU Kui-jun,et al.Tempoal task partitioning algorithm for dynamically reconfigurable systems[J].Journal of Zhejiang University: Engineering Science,2007,41(11):1841-1844.(In Chinese) [8] 季愛明,沈海斌,嚴(yán)曉浪.基于任務(wù)分組的動(dòng)態(tài)可重構(gòu)結(jié)構(gòu)編譯方法[J].浙江大學(xué)學(xué)報(bào):工學(xué)版,2006,40(8):1306-1310. JI Ai-ming,SHEN Hai-bin,YAN Xiao-lang.Compilation approach for dynamically reconfigurable architecture based on grouped tasks[J].Journal of Zhejiang University: Engineering Science, 2006,40(8):1306-1310.(In Chinese) [9] 黃樂天.基于空-時(shí)映射的多維可重構(gòu)數(shù)字系統(tǒng)資源與任務(wù)管理[D]. 成都:電子科技大學(xué),2009. HUANG Le-tian. The reconfigurable digital system resource and task management based on space-time mapping multidimensional[D]. Chengdu:University of Electronic Science and Technology of China,2009.(In Chinese) [10]BUCHTY R. Cryptonite: a programmable crypto processor architecture for high-bandwidth applications [D]. Munchen: Institut fur Informatik der Technischen Universitat Munchen,2002.