999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于TMS320C6678的復(fù)數(shù)求模算法研究

2018-10-11 03:34:18袁子喬
火控雷達(dá)技術(shù) 2018年3期
關(guān)鍵詞:利用效率

楊 剛 杜 力 袁子喬

(西安電子工程研究所 西安 710100)

0 引言

TMS320C6678[1](后文中簡稱C6678)是TI公司于2010年推出的一款具有業(yè)界領(lǐng)先處理能力的多核DSP處理器,其采用的是KeyStone多內(nèi)核架構(gòu),片內(nèi)集成了8個(gè)C66x核,每個(gè)核都具有定點(diǎn)和浮點(diǎn)運(yùn)算能力,同時(shí)也集成了SRIO(Serial RapidIO),PCIe(Peripheral Component Interconnect Express)等接口,為方便數(shù)據(jù)的搬移,配置了EDMA(Enhanced Direct Memory Access)。TI公司也為開發(fā)人員提供了C6678的mathLib,dsplib等函數(shù)庫。

得益于C6678強(qiáng)大的并行處理能力和接口的高速數(shù)據(jù)傳輸能力,其在信號處理領(lǐng)域應(yīng)用極其廣泛,特別是雷達(dá)信號處理領(lǐng)域,過去的FPGA+DSP的架構(gòu)中,大部分的計(jì)算(如DPC算法[2],MTD算法[3]等)是在FPGA中完成,但FPGA調(diào)試效率極低,嚴(yán)重地降低了雷達(dá)信號處理機(jī)調(diào)試的效率。在C6678出現(xiàn)后,現(xiàn)在越來越多的雷達(dá)信號處理算法從FPGA遷移到了DSP中完成,極大地提升了雷達(dá)信號處理機(jī)的調(diào)試效率。然而,雷達(dá)信號處理中許多數(shù)據(jù)都是復(fù)數(shù)形式的,需要進(jìn)行大量的復(fù)數(shù)求模,而傳統(tǒng)的復(fù)數(shù)算法效率極低,嚴(yán)重地影響了整個(gè)信號處理機(jī)的效率,因此,對C6678中復(fù)數(shù)求模算法進(jìn)行優(yōu)化有著重要的意義。

本文所有內(nèi)容是針對TMS320C6678進(jìn)行探討,考慮到實(shí)際情況中一般是對復(fù)數(shù)向量求模,所以本文的測試數(shù)據(jù)是一個(gè)復(fù)數(shù)向量,所討論的每個(gè)復(fù)數(shù)對應(yīng)的求模時(shí)間為復(fù)數(shù)向量的求模時(shí)間除以向量長度。所有測試中,測試數(shù)據(jù)和所求結(jié)果都在LL2中,L1D cache大小為32kB,L1P cache大小為32kB,L2 cache大小為0,編譯器優(yōu)化選項(xiàng)為-O3,測試結(jié)果以MTALAB作為“真值”進(jìn)行誤差分析。

1 常規(guī)的復(fù)數(shù)求模算法

1.1 第一種常規(guī)的復(fù)數(shù)向量求模算法vec_abs1

常規(guī)的復(fù)數(shù)求模公式很簡單,先求實(shí)部虛部平方和,然后再調(diào)用math.h中的sqrt函數(shù)求平方根,這是最“正規(guī)”的也是效率最低的,事實(shí)上TI針對自身DSP提供的dsplib中的sqrtsp函數(shù)性能優(yōu)于sqrt函數(shù),所以用sqrtsp代替sqrt。因此得到第一種常規(guī)的復(fù)數(shù)向量求模算法的程序如圖2所示。

1.2 第二種常規(guī)的復(fù)數(shù)向量求模算法vec_abs2

TI分別針對C6200,C6400,C6600等提供了許多Intrinsic操作符,這些操作符默認(rèn)是內(nèi)聯(lián)的[4](Inlined),利用這些操作符對復(fù)數(shù)向量求模算法優(yōu)化,主要是對取數(shù)和乘法進(jìn)行優(yōu)化可以得到第二種常規(guī)的復(fù)數(shù)向量求模算法。其中,用到的Intrinsic函數(shù)及含義如下:

1) const double & _amemd8_const (const void *ptr); 從存儲(chǔ)器中讀取8字節(jié)數(shù)據(jù)。

2)double _complex_conjugate_mpysp (double src1, double src2); 復(fù)數(shù)共軛乘法。

3) float _lof (double src); 從double中提取低位float。

4) float _hif (double src); 從double中提取高位float。

第二種常規(guī)的復(fù)數(shù)向量求模算法程序如圖3所示。

1.3 第三種常規(guī)的復(fù)數(shù)向量求模算法vec_abs3

TI提供的dsplib中包括了許多向量、矩陣的處理函數(shù),效率很高。考慮到復(fù)數(shù)向量求模需要計(jì)算很多次的實(shí)部與實(shí)部的乘法,以及虛部與虛部的乘法,所以調(diào)用dsplib中的向量乘法函數(shù)DSPF_sp_vecmul,從而得到第三種常規(guī)的復(fù)數(shù)向量求模算法,程序見圖4。

經(jīng)過實(shí)驗(yàn)對比發(fā)現(xiàn),常規(guī)方法中,第三種效率最高,第一種次優(yōu),第二種最差。第三種的測試結(jié)果如表1所示。

通過表1可以看出,雖然第三種常規(guī)復(fù)數(shù)向量求模算法相對于第一種和第二種效率更高,但每個(gè)復(fù)數(shù)點(diǎn)平均耗時(shí)仍然約為62個(gè)時(shí)鐘周期,對于信號處理來說,效率還是很低,不過,因?yàn)槭亲罨镜膶?shí)現(xiàn)方法,所以該方法精度很高,最差的最大絕對誤差百分比為5.564378038394069e-07。

表1 第三種常規(guī)復(fù)數(shù)向量求模算法測試結(jié)果

2 RSQRSP指令vec_abs_noitr

表2 利用RSQRSP指令的復(fù)數(shù)向量求模算法測試結(jié)果

通過表2可以看出,利用RSQRSP指令進(jìn)行復(fù)數(shù)向量求模,效率極高,每個(gè)復(fù)數(shù)點(diǎn)平均耗時(shí)為2.72119~5.3125個(gè)時(shí)鐘周期,而vec_abs3中每個(gè)復(fù)數(shù)點(diǎn)平均耗時(shí)約62個(gè)時(shí)鐘周期,所以vec_abs_noitr相對于vec_abs3效率提升11.6706~22.7841倍。

從表2中的最大絕對誤差百分比可以看出該算法精度較低,僅可用于對精度要求不高的計(jì)算中。

3 利用牛頓迭代的改進(jìn)

x(n+1)=x(n)[1.5-(ν/2)×x(n)×x(n)]

(1)

其中,v為原始數(shù)據(jù)。每迭代一次精度提高2-8,也即迭代一次精度為2-16,迭代兩次精度為2-24。

進(jìn)行一次Newton-Phapson迭代的復(fù)數(shù)矩陣求模算法vec_abs_1itr的程序如圖6所示,測試結(jié)果如表3所示。

表3 一次Newton-Phapson迭代的復(fù)數(shù)矩陣求模算法測試結(jié)果

通過表3可以看出,利用Newton-Phapson迭代一次后每個(gè)點(diǎn)平均耗時(shí)為9.0703125~13.59375,時(shí)間較vec_abs_noitr有所增加,但相對于vec_abs3來說,效率還是提升了4.5609~6.8355倍,而最大絕對誤差百分比已經(jīng)達(dá)到了約1.5e-5,該精度可以滿足大多數(shù)的信號處理算法。

進(jìn)行二次Newton-Phapson迭代的復(fù)數(shù)矩陣求模算法vec_abs_2itr的程序如圖7所示,測試結(jié)果如表4所示。

通過表4可以看出,利用Newton-Phapson迭代二次后每個(gè)點(diǎn)平均耗時(shí)為16.0698~20.5625,時(shí)間較vec_abs_1itr有所增加,但相對于vec_abs3來說,效率還是提升了3.0152~3.8582倍,對比表4和表1中的最大絕對誤差百分比可以看出,vec_abs_2itr的精度和vec_abs3幾乎一致。

4 結(jié)果分析

由前述的測試結(jié)果可以得出,常規(guī)算法中,利用sqrtsp的vec_abs3精度最高,但效率最低;而單純利用RSQRSP指令的vec_abs_noitr效率最高,但精度最差;通過Newton-Phapson迭代一次vec_abs_1itr精度精度較差,效率較高;通過Newton-Phapson迭代二次vec_abs_2itr精度精度最高,效率較差。這四種算法的特點(diǎn)如表5所示。

5 結(jié)束語

本文針對TMS320C6678研究了信號處理領(lǐng)域經(jīng)常使用到的復(fù)數(shù)求模算法,包括最基本的常規(guī)復(fù)數(shù)求模算法,利用RSQRSP指令的復(fù)數(shù)求模算法,以及利用RSQRSP指令的基礎(chǔ)上通過Newton-Phapson迭代一次和二次的復(fù)數(shù)求模算法,并給出了各種算法的測試結(jié)果,分析了各種算法的效率和精度,測試結(jié)果對信號處理設(shè)計(jì)師有很重要的參考意義。

猜你喜歡
利用效率
利用min{a,b}的積分表示解決一類絕對值不等式
利用倒推破難點(diǎn)
提升朗讀教學(xué)效率的幾點(diǎn)思考
甘肅教育(2020年14期)2020-09-11 07:57:42
利用一半進(jìn)行移多補(bǔ)少
注意實(shí)驗(yàn)拓展,提高復(fù)習(xí)效率
利用數(shù)的分解來思考
Roommate is necessary when far away from home
效率的價(jià)值
商周刊(2017年9期)2017-08-22 02:57:49
利用
跟蹤導(dǎo)練(一)2
主站蜘蛛池模板: 欧美全免费aaaaaa特黄在线| 亚洲免费三区| 欧美精品在线免费| 国产极品粉嫩小泬免费看| 一级毛片中文字幕| 久久午夜夜伦鲁鲁片无码免费| av在线5g无码天天| 国产玖玖玖精品视频| 色婷婷在线影院| 久久黄色影院| 97成人在线视频| 91视频青青草| 99手机在线视频| 日韩精品亚洲精品第一页| 精品午夜国产福利观看| 免费毛片全部不收费的| 久久久久免费看成人影片| 国产精品亚洲五月天高清| 久久精品国产999大香线焦| 亚洲香蕉伊综合在人在线| 色综合久久综合网| 一级在线毛片| 婷五月综合| 欧美亚洲中文精品三区| 四虎综合网| 亚洲天堂在线视频| 色窝窝免费一区二区三区 | 无码一区二区三区视频在线播放| 九九久久精品免费观看| 草逼视频国产| 国产传媒一区二区三区四区五区| 成人精品视频一区二区在线| 成人亚洲视频| 国产精品冒白浆免费视频| 四虎亚洲国产成人久久精品| a免费毛片在线播放| 国产国语一级毛片| 黄色网站在线观看无码| 黄色污网站在线观看| 免费 国产 无码久久久| 2020久久国产综合精品swag| 中文字幕乱码中文乱码51精品| 久草性视频| 欧美一级在线| 日韩国产黄色网站| 天天色天天综合网| 91网址在线播放| 国产综合精品日本亚洲777| 97在线免费视频| 呦视频在线一区二区三区| 亚洲日韩久久综合中文字幕| 人妻丰满熟妇av五码区| 日本三区视频| 亚洲国产日韩在线成人蜜芽| 国产麻豆va精品视频| 浮力影院国产第一页| 性视频久久| 国产幂在线无码精品| 中字无码精油按摩中出视频| 日韩精品成人在线| 成年午夜精品久久精品| 97色婷婷成人综合在线观看| 少妇极品熟妇人妻专区视频| 亚洲国产精品日韩专区AV| 亚洲成a人片| 这里只有精品免费视频| 亚洲欧美另类日本| 国产小视频a在线观看| 亚洲天堂.com| 国产交换配偶在线视频| 久热中文字幕在线| 一级毛片在线免费视频| 爱色欧美亚洲综合图区| 国产成人亚洲无码淙合青草| 亚洲精品中文字幕无乱码| 免费在线视频a| 久久狠狠色噜噜狠狠狠狠97视色| 欧美精品亚洲精品日韩专区| 国产超碰在线观看| 2020久久国产综合精品swag| 亚洲天堂免费在线视频| 18禁黄无遮挡免费动漫网站|