999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于FT2000 處理器內存性能測試及優化

2022-06-16 07:49:34李競擇茍喜東范承宇
機電產品開發與創新 2022年3期
關鍵詞:優化

李競擇, 茍喜東, 范承宇

(中國兵器裝備集團自動化研究所有限公司, 四川 綿陽 621000)

0 引言

STREAM 工具是由美國教授John McCalpin 提出的一套綜合性能測試程序集, 旨在測試計算機的內存帶寬性能。 現在世界上存在的個人計算機和專用計算機大部分是使用美國生產、研發的處理器、固件以及操作系統,全國產化的計算機目前還比較少,性能較差,針對全國產化計算機的內存性能測試也比較少。 本文選用由飛騰(FT2000/4)處理器、昆侖固件以及銀河麒麟操作系統構成的全國產化計算機進行STREAM 測試,設置不同參數取值下的對照實驗, 挖掘發現內存性能測試的規律和優化方法。

1 實驗軟硬件介紹

1.1 STREAM 測試工具

隨著處理器處理核心數量的增多, 內存帶寬對于提升整個系統性能越發重要, 如果某個系統不能足夠迅速地將內存中的數據傳輸到處理器當中, 若干處理核心就會處于等待數據的閑置狀態, 所產生的閑置時間不僅會降低系統的效率, 還會抵消多核心和高主頻所帶來的性能提升[1]。

STREAM 是由時為美國特拉華州大學(Delaware University) 的教授John McCalpin 團隊提出和完成的一套用于測試處理器內存性能的測試工具。 后由弗吉尼亞大學(Virginia University) 的計算機科學系負責它的維護和版本更新。

STREAM 包括Copy、Scale、Add、Triad 四種對連續一維向量數組的操作。 Copy 先訪問一個內存單元讀出其中的值,再將值寫入另一個內存單元。Scale 操作先從內存單元讀出其中的值,作一個乘法運算,再將結果寫入另一個內存單元。 Add 操作先從內存單元讀出兩個值,做加法運算,再將結果寫入另一個內存單元。Triad 操作先從內存單元中讀兩個值,將其中一個數值乘以一個標量,與另一個值相加, 將運算結果寫入另一個內存單元。 表1 給出了STREAM 基準測試程序的四種算法操作。

表1 STREAM 基準測試程序算法操作

1.2 飛騰處理器

FT-2000/4 是飛騰旗下的一款面向桌面計算機,包括臺式機、一體機、筆記本和終端控制主機的高性能通用處理器。 它集成了4 個64 位高性能核, 主頻標準配置為2.6GHz 并且可超頻至3GHz。 商業級版本工作溫度范圍在0 到70℃而工業級版本工作溫度范圍在-40℃到85℃。

作為國產處理器的領頭人,FT-2000/4 詳細技術指標如下: 采用ARM64 指令集、 主頻可調范圍為1.9GHz 到3GHz、4 個64 位處理器核FTC663、集成2 個DDR4/3200存 儲 接 口、 集 成2 路16lane PCIE3.0 接 口、2 路1lane PCIE3.0 接口、 集成2 個千兆網口、1 個SD2.0 控制器、1個高保真音頻接口、以及串口、FLASH 接口等慢速I/O 接口、全芯片典型工作功耗為10W。

FT-2000/4 可以根據實際應用需求,設計出不同的硬件配置。 具體設計可以根據需求裁剪、添加、替換外設模塊。 用戶可以根據具體應用靈活調整。

1.3 昆侖固件

昆侖固件是中電科技旗下的一款具有自主知識產權,以固件技術和可信計算技術為核心,支持整機主板硬件初始化和操作系統引導, 廣泛應用于主流國產處理器平臺的服務器、終端、移動設備和嵌入式設備的明星產品。 昆侖固件可信版已經全面支持國產硬件平臺, 并實現了多種安全可信功能。目前,昆侖固件已在多個國家項目和軍隊項目中廣泛應用,并獲得了解放軍科學技術進步一等獎[2]。

1.4 銀河麒麟操作系統

“銀河麒麟”操作系統由中國自主研發的基本內核層和基于FreeBSD(一種Unix 操作系統)改造的系統服務層組成,是一個擁有層次式內核、安全等級達到結構化保護級、 能支持多種微處理器和多種計算機體系結構, 并與Linux 目標代碼兼容的國產服務器操作系統[3]。

作為國產操作系統的領頭羊, 銀河麒麟V10 操作系統擁有:同源代碼構建、國產平臺優化、圖形顯示優化、內生安全體系、輕量桌面環境、統一軟件、安卓兼容環境、版本兼容升級等特點。

2 測試方案設計及測試結果

2.1 測試原理

STREAM 工具主要使用四種數組的運算來測試內存帶寬的性能,分別是:數組的復制(Copy)、數組的尺度變換(Scale)、數組的矢量求和(Add)、數組的復合矢量求和(Triad)。

2.2 測試參數說明

STREAM 作為一款完善的內存寬帶性能測試工具擁有很多可選參數, 確保用戶可以根據自己的需求選用最優參數進行測試。 具體參數說明見表2。

表2 STREAM測試參數說明

2.3 測試方案設計與結果

本次實驗目的是對STREAM 測試工具的各項參數進行調試、設置,根據測試數據進行分析,從而得到測試得分最高的參數設置方案。

為防止偶然數據影響分析, 每次測試均加上參數-DNTIMES=30,表示測試30 次取最優值。

因為單線程與多線程測試分數肯定相差很大, 所以不加-fopenmp 的單線程測試結果不與添加了-fopenmp的多線程測試結果比較, 僅與無-fopenmp 參數測試結果比較。

針對參數-mtune/-march, 由于測試編譯機即運行機器,所以該參數值選擇為native。 編譯對照命令見表3。

表3 編譯命令

參數-mtune/-march 測試結果見表4。

表4 跑分結果

由測試數據可以看出,該參數會降低得分,因此后續實驗均不添加此參數。

針對參數-O,同樣如表3 制定類似編譯策略,進行對比試驗,編譯對照命令見表5。

表5 編譯命令

參數-O 測試結果,如表6 所示。

表6 跑分結果

從表5 可以看出,加上-O 參數后,得分明顯超過未加-O 參數得分,因此,后續實驗中均加入-O 參數討論。

針對參數-DSTREAM_ARRAY_SIZE,查看stream 測試工具源碼可知,未定義此參數時默認值為-DSTREAM_ARRAY_SIZE=10000000。 考慮到篇幅大小與CPU 正常工作情況(多核工作),針對該參數僅對多線程進行實驗,測試初始值從2000000 開始,每隔2000000 設置一次參數,直到10000000,編譯命令如表7 所示。

表7 編譯命令

實驗結果如表8 所示。

表8 跑分結果

從表中可以看出,該參數大小對性能得分影響很大,因此該參數取值應該擴大設置范圍進行重點討論。于是,我們從2000000 開始每隔2000000 取一次值, 直到110000000。 跑分結果見表9。

為方便分析結果,我們將表9 制成曲線圖,并且畫出趨勢線見圖1。

表9 跑分結果

觀察該圖,可知在一定范圍內,跑分分數呈周期性上下波動,觀察整體趨勢線,可知總體趨勢是隨該參數取值的增大而下降的。 由于平均分數是由4 項分數:Copy、Scale、Add、Triad 平均得出, 所以為了探究各測試項對平均分數影響的大小,我們做出了4 個測試項的曲線圖,如圖2~圖5 所示。

圖2 Copy 得分

圖5 Add 得分

圖3 Scale 得分

圖4 Triad 得分

觀察上圖, 可以看到,4 項分數均呈周期性變化。 其中Copy 在一個周期內(約5000000 一個周期)呈類三角函數變化;Scale 在一個周期內(約7500000 一個周期)呈類三角函數變化;Triad 在一個周期內(約29000000 一個周期)呈周期性變化,可以取到極值;Add 在一個周期內(約29000000 一個周期)呈周期性變化,可以取到極值。因為4 項得分都呈周期性變化, 所以4 項得分的平均得分也呈周期性變化。

3 測試結果與分析

在2.3 節進行了科學且系統的參數選取實驗,并且得到了實驗結果。 根據表格及曲線圖分析可得到以下結論:

(1)-mtnue/-march 參數會導致得分負增長,不建議在測試時加入。

(2)-O 參數會優化編譯器使得得分大幅度增長,建議在測試時加入。

(3)-DSTREAM_ARRAY_SIZE 參數的取值變化會使得得分呈周期性變化,在取值時應該根據測試方要求選取不同值。 例如測試要求參數取值范圍為0 到10000000,則在此范圍內應該取4000000 作為參數值,此時得分最高。

數據測試結果表明, 進行STREAM 多線程內存性能測試時相較于不添加任何參數,加上-O 以及-DSTREAM_ARRAY_SIZE 參數后,程序測試分數最大可以提升56.34%。

4 結束語

隨著科技的高速發展, 科學和工程的各個領域都對高性能數據處理有極高的要求, 但計算機訪存性能的瓶頸制約了應用程序的發揮, 使得其峰值性能只有機器實際性能的5%到10%左右。

本文研究了STREAM 在使用了FT2000/4 微處理器的全國產筆記本上的性能優化方法。 從參數方向入手系統地討論了-mtune/-march、-O、-DSTREAM_ARRAY_SIZE等關鍵參數對內存性能測試結果的影響。

數據測試結果表明,優化后,并行程序的最高訪存性能能達到13.93GB/s,對比優化前的最高訪存性能提高了56.34%。

程序優化是一個永無止境的過程, 希望其他學者在尋找更好優化方法的同時, 把本文的優化方法應用到其他具有相似訪存特點的程序中。

猜你喜歡
優化
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
PEMFC流道的多目標優化
能源工程(2022年1期)2022-03-29 01:06:28
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
由“形”啟“數”優化運算——以2021年解析幾何高考題為例
圍繞“地、業、人”優化產業扶貧
今日農業(2020年16期)2020-12-14 15:04:59
事業單位中固定資產會計處理的優化
消費導刊(2018年8期)2018-05-25 13:20:08
4K HDR性能大幅度優化 JVC DLA-X8 18 BC
幾種常見的負載均衡算法的優化
電子制作(2017年20期)2017-04-26 06:57:45
主站蜘蛛池模板: 国产无码制服丝袜| 成人综合久久综合| 99精品视频九九精品| 国产99视频在线| 日本国产精品| 日本不卡视频在线| 国产精品亚洲专区一区| 亚洲免费毛片| 丁香综合在线| 四虎永久免费地址| 日韩av电影一区二区三区四区| 9966国产精品视频| 久久久久九九精品影院| a天堂视频| 欧洲在线免费视频| 狂欢视频在线观看不卡| 婷婷五月在线| 午夜精品一区二区蜜桃| 色天天综合久久久久综合片| 国产精品一区不卡| 东京热一区二区三区无码视频| 九一九色国产| 亚洲国产精品美女| 亚洲综合经典在线一区二区| 9丨情侣偷在线精品国产| 啪啪免费视频一区二区| 国产亚洲精品自在久久不卡| 免费视频在线2021入口| 无码丝袜人妻| 国产成人精品18| 91在线无码精品秘九色APP| 亚洲精品桃花岛av在线| 精品少妇人妻无码久久| 无码国产偷倩在线播放老年人| 欧美视频在线观看第一页| 国产精品亚欧美一区二区三区| 特黄日韩免费一区二区三区| 国内老司机精品视频在线播出| 久久一本精品久久久ー99| 99精品视频九九精品| 亚洲精品麻豆| 久草网视频在线| 亚洲人成色在线观看| 香蕉eeww99国产精选播放| 久久国产精品麻豆系列| 激情综合婷婷丁香五月尤物| 性视频一区| 精品福利网| 国产不卡在线看| 四虎国产精品永久在线网址| 女人18毛片久久| 久久国产精品影院| 国产成人夜色91| 成人综合网址| 亚洲乱码在线视频| 欧美一级大片在线观看| 人妻夜夜爽天天爽| 亚洲欧美日韩色图| 毛片大全免费观看| 中文字幕亚洲无线码一区女同| 欧美色视频在线| 波多野结衣久久精品| 久草网视频在线| 欧美亚洲激情| 综合色亚洲| 国产91丝袜在线播放动漫| 免费三A级毛片视频| 东京热av无码电影一区二区| 国产精品尤物在线| 精品国产自在在线在线观看| 欧美日本在线观看| 亚洲一区二区成人| 久久伊人操| 欧美成人手机在线观看网址| 国产精品蜜芽在线观看| 午夜影院a级片| 蝌蚪国产精品视频第一页| 99re热精品视频中文字幕不卡| 欧美一级99在线观看国产| 亚洲无码久久久久| 国产精品无码在线看| 亚洲一区二区三区在线视频|