999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

GPU加速有限元接觸傳熱過程

2013-01-01 00:00:00陳焰
軟件工程 2013年5期

摘 要:在鋼板的沖印過程中,模具的淬火效果在板料的轉變中起著重要的作用。因此,本文對鋼板的淬火過程建立了一個有限元模型,該模型的關鍵點主要是接觸熱傳導過程,利用有限元計算機程序來計算淬火過程溫度場的變化,同時通過溫度測量裝置來得到模具和板料的溫度-時間曲線來驗證計算結果。最后,采用基于GPU(圖形處理單元)技術的并行計算來加快計算。

關 鍵 詞:接觸傳熱;有限元;GPU

引言

接觸傳熱工程技術普遍存在,如板材熱沖壓成形技術、電子器件的冷卻與加熱、高效絕熱結構安裝等。該問題的研究涉及到材料表面特性、溫度、受載環(huán)境等多種因素的影響,問題的分析呈現(xiàn)出明顯的耦合特性。使問題求解難度較一般的傳熱計算難度提高,體現(xiàn)出明顯的雙重非線性特征——傳熱非線性與接觸非線性。尋求高效穩(wěn)定的問題求解方法,同時具有理論和工程應用價值。一般說來,由于問題的復雜性,除了對有限的簡單問題可以得到解析解外,對于多數(shù)問題,一般采用有限元方法進行求解。

有限元進行數(shù)值計算存在的一大問題是計算時間過長,尋找高效的計算平臺及相適應的算法一直以來都是研究的熱點。近年來利用GPU進行科學運算成為高性能計算的發(fā)展方向之一,在圖像處理、數(shù)據(jù)分析和有限元模擬領域已經(jīng)取得了諸多成果。利用GPU進行科學運算的優(yōu)點在于運算速度快、成本低廉,成本和功耗相當于計算機的1/10左右,缺點在于顯存小、計算精度低,作為一種新型的科學計算平臺,傳統(tǒng)的串行算法和適用于編程模式的并行算法均難以充分發(fā)揮的GPU運算能力,開發(fā)適用于GPU的并行算法是推廣科學運算的迫切需求[1]?;谏鲜龇治?,本研究開發(fā)了二維熱傳導有限元程序,并使用GPU改進實現(xiàn)計算的加速。

接觸傳熱計算模型

1.本構方程

接觸傳熱有限元程序設計

根據(jù)上述理論分析,按照如圖1所示流程圖設計有限元程序,輸入記錄有限元模型網(wǎng)格節(jié)點坐標、單元信息的文件以及相關材料性能參數(shù)的文件,遍歷模型中所有單元,根據(jù)單元坐標,材料性能參數(shù)計算單元剛度矩陣以及單元熱容矩陣,然后根據(jù)單元拓撲信息組裝得到總體剛度矩陣K以及總體熱容矩陣C;在每個時間步長內(nèi),根據(jù)式(3)及結點間的接觸關系計算每個接觸節(jié)點的載荷向量,并組裝成總體載荷向量P[3]。接觸傳熱過程屬于瞬態(tài)傳熱,在時間域內(nèi)用有限元單元網(wǎng)格劃分;在時間域內(nèi)則用有限差分法,將連續(xù)的時間變量離散為若干時間步。常用的差分方式有向前差分、向后差分、Crank-Nicolson格式及Galerkin格式,由于Crank-Nicolson格式具有較高的計算精度,并且無條件穩(wěn)定,故本文采用此種格式,如式(5)所示:

數(shù)值算例

以鋼板淬火過程作為算例,如圖2所示,上下為低溫模具,初始溫度為20℃,中間為高溫板料,初始溫度為700℃。計算模型的導熱系數(shù)和比熱容如表1和表2所示:接觸導熱系數(shù)為4694 W /m2。

計算結果分析

采用的計算平臺為CPU Intel雙核主頻2.6GHz、內(nèi)存4GB、顯卡GTX260、顯卡核心575MHz、顯存896MB。

為縮短接觸傳熱有限元計算時間,先分析當前程序中各步驟所占時間比例,結果如圖3所示。記錄求解線性方程式(5)在整個有限元程序中所占時間比例,雖然剛度矩陣因為材料的非線性特性,每個時間步長都需要重新計算并組裝,但求解線性方程組仍占據(jù)計算的大部分時間,并且占據(jù)百分比隨節(jié)點數(shù)的增加而增加[4]。在目前的情況下,總計算時間占求解方程式(5)的比例可能高達95%。因此,找到一個高效的算法來求解方程式(5)成為加快計算速度的關鍵因素。

根據(jù)有限元的理論可知,方程式(5)中的總體剛度矩陣以及總體熱容矩陣均為稀疏矩陣。對于大規(guī)模稀疏線性方程組,直接解法的計算量和存儲空間要求都很大。近年來雖然人們發(fā)展了如PARDISO和GSS等直接解法求解器,但是對于超大規(guī)模的稀疏矩陣求解,迭代解法仍是目前主要的方法,共軛梯度迭代法由于其所需存儲空間和計算量較小且容易進行并行計算,在大型對稱正定稀疏矩陣求解中越來越受到青睞。在共軛梯度法中迭代過程的每步之間是串行的,但向量內(nèi)積和向量更新、稀疏矩陣與向量乘法都是數(shù)據(jù)級的,并行操作可以交付給GPU。因此,負責迭代前預置步驟的并行計算以及每次迭代過程中的向量內(nèi)積和向量更新以及稀疏矩陣與向量乘法,并行計算負責迭代循環(huán)和收斂條件的控制,CPU每次迭代過程中的標量除法操作顯存和內(nèi)存的開辟和清理工作。為考察GPU加速效果,采用標準的線性系統(tǒng)軟件包LINPACK作為標準。最終得到的結果如圖4所示,從圖4中可以看出GPU并行算法加速比隨結點數(shù)增加而增加最高可達4.21。其原因在于隨著結點數(shù)目的增加、矩陣階數(shù)增加、矩陣數(shù)目增加、矩陣乘法增加,計算時利用了更多的計算核心算法,并行度更好,更多的節(jié)省了計算時間。

參考文獻

[1] 王順緒,戴華.廣義特征值問題的并行塊Jacobi-Davidson方法及應用.計算力學學報[J].2008,25(4):428-433.

[2] 李洪林,張海蕾,王希誠.一種量子化學有限元并行計算方法.大連理工大學學報[J].2005,25(4):469-472.

[3] 喻永聲,林家浩.超大型結構特征值問題求解的多重子結構子空間迭代.工程力學[J].2003,20(6):149-154.

[4] 王勖成.有限單元法[M].北京:清華大學出版社,2003.

主站蜘蛛池模板: 在线国产资源| 欧美午夜在线播放| 视频在线观看一区二区| 99在线视频免费观看| 午夜影院a级片| 亚洲清纯自偷自拍另类专区| yjizz视频最新网站在线| 一级成人a毛片免费播放| 久久a毛片| 国产一级二级三级毛片| 色噜噜综合网| 欧美日韩在线成人| 波多野结衣一区二区三区AV| 成年A级毛片| 国产91无码福利在线| 香蕉视频在线精品| 久久特级毛片| 成人亚洲视频| 日韩大乳视频中文字幕| 内射人妻无码色AV天堂| 日韩美毛片| 成人欧美日韩| 日本人又色又爽的视频| 丝袜久久剧情精品国产| 国产在线无码一区二区三区| 91青青视频| 她的性爱视频| 91久久夜色精品国产网站| 日韩色图区| 99视频在线免费观看| 日日拍夜夜嗷嗷叫国产| 91九色最新地址| 国产欧美高清| 8090午夜无码专区| 91欧美亚洲国产五月天| 国产欧美日韩综合在线第一| 国产精品第一区| 国产精品三级专区| 国产凹凸视频在线观看| 国产剧情一区二区| 国产精品美女在线| 国产精品观看视频免费完整版| 婷婷开心中文字幕| 国产成人精品在线1区| 久操中文在线| 日本一区二区三区精品视频| 久久香蕉欧美精品| 看国产毛片| 免费99精品国产自在现线| 狠狠ⅴ日韩v欧美v天堂| a亚洲视频| 欧美三级自拍| 超碰精品无码一区二区| 91探花在线观看国产最新| 久久人体视频| 成人精品免费视频| 最新国产成人剧情在线播放| 成年A级毛片| 天堂网国产| 99久久精品国产精品亚洲 | 国产人成午夜免费看| 免费一级大毛片a一观看不卡| 久草性视频| 综合色区亚洲熟妇在线| 日韩午夜伦| 97se亚洲综合在线韩国专区福利| 色屁屁一区二区三区视频国产| 中国国产A一级毛片| 國產尤物AV尤物在線觀看| 免费高清毛片| 久久黄色影院| 欧美不卡视频在线观看| 天天摸夜夜操| 日韩在线影院| 老司机久久99久久精品播放| 91福利免费视频| 久久国产精品麻豆系列| 香蕉eeww99国产精选播放| 日韩欧美国产精品| 真实国产乱子伦视频| 国产成人精品日本亚洲| 亚洲欧洲天堂色AV|