王松華, 夏 師, 黎 勇
(百色學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院, 廣西 百色533000)
考慮如下無(wú)約束優(yōu)化問(wèn)題:
min{f(x)|x∈n},
(1)
其中:f:n→二次連續(xù)可微.非線性共軛梯度法是求解大規(guī)模無(wú)約束優(yōu)化問(wèn)題的一類重要方法, 其迭代公式為
xk+1=xk+αkdk,
(2)
d0=-g0,dk=-gk+βkdk-1,k≥1,
(3)
式中αk為步長(zhǎng)因子,dk為搜索方向,gk為梯度函數(shù)f(xk)的簡(jiǎn)記,βk為共軛參數(shù).經(jīng)典的共軛梯度法有FR(Fletcher-Reeves),PRP(Polak-Ribière-Polyak),HS(Hestenes-Stiefel),CD(Conjugate-Descent),DY(Dai-Yuan)和LS(Liu-Storey)算法等[1]. 研究表明,類共軛參數(shù)公式的分子為‖gk‖2(‖‖為歐氏范數(shù)), 這類算法在弱Wolfe-Powell線搜索條件下對(duì)一般函數(shù)全局收斂, 但數(shù)值結(jié)果并不理想; 而類共軛參數(shù)公式的分子為這類算法具有自動(dòng)重開始的性能, 可有效避免連續(xù)產(chǎn)生小步長(zhǎng), 數(shù)值結(jié)果較好, 但在弱Wolfe-Powell線搜索下算法的下降性不能保證.


(4)
基于充分下降性的條件, Hager等[6]在自調(diào)比BFGS方法(擬牛頓法)的基礎(chǔ)上提出了一種修正HS共軛梯度法, 稱為HZ(Hager-Zhang)共軛梯度法, 其共軛參數(shù)公式為

(5)

(6)
其中η>0.本文簡(jiǎn)稱該方法為HZb算法. HZb算法具有穩(wěn)定和有效的數(shù)值性能, 是目前數(shù)值結(jié)果性能最好的算法之一[7]. 之后, Hager等[8]又將HZ算法進(jìn)行推廣, 得到了與文獻(xiàn)[2]方法完全相似的理論結(jié)果, 本文簡(jiǎn)稱為HZp算法, 其共軛參數(shù)公式為

(7)
文獻(xiàn)[9-13]基于搜索方向滿足充分下降條件的理論方法, 給出了HZ算法的推廣及應(yīng)用.
文獻(xiàn)[14-16]對(duì)線搜索型非線性共軛梯度法的研究表明, 搜索方向具有信賴域性質(zhì), 對(duì)算法的全局收斂性分析有積極作用, 即搜索方向滿足下列條件:
‖dk‖≤c0‖gk‖, ?k∈,c0>0.
(8)
文獻(xiàn)[6,8-13]中的HZ算法及其推廣算法均滿足充分下降性條件, 但沒(méi)有信賴域性質(zhì). Yuan等[16]研究了一類新型非凸函數(shù)的共軛梯度法簇, 構(gòu)建了一組搜索方向公式自動(dòng)滿足條件(7),(8), 不僅有良好的收斂性質(zhì), 而且初步數(shù)值實(shí)驗(yàn)結(jié)果表明, 該算法比經(jīng)典PRP,HS,CD,FR,LS和DY等算法性能更好. 文獻(xiàn)[16]還給出了一種修正HZ搜索方向公式, 但未建立相應(yīng)的算法. 受文獻(xiàn)[6,8,14-16]工作的啟發(fā), 本文提出一類針對(duì)大規(guī)模無(wú)約束優(yōu)化問(wèn)題的修正HZ共軛梯度法, 并討論新算法的全局收斂性和R-線性收斂速度, 給出其數(shù)值性能分析.


(9)
本文采用弱Wolfe-Powell線搜索[17], 并聯(lián)合搜索方向式(9), 構(gòu)建新的修正HZ算法, 簡(jiǎn)稱為MHZ算法, 其步驟如下:
取初始點(diǎn)x0∈n, 常數(shù)令k∶=0.
1) 如果‖gk‖≤ε, 則停止;
2) 采用弱Wolfe-Powell(WWP)線搜索計(jì)算步長(zhǎng)αk, WWP線搜索公式為

(10)

(11)
3) 計(jì)算xk+1=xk+αkdk;
4) 如果‖gk+1‖≤ε, 則停止;
6) 計(jì)算修改后的搜索方向
7) 令k=k+1, 返回步驟2).
引理1如果搜索方向由MHZ算法給出, 則下式成立:

(12)

證畢.
引理2如果搜索方向由MHZ算法給出, 則下式成立:
‖dk+1‖≤(1+ρ0)‖gk+1‖, 0<ρ0<1.
(13)
證明: 當(dāng)k=0時(shí), 式(13)顯然成立.當(dāng)k≥1時(shí), 對(duì)式(9)兩邊取范數(shù), 可得
證畢.
引理1表明, MHZ算法的搜索方向不依賴任何線搜索, 滿足充分下降性; 引理2表明, MHZ算法的搜索方向具有信賴域性質(zhì).
假設(shè)11) 目標(biāo)函數(shù)f(x)二次連續(xù)可微, 有下界; 定義的水平集L0={x|f(x)≤f(x0)}有界.
2) 目標(biāo)函數(shù)f(x)的梯度gk是Lipschitz連續(xù)的, 即存在常數(shù)L>0, 使得下式成立:
‖g(x)-g(y)‖≤L‖x-y‖, ?x,y∈n.
(14)
結(jié)合引理1、 引理2和假設(shè)1, 下面證明MHZ算法是全局收斂的, 所用方法類似文獻(xiàn)[16]中定理3.
定理1如果假設(shè)1成立, 序列{xk,dk,αk,gk}由MHZ算法給出, 則下式成立:

(15)
證明: 由式(10),(12), 可得
整理得
δαk(1-ρ0)‖gk‖2≤f(xk)-f(xk+1),
(16)
對(duì)不等式(16)從k=0到∞累加求和, 并結(jié)合假設(shè)1中1), 可得
即
αk‖gk‖2→0,k→∞.
(17)
由式(11),(13),(14), 可得
整理得

(18)
假設(shè)2若函數(shù)f(x)為二次連續(xù)可微一致凸函數(shù), 則對(duì)?x,d∈n, 存在SM≥sN>0, 使得下式成立:
sN‖d‖2≤dT2f(x)d≤SM‖d‖2,
假設(shè)1和假設(shè)2表明, 問(wèn)題(1)存在唯一解x*, 對(duì)?x∈n, 如下兩個(gè)不等式成立:

(19)
sN‖x-x*‖≤‖g(xk)‖≤SM‖x-x*‖.
(20)
定理2若假設(shè)2成立,x*是問(wèn)題(1)的唯一解, 則存在常數(shù)a>0,l0∈(0,1), 使得下式成立:

(21)
證明: 由式(4),(10), 再聯(lián)合式(19),(20), 可得

由式(19), 得

定理2表明, MHZ算法對(duì)一致凸函數(shù)具有R-線性收斂速度.
為檢驗(yàn)MHZ算法的有效性, 本文采用文獻(xiàn)[18]的40個(gè)非線性函數(shù)進(jìn)行數(shù)值實(shí)驗(yàn), 函數(shù)名稱列于表1. 將MHZ算法與HZ算法、 HZb算法、 HZp算法進(jìn)行對(duì)比分析. 數(shù)值實(shí)驗(yàn)中, 對(duì)應(yīng)的HZ算法、 HZb算法和HZp算法, 分別在MHZ算法中, 采用下式替換MHZ算法的步驟5)和步驟6)計(jì)算搜索方向dk+1, 其余步驟不變, 3類對(duì)比算法的搜索方向dk+1公式分別為

(23)

(24)

(25)
其中yk=gk+1-gk.

表1 測(cè)試函數(shù)名稱
數(shù)值實(shí)驗(yàn)采用MATLAB編寫程序并運(yùn)行. 計(jì)算機(jī)配置: Windows 10操作系統(tǒng), Intel(R)Xeon(R)CPU, E5507 @2.27 GHz, 內(nèi)存4.00 GB; 終止條件: ‖gk‖≤10-6或者迭代次數(shù)NI<800; 4種算法相應(yīng)的參數(shù)設(shè)置:δ=0.22,σ=0.93,ρ0=0.18,η=3,θ=1,ε=10-6; 維數(shù)為1 500,4 500,9 000,12 000; 主要針對(duì)4種算法的迭代次數(shù)NI、 函數(shù)值的計(jì)算次數(shù)NFG和實(shí)驗(yàn)運(yùn)行所需時(shí)間CPU這3個(gè)常用指標(biāo)進(jìn)行測(cè)試. 4種算法的數(shù)值實(shí)驗(yàn)結(jié)果列于表2.

表2 4種算法的數(shù)值實(shí)驗(yàn)結(jié)果

續(xù)表2

續(xù)表2

續(xù)表2
由表2可見, 4種算法均能解決所給定的測(cè)試問(wèn)題, MHZ算法比HZ算法、 HZb算法和HZp算法更有效. 下面采用Dolan等[19]的評(píng)價(jià)準(zhǔn)則, 對(duì)4種算法進(jìn)行綜合性能評(píng)估. 該評(píng)價(jià)準(zhǔn)則為: 曲線越靠上所對(duì)應(yīng)的算法越穩(wěn)定, 效果越好. 4種算法的迭代次數(shù)、函數(shù)值計(jì)算次數(shù)和CPU運(yùn)行時(shí)間的性能評(píng)估結(jié)果如圖1所示. 在計(jì)算精度一致的條件下, 由圖1(A),(B)可見, MHZ算法最優(yōu), 其次為HZb算法和HZp算法, 這3種算法均比HZ算法好, 充分說(shuō)明了這4類算法的性能發(fā)展趨勢(shì). 由圖1(C)可見, 4種算法CPU運(yùn)行時(shí)間較接近, MHZ算法總體結(jié)果較好, 這可能是因?yàn)楸疚膶?shí)驗(yàn)相關(guān)參數(shù)的取值對(duì)CPU運(yùn)行時(shí)間有一定影響.

圖1 4種算法的迭代次數(shù)(A)、 函數(shù)值計(jì)算次數(shù)(B)和CPU運(yùn)行時(shí)間(C)性能評(píng)估Fig.1 Performance evaluation of iteration numbers (A), calculation numbers of function value (B) and CPU runtime (C) for four algorithms
綜上所述, 本文基于文獻(xiàn)[16]的搜索方向, 利用弱Wolfe-Powell線搜索構(gòu)建了MHZ算法, 該算法具有如下優(yōu)點(diǎn): 1) 搜索方向具有充分下降性和信賴域性質(zhì); 2) 在常規(guī)假設(shè)條件下, 算法不僅對(duì)一般函數(shù)全局收斂, 在所給的條件下對(duì)一致凸函數(shù)具有R-線性收斂速度; 3) 數(shù)值實(shí)驗(yàn)結(jié)果表明, 在求解無(wú)約束優(yōu)化問(wèn)題上, MHZ算法比MZ算法、 HZb算法和HZp算法更有效.
吉林大學(xué)學(xué)報(bào)(理學(xué)版)2021年5期