




摘 要:針對教與學優化算法(teaching-learning-based optimization,TLBO)尋優精度低、易陷入局部最優的問題,提出了一種融合認知心理學理論的新型教與學優化算法(cognitive psychology teaching-learning-based optimization,CPTLBO)。在教階段融入登門檻效應理論,對于學習有困難的學生設置階段性學習目標,從而提高學生的整體水平;在學階段加入老師引導機制,提高算法收斂速度;隨后,加入自我調整階段,學生根據心理控制源理論可被分為內控型和外控型,不同類型的學生對自身成績采取不同的歸因方式并采取相應措施。利用經典的基準測試函數對CPTLBO進行測驗,結果表明改進算法在尋優精度和收斂速度方面具有優勢。構建CPTLBO-ELM自來水供水量預測模型,采用CPTLBO算法優化極端學習機的輸入權值和隱含層閾值參數,以提高模型的預測精度和泛化能力。仿真結果表明:用CPTLBO算法優化后的模型預測結果更準確。
關鍵詞:教與學優化算法; 認知心理學; 登門檻效應; 心理控制源理論
中圖分類號:TP18 文獻標志碼:A
文章編號:1001-3695(2022)03-024-0785-05
doi:10.19734/j.issn.1001-3695.2021.08.0324
基金項目:教育部人文社會科學研究青年基金資助項目(21YJC620087);上海市“科技創新行動計劃”軟科學研究重點項目(18692110500);上海市哲學社會科學規劃課題(2019BGL014);上海市高原科學建設項目(第2期);上海理工大學科技發展資助項目(2020KJFZ040)
作者簡介:何佩苑(1997-),女,江蘇溧陽人,碩士研究生,主要研究方向為智能優化和系統工程;劉勇(1982-),男(通信作者),江蘇金湖人,副教授,碩導,博士(后),主要研究方向為智能優化、服務網絡設計與優化和系統工程(liuyong.seu@163.com).
New teaching-learning-based optimization algorithm with cognitive psychology theory and its application
He Peiyuan, Liu Yong?
(Business School, University of Shanghai for Science amp; Technology, Shanghai 200093, China)
Abstract:Aiming at the problem of low accuracy of TLBO and easy falling into local optima, the paper proposed a new TLBO algorithm integrating cognitive psychology theory. Incorporating the theory of foot in the door effect in the teaching stage, it could set the periodic learning goals for students with learning difficulties, so as to improve the overall level of students. Adding teacher guidance mechanism in the learning stage was good for increasing the speed of algorithm convergence. There was a self-adjustment stage after learning stage. According to psychological locus of control theory, it divided students into internal control type and external control type. Different types of students adopt different attribution methods for their own performance and took corresponding measures. Using the classic benchmark function to test CPTLBO, the results show that the improved algorithm has advantages in optimization accuracy and convergence speed. Constructing the CPTLBO-ELM tap water supply prediction model and using CPTLBO algorithm to optimize the input weights and hidden layer threshold parameters of the extreme learning machine, so as to improve the prediction accuracy and generalization ability of the model. The simulation results show that it is more accurate for the model which is optimized by CPTLBO algorithm.
Key words:teaching-learning-based optimization algorithm; cognitive psychology; threshold effect; locus of control theory
0 引言
智能優化算法是受生物、自然規律或人類社會性行為的啟發,模擬其規律而設計求解問題的方法。與傳統優化方法不同,智能優化算法可以用來解決復雜的組合優化問題[1]。由于智能優化算法具有較強的通用性且可進行并行運算,目前已經廣泛地應用于生產調度、系統控制、人工智能等領域。
教與學優化算法是由Rao等人[2]提出的具有代表性的智能算法之一,該算法通過模擬現實生活中的教學過程來求解優化問題。與其他智能優化算法相比,教與學優化算法具有初始參數少、結構簡單的優點,在求解參數復雜的優化問題中表現優異。然而TLBO存在收斂精度較低和速度較慢的問題,為此,學者不斷提出TLBO的改進算法。根據對TLBO改進的階段不同,將改進方法分為以下幾類。首先是對初始化階段的改進。一般情況下,好的初始化方法可以生成更好的初始個體,進而獲得更好的結果[3]。Shao等人[4]結合改進的NEH啟發式方法和反向學習方法來生成初始化入口,使得初始化后的種群質量更高;Roy等人[5]隨機生成種群,并根據OBL生成相對的種群,然后從這兩個種群中選擇最適合的個體作為初始群體。一些學者考慮到個體的搜索空間在算法早期和后期的大小不同,因而加入自適應因子來控制搜索區域。李麗榮等人[6]在教階段引入自適應變化因子,前期向最優個體學習,后期能夠較好地維持自身狀態,從而保持種群的多樣性。為增強教與學算法的收斂性與求解精度,一些學者致力于設計TLBO的更新機制。其設計思路主要有結合其他算法、加入新的階段、分組學習等。黎延海等人[7]在將和聲搜索算法與教與學優化算法相結合,增強了算法的求解精度;Chen等人[8]引入局部學習機制和自適應學習機制,以提高算法的全局搜索能力;童楠等人[9]加入了教師反思與學生反思行為,進一步提高學生的知識技能。以上改進方法都在一定程度上提高了TLBO的性能,但觀察各個改進算法的結果,發現其收斂性還有一定的提升空間,尤其在算法求解高維復雜問題時容易出現運算精度低、搜索速度慢等問題。
為進一步優化TLBO的性能,本文從認知心理學角度[10]出發,提出了一種融合認知心理學理論的新型教與學優化算法,該算法在改進過程中考慮人的心理因素,使算法設計更加貼近現實。由于人的心理在不同環境中容易發生變化,且面對同一環境時也會產生不同的心理,心理的改變很有可能會導致行為的改變,所以在算法改進中考慮人的心理因素顯得尤為重要。通過一系列測試函數驗證算法的性能,發現改進后的算法在收斂速度和求解精度上都有較好的表現。該改進方法具有一定的合理性與創新性。整理發現,在改進TLBO中考慮心理學理論的相關研究較少,相比于其他改進方法,考慮人的心理因素會使得算法改進更加靈活,算法可以更好地分配全局勘探和局部搜索所占的比重。
1 教與學優化算法
基本的教與學優化算法,分為教和學兩個階段。班級中的學生數量為種群大小,記為N;學生學習的科目數量為個體的維度,記為D;學生個體表示為Xi={Xi1,Xi2,…,XiD};學生的學習成績對應算法中個體的適應度值,記為f(Xi),對于最小化問題,求解出的適應度值越小,表明該學生成績越優異。
1.1 教階段
在班級初始化后,計算每一個學生的適應度值,選出適應度值最好的學生作為老師,記為Xtea,老師將知識傳播給學生,以提高班級的平均狀態。班級平均狀態由式(1)給出。
在教階段,每個學生的更新方式如下:
其中:Xi,new為學生Xi更新后的狀態;rand為[0,1]中的隨機數;TF為教學因子,表示教師對于班級平均狀態的影響程度,一般取0或1。計算更新后學生適應度值,記為f(Xi,new),若f(Xi,new)lt;f(Xi),則用Xi,new替代Xi。
1.2 學階段
學階段是學生之間相互學習的階段,學生隨機選取一名同學Xc,比較學習成績,選出較為優秀的學生引導另一個學生學習,如式(3)所示。
其中:randi為隨機數,每次更新都將隨機生成[0,1]之間的數。
2 融合認知心理學理論的新型教與學優化算法
2.1 引入登門檻效應理論改進教階段
在教學過程中講究循序漸進,教師為學生制定階段性目標,使其穩中求進。若對學習有困難的學生制定較高的目標,不但會增加學生的心理壓力,而且容易讓目標流于形式。這一現象在社會心理學中被稱為登門檻效應。這個效應是美國社會心理學家弗里德曼與費雷瑟于1966年提出的[11],受此啟發,對算法進行如下改進:以班級平均成績為基準,將學生分為兩個部分。對于成績低于班級平均的學生群體,為提高其整體水平,重點在于成績差的學生需要縮小與班級平均的差距,考慮其基礎薄弱,先定下向班級平均分靠攏的階段性目標。引入自適應權重ω1如式(4)所示。
其中:t為當前迭代次數;iterMax為總迭代次數;ω1用來控制在不同迭代次數時向班級平均靠攏所占的比重。在算法迭代初期,ω1的值接近1,學習困難的學生主要目標是向班級平均靠攏。隨著迭代次數的增多,學生整體水平逐漸提高,ω1變小,學生提高學習目標向班級最優學習,從而更快地向最優靠近。具體更新方式為
其中:η表示每次更新,保留上一個狀態的程度;Xworst為班級中成績最差的學生。對于成績高于班級平均的學生群體,依照現實情況,教師容易對成績好的學生有更高的期望,承受期望的學生會采取措施主動學習。這一現象符合社會心理學中的期望效應理論[12],結合該理論對優秀學生采取教師一對一教學和向其他學生學習的策略,如式(6)所示。
其中:Xr1和Xr2分別為班級中任意兩個學生的狀態。從式(6)可以看出:優秀學生依據自身狀態、老師一對一輔導和吸收同學學習經驗三個部分進行更新。
2.2 引入教師引導改進學階段
在現實生活中,學生在討論和交流的過程中會有教師參與。教師在討論后期會參與交流,引導學生緊扣主題,以免出現討論偏離的情況。引入自適應更新因子ω3決定在學階段教師參與討論的程度。在算法迭代初期ω3接近0,老師參與較少,隨著迭代次數增加,ω3接近1,老師占比增大,這樣可以較好地把控班級學生的討論狀態,使得班級整體朝著較優的方向發展。改進的學階段具體更新方式如式(8)所示。
其中:Xj為隨機選中的學生;tf為比例因子,用來降低上一時刻自身狀態的影響;rand1和rand2為兩個0~1的隨機數;經過多次實驗得出將tf的值設置為0.3時,算法的運行結果最好。
2.3 結合心理控制源理論設計自我調整階段
在學階段后設計自我調整階段,讓學生對自身成績進行歸因,并及時作出調整。心理學家Rotter對歸因方式進行研究,提出了心理控制源理論。根據不同的態度把個體分為內控型和外控型兩部分 [13]。對于成績不理想的學生,內控型的學生傾向于積極采取措施,改變現狀從而獲得滿意的成績;外控型的學生認為成績不理想是外界因素決定的,自身難以控制,因而會保持原有狀態或進行微小變動。在算法設計中,計算平均分以上的學生的成績平均值,記為優秀集體平均值Agv_excellent。根據Agv_excellent和班級平均值Mean把學生分為三個部分:高于Agv_excellent的學生繼續保持原有的學習方式;低于Agv_excellent且高于Mean的學生學習方式存在輕微問題,采取微調策略;低于Mean的學生說明學習方式存在較大問題,考慮到這部分學生受到的強化力度較大,內控型和外控型的學生在處理問題時容易表現出較大的差異,在算法設計時將他們分開考慮,具體更新方式如式(9)所示。
其中:ω(i)為隨機數,其值為0或1,模擬內控型(為0)與外控型(為1)學生;Xmini與Xmaxi分別為學生Xi的上下界;θ為(-1,1)之間的隨機數。
2.4 融合認知心理學理論的新型教與學優化算法流程
將社會心理學中登門檻效應、期望效應理論加入到教與學優化算法中,依據理論改進教階段,在學階段中引入教師引導機制,同時結合心理控制源理論加入自我調整階段就構成了新型教與學優化算法。以最小優化問題為例,CPTLBO算法基本流程如下。
算法1 融合認知心理學理論的新型教與學優化算法
輸入:種群規模N,最大迭代次數iterMax,適應度函數f。
輸出:全局最優解X*={x1,x2,…,xd}。
隨機生成全體學生{X1,X2,…,XN},計算每個學生的適應度值進行比較,計算出班級平均適應度值記為Avg_f(X),并選出適應度值最小的個體作為教師。
while (tlt;iterMax)
進入教階段:根據班級平均適應度值Avg_f(X)將學生分為優秀學生和學習困難學生兩個群體;優秀學生按式(6)學習,學習困難的學生按式(5)學習,計算更新學生的適應度值f(Xi,new)并與更新前f(Xi)比較,若滿足f(Xi,new)lt;f(Xi),則Xi,new替代Xi;
進入學階段:對于任意學生Xi選擇一名學生Xi,比較兩人的適應度值,向優秀的一方學習,同時加入教師引導策略,按式(8)進行更新,如果f(Xi,new)lt;f(Xi),則替代;
進入自我調整階段:計算當前班級的適應度平均值Mean,計算適應度值在班級平均之上的學生的平均值Agv_excellent;將學生分為三組采取不同方式學習,按式(9)更新狀態;計算新狀態適應度值,若優于舊狀態,則替換;
計算當前狀態下班級的平均值,更新Avg_f(X);
在所有學生中找到最優秀的學生,任命其為教師Xtea;
if f(X*)gt;f(Xtea)
X*=Xtea
end if
iter=iter+1
end while
輸出X*
3 數值實驗和結果分析
3.1 實驗環境與參數
仿真計算所使用環境為:計算機為聯想MP1M7ST0,CPU為第八代Intel酷睿i7-8568U,內存RAM為16 GB,操作系統為Windows 10,編程軟件為MATLAB 2018a。為驗證改進算法CPTLBO的性能,選取教與學優化算法[2]、多學習教與學優化算法(multi-learning teaching-learning-based optimization,MLTLBO)[14]、改進的教與學優化算法(improved teaching-learning-based optimization,ITLBO)[15]、粒子群算法(particle swarm optimization,PSO)[16]、頭腦風暴[17](brain storm optimization,BSO)算法與改進算法在相同環境下進行對比。表1、2分別給出了用于仿真實驗的七個低維測試函數和八個高維測試函數的表達式以及理論最優值。其中,五個算法的共同參數設置如下:最大適應度評價次數為15 000;種群數量為50;最大迭代次數為300;高維測試函數的維度為100。參考現有論文的參數設置,對于PSO中的學習因子c1=c2=1.5,慣性權重ω=0.8;BSO中概率參數分別為P0=0.2,P1=0.8,Pa=0.8,Pb=0.8。
3.2 實驗結果分析
采用表1、2中共15個測試函數對五種算法進行20次獨立測試,分別得到平均值、標準差、最劣值和最優值,如表3、4所示。
從表3、4可以看出,無論在低維還是高維測試函數,CPTLBO算法的所有評價指標都優于其他四種算法。當維度為2時,CPTLBO算法的運算精度高于其他算法,其中,求解低維測試函數f5得到最優值0。當維數變為100時,需要考驗算法跳出局部最優的能力。由表4可知,CPTLBO求解結果最接近函數最優值,求解精度也最高。對于高維測試函數f6,只有CPTLBO搜索到最優值0。
為了更直觀地展示CPTLBO算法的優化精度和收斂速度,圖1展示了低維測試函數和高維測試函數的收斂曲線。其中圖1(a)和(b)為低維測試函數收斂曲線,(c)和(d)為高維測試函數收斂曲線。縱坐標取以10為底的對數,橫坐標為迭代次數。收斂曲線下降越快,說明算法收斂速度越快,由圖可知CPTLBO算法收斂最快。
CPTLBO算法性能明顯優于MLTLBO算法,這得益于在算法改進中融合了認知心理學理論。教階段中引入登門檻效應如式(5),使得算法按照特定搜索機制,先全局搜索,再局部搜索,不僅增強了勘探能力,還加快了收斂速度;在學階段加入教師引導,避免出現算法難以收斂的情況;在自我調整階段加入心理控制源理論,有效平衡算法的全局搜索與局部搜索,不同學生采用不同方法學習有助于產生更多新解,維持解的多樣性。
4 算例分析
本文將CPTLBO優化極限學習機(ELM)算法,并應用于自來水供水量預測。
4.1 預測模型
極限學習機(extreme learning machine,ELM)是一類基于前饋神經網絡的機器學習算法。ELM模型優勢在于可任意設置隱含層節點數、學習速度快、泛化能力強等。然而輸入權重和隱藏閾值對ELM模型的預測性能具有一定影響,實際應用中往往因缺乏經驗而隨機生成權重和閾值,從而引起預測不精確的問題。
為進一步優化供水量預測模型,利用CPTLBO對ELM模型的輸入權重和隱藏層閾值進行優化選擇,獲得最佳模型參數后再進行預測。模型的核心思想是:將供水樣本數據作為CPTLBO-ELM的輸入值,該模型輸出供水預測值,將預測值與真實值進行對比。CPTLBO通過預測誤差來調整ELM模型參數,直到滿足終止條件為止,具體流程如圖2所示。
4.2 結果分析
為檢驗本文提出的CPTLBO-ELM預測模型的性能,按上述預測流程,與原始ELM、PSO-ELM、TLBO-ELM和MLTLBO-ELM算法進行對照實驗。經過對供水量數據進行預處理后,得到2 000個樣本,其中前1 900個樣本作為訓練集,后100個樣本作為測試集(樣本數據部分展示如表5所示,其中T-1與T-2分別為生活用水和生產用水的漲跌百分比)。各模型預測誤差對比如圖3所示。
由圖3可知,相較于原始ELM預測模型,加入智能優化算法優化權重后的模型性能明顯提高;將CPTLBO算法的優化結果與PSO、TLBO、MLTLBO優化結果對比,預測精度有一定提升,表明CPTLBO算法在尋找最優參數方面具有更強的能力。表6對比了不同測試方法的預測誤差。表中數據是由真實值減去預測值取絕對值后得到的數據,對比表中數據可以發現,用CPTLBO算法優化ELM后得到的預測結果更為精確。為了更直觀地感受模型的性能,表7展示了各個模型的多種評價指標。
5 結束語
本文提出了一種融合認知心理學理論的新型教與學優化算法(CPTLBO)。首先結合登門檻效應理論,在教階段為學習能力較弱的學生設置階段性學習目標,使其學習能力穩步提升;在學階段設置教師引導機制,提升算法收斂性能;在學階段后加入自我調整階段,依據心理控制源理論理論,將學生分為內控型和外控型,不同類型的學生采取不同的行為進行調整。利用經典的基準測試函數驗證了CPTLBO算法的有效性,將改進的算法用于自來水供水量預測問題的求解,同樣獲得了滿意的結果。后續的研究將繼續結合心理學探究離散的教與學優化算法的改進機制,進而解決一些實際問題。
參考文獻:
[1]于坤杰,王昕,王振雷.基于反饋的精英教學優化算法[J].自動化學報,2014,40(9):1976-1983. (Yu Kunjie, Wang Xin, Wang Zhenlei. Elitist teaching-learning-based optimization algorithm based on feedback[J].Acta Automatica Sinica,2014,40(9):1976-1983.)
[2]Rao R V, Patel V. Multi-objective optimization of heat exchangers using a modified teaching-learning-based optimization algorithm[J].Applied Mathematical Modelling,2013,37(3):1147-1162.
[3]Bajer D, Martinovic' G, Brest J. A population initialization method for evolutionary algorithms based on clustering and Cauchy deviates[J].Expert Systems with Applications,2016,60(10):294-310.
[4]Shao Weishi, Pi Dechang, Shao Zhongshi. An extended teaching-learning based optimization algorithm for solving no-wait flow shop scheduling problem[J].Applied Soft Computing,2017,61(1):193-210.
[5]Roy P K, Paul C, Sultana S. Oppositional teaching-learning-based optimization approach for combined heat and power dispatch[J].International Journal of Electrical Power amp; Energy Systems,2014,57(5):392-403.
[6]李麗榮,李木子,李崔燦,等.具有動態自適應學習機制的教與學優化算法[J].計算機工程與應用,2020,56(19):62-67.(Li Lirong, Li Muzi, Li Cuican, et al. Teaching amp; learning based optimization with dynamic self-adaptive learning[J].Computer Engineering and Applications,2020,56(19):62-67.)
[7]黎延海,拓守恒,雍龍泉.動態選擇策略的和聲教與學混合算法[J].計算機應用研究,2019,36(12):3679-3684.(Li Yanhai, Tuo Shouheng, Yong Longquan. Hybrid algorithm based on harmony search and teaching-learning-based optimization using dynamic selection strategies[J].Application Research of Computers,2019,36(12):3679-3684)
[8]Chen Debao, Zou Feng, Li Zheng, et al. An improved teaching-learning-based optimization algorithm for solving global optimization problem[J].Information Sciences,2015,297:171-190.
[9]童楠,符強,鐘才明.一種基于反思機制的教與學優化算法[J].計算機應用研究,2018,35(12):3678-3681.(Tong Nan, Fu Qiang, Zhong Caiming. Improved TLBO algorithm based on reflection mechanism[J].Application Research of Computers,2018,35(12):3678-3681.)
[10]周曉虹.現代社會心理學:多維視野中的社會行為研究[M].上海:上海人民出版社,1997:23-44.(Zhou Xiaohong. Modern social psychology: a study of social behavior from a multidimensional perspective[M].Shanghai:Shanghai Renmin Chubanshe,1997:23-44.
[11]Bartonicek A, Colombo M. Claw-in-the-door: pigeons, like humans, display the foot-in-the-door effect[J].Animal Cognition,2020,23(5):893-900.
[12]Chaves T C, Stanton T R, Grant A, et al. Imprecise visual feedback about hand location increases a classically conditioned pain expectancy effect[J].Journal of Pain,2021,22(6):748-741.
[13]王登峰.心理控制源的認知——知識系統理論[J].北京大學研究生學志,2017,6(3):103-107.(Wang Dengfeng.On the theory of cognition-knowledge system of the sources or psychological control[J].Graduate Records of Peking University,2017,6(3):103-107.)
[14]平良川,孫自強.教學優化算法的改進及應用[J].計算機工程與設計,2018,39(11):3531-3537.(Ping Liangchuan, Sun Ziqiang. Improvement and application of teaching and learning based optimization[J].Computer Engineer and Design,2018,39(11):3531-3537.)
[15]左智科,李一龍.改進的TLBO及其在自來水供水量預測中的應用[J].人民黃河,2021,43(2):84-87.(Zuo Zhike, Li Yilong. Improved TLBO and its application in tap water supply prediction[J].Yellow River,2021,43(2):84-87.)
[16]張鈺,王蕾,周紅標,等.基于競爭學習的粒子群優化算法設計及應用[J].計算機測量與控制,2021,29(8):182-189.(Zhang Yu, Wang Lei, Zhou Hongbiao, et al. Design and applications of particle swarm optimization based on competitive learning[J].Computer Measurement amp; Control,2021,29(8):182-189.)
[17]Liu Jianan, Peng Hu, Wu Zhijian, et al. Multi-strategy brain storm optimization algorithm with dynamic parameters adjustment[J].Applied Intelligence,2020,50(10):1289-1315.