摘要:根據國際上最新提出的蛋白質結構預測問題的三維歐氏空間連續模型,找到了相應的物理模型,并且設計了適當的擬人策略,形成了相應的擬物擬人算法。
關鍵詞: 蛋白質結構預測; 蛋白質折疊; 擬物擬人算法; 彎曲勢能; 距離勢能
中圖分類號:TP301.6文獻標志碼:A
文章編號:1001-3695(2007)08-0045-03
0引言
蛋白質結構預測問題是當前國際上最具有理論研究和實際應用價值的問題之一。研究該問題的根本目的是根據人類自身發展的需要設計并制造出具有特定功能的人工合成蛋白質。
蛋白質分子在三維歐氏空間中的折疊決定了蛋白質的生物學功能。在20世紀50年代,K.A. Dill, C.B.Anfinsen等人[1~3]就發現了蛋白質的氨基酸序列對蛋白質的空間折疊構型產生重要影響。因此從理論上講,可以通過控制蛋白質的氨基酸序列來控制蛋白質分子的空間折疊構型,進而控制所設計制造出的蛋白質生物學功能。
天然的蛋白質是由20種不同的氨基酸組成的。為了簡化問題的研究,將這20種氨基酸分為兩大類,即親水氨基酸和疏水氨基酸。于是將蛋白質鏈看做是由親水氨基酸分子和疏水氨基酸分子構成的序列,本文從這里開始,首先將這個實際的分子生物學的問題轉換為一個純數學問題并為該數學問題找到了適當的物理解釋,然后設計相應的近似算法,從而可從計算機模擬的角度對蛋白質結構進行預測分析。
1蛋白質結構預測問題的數學描述
2.5初始格局的選取
筆者認為,在搜索空間中U的局部極小值是大量的。U的圖像如同很多山峰和深谷形成的起伏跌宕的峰壑圖。對于任意給定的初始格局X,它所對應的U值通常是在U的圖像的某個山谷谷壁上。由梯度下降法,U值能夠逐步下降到此山谷的谷底。由于此山谷很可能不是最深的山谷,到達谷底時所得到的U值也就不是U的最小值,并且在谷底時,梯度下降法不能再使U值發生任何變化。這樣,就要設法讓U值從這個谷底跳出去尋找U的更小值,亦即采用所謂的跳坑策略跳出這個山谷。當然,筆者期望的是U值從這個山谷的谷底跳出去后能夠正好落在一個最深的山谷中,那么由梯度下降法很快就可以得到U的最小值。由于U的局部極小值很多,這種期望能夠實現的可能性是極小的。在計算過程中就出現了落入“陷阱”、跳出“陷阱”反復不斷的現象。
倘若開始時,初始格局X的給定就使得其所對應的U值就在U的圖像的一個最深的山谷谷壁上,那么不需要跳坑,僅由一輪梯度下降法的計算即可得到U的最小值。由此可見,初始格局X的選取對于問題的解決是至關重要的。
基于這樣的考慮,本文按如下方法選取初始格局:
圖2是一個由六個棱長為1的正方體構成的長方體。其中有13個格點分別被黑色圓圈和白色圓圈所占據。黑白圓圈分別表示黑白球球心的空間位置,并且編號相鄰的兩圓圈的距離為1。
由此初始格局用擬物算法進行計算得到的值為-4.973 8,該值比文獻[4]中對于此例計算的結果-4.961 6小。
對于鏈長n>13的黑白球鏈,其初始格局的選取是這樣形成的:因為鏈長為n的黑白球鏈lt是由兩個鏈長分別為k和m的黑白球鏈lr和ls拼接而成的(n=k+m),它的前一段是鏈長為k的黑白球鏈lr,后一段是鏈長為m的黑白球鏈ls。若按照黑白球鏈ls 的某一個初始格局進行擬物計算,得到的總勢能值比文獻[4]中黑白球鏈ls 的總勢能值小,表明對黑白球鏈ls 的初始格局設置得好。根據繼承性的思想,將黑白球鏈ls的初始格局記錄下來,且將黑白球鏈lt中后一段的m個球按照黑白球鏈ls被記錄下來的好的初始格局的位置放置。設這一格局中所有黑球球心的中心為p,那么lt中剩下的前一段lr的k個球在滿足鏈條件(相鄰兩球球心間的距離為1)的前提下,將黑球的球心放置在離p最近的格點上,白球的球心放置在離p最遠的格點上。
具體說來,對于鏈長為21的黑白球鏈,將其后一段即編號為9,10,…,21的13個球按照鏈長為13的黑白球鏈的初始格局的位置放置,如圖3所示。
從表1中可以看出,本文得到的總勢能值均比文獻[4]中計算所得到的總勢能值小,并且鏈長越長效果越明顯。這表明所設計的算法對于求解該問題是有效的。
參考文獻:
[1]LAU K F, DILL K A. A lattice statistical mechanics model of the conformation and sequence spaces proteins[J].Macromolecules, 1989,22:3986-3997.
[2]ANFINSEN C. Principles that govern the folding of protein chain[J].Science, 1973,181(96):223-230.
[3]DILL K A. Dominant forces in protein folding[J]. Biochemistry, 1970,29(31):7133-7155.
[4]HSU H P, MEHRA V, GRASSBERGER P.Structure optimization in an offlattice protein model[J].Physical Review E,2003,68(3).
[5]WANG Huaiqing, HUANG Wenqi, ZHANG Quan. An improved algorithm for the packing of unequal circles within a
larger containin circle[J].European Journal of Operational Research, 2002,141(2):440-453.
[6]HUANG Wenqi, KANG Yan. A heuristic quasiphysical strategy for solving disks packing problem[J].Simulation Modeling Practice and Theory,2002,10:195-207.
[7]黃文奇,詹叔浩.求解packing問題的擬物方法[J]. 應用數學學報,1979,2(2):176-180.
[8]黃文奇,許如初.近世計算理論導引——NP難度問題的背景,前景及其求解算法研究[M].北京:科學出版社,2004:59-60.
注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”