湯雷翰, 趙 鴻, 劉宗華, 周 濤,汪秉宏
(1.北京計算科學研究中心,北京 100864;2.香港浸會大學物理系,九龍;3.廈門大學物理系,廈門 361005;4.華東師范大學物理系,上海 200062;5.電子科技大學互聯網科學中心,成都 610054;6.中國科學技術大學近代物理系,合肥 230026;7.上海理工大學復雜系統科學中心,上海 200093)
復雜系統結構及動力學現象的統計物理研究
湯雷翰1,2, 趙 鴻3, 劉宗華4, 周 濤5,汪秉宏6,7
(1.北京計算科學研究中心,北京 100864;2.香港浸會大學物理系,九龍;3.廈門大學物理系,廈門 361005;4.華東師范大學物理系,上海 200062;5.電子科技大學互聯網科學中心,成都 610054;6.中國科學技術大學近代物理系,合肥 230026;7.上海理工大學復雜系統科學中心,上海 200093)
近年來生物學、信息學和社會科學海量數據的積累,推動了各類定量分析手段的發展.統計力學作為聯系多體系統微觀與宏觀描述的數學理論,在復雜性科學的發展歷程中正發揮著作用.本文結合復雜網絡和非平衡態系統的若干研究成果,對統計物理方法在復雜現象的描述、主要變量及其相互依賴關系的確定、模型的提出與分析、及普適性規律的發現等方面的進展作一簡單介紹,并探討統計物理學與相應學科深層次交叉所面臨的機遇和挑戰.
復雜系統;統計物理;多層次結構與動力學;海量數據分析與建模
現代人生活的自然和社會環境在任何意義下都會被劃分為一個或者多個相互纏繞的復雜系統.永不停息的技術進步帶來了龐大并不斷細化的社會分工,信息革命又將個體的活動通過多條通訊渠道關聯起來,資本市場和政府的宏觀調控影響著大小公司的運作和行業的興衰,而某個農場的偶然一次病毒基因突變卻可以通過使用現代交通工具的人體傳遍地球的每個角落,威脅整個人類的生存.如此龐大復雜的系統,不斷地翻騰變化,吐故納新,何是因?何是果?可否駕馭?規則如何設定?成效如何評估?危機能否避免?這些問題的研究,已不僅僅屬于興趣和好奇心驅動的學術與認知范疇,而可影響人類社會的未來發展.
伴隨著以上提到的技術進步與社會結構的不斷復雜化,人類采集數據、觀察現象的能力飛速提升.以互聯網為標志的信息革命的到來,為大規模數據的記錄、儲存和分享提供了前所未有的便利.大量高精度數據的涌現,為我們定量分析系統的內在關聯、尋找各類變量間的相互依賴關系、確定系統行為如何受外界因素影響等性質提供了可能.自然科學與人文科學的交融,正將此可能逐步轉變為現實,為復雜性科學這一被譽為21世紀的科學的興起帶來了無限生機.
復雜性科學從根本上來說還是一個非常年輕的學科.復雜系統研究的第一個全球范圍的浪潮可追溯到上世紀七八十年代,那時候一批有代表性的理論體系得以建立,其中有些思想從上世紀60年代就開始萌芽,有些成果的影響力一直持續到現在.這些有代表性的理論體系包括:突變論、微循環論、耗散結構理論、協同學、涌現學說等.那個時候的一個主要趨勢是尋找構建適合于一切復雜系統的普適理論——往往不是從現象,而是從類似第一性原理出發,構建理論體系.很多重要的理論成果,特別是耗散結構理論和涌現學說,現在依然具有相當強的生命力和廣泛的影響力.與此同時,我們也注意到,這些學說希冀成為復雜系統普適理論的目標,可以說沒有實現.總結起來,由于當時的研究對象主要是均勻驅動的物理化學系統,動力學相對簡單,呈現的時空結構有其特殊性,因此所構建的理論體系的適用范圍有它的局限性,與其它系統和理論體系的互補性和一致性也沒有仔細和嚴謹的評估,在一些關鍵問題的把握上便不可避免地出現偏差.
21世紀初的復雜系統研究則呈現了完全不同于上一個世紀的態勢.很多年輕學者不再投入建立具有普適價值的理論體系,而是從海量數據出發,首先積累現象和統計規律,然后建立模型去解釋這些現象和規律.相當一部分研究只停留在現象或者粗糙的規律層面,另外一部分研究上升到具體理論模型的層面,很少有研究關注完整理論體系的建立.當然,有些學者已經認識到了建立基礎理論的重要性,譬如Ginestra Bianconi一直致力于網絡系綜的討論,在更大的參數空間上分析網絡結構和功能的關系,以期找到一般性的規律.
對于一個年輕又充滿活力的學科來說,螺旋式的發展模式有它的必然性.回顧物理學的發展,基本概念和方法論的建立往往需要經過一個漫長的迭代過程.對研究的問題做出清晰界定需要實驗觀察和數據積累到一定水平,相應的理論框架的建立也需要經過多方面的嘗試、比較和優化.簡化模型的提出和分析,有助于核心問題的提煉和更有針對性的實驗的設計和開展,從而加快研究進程.在包含大量變量和復雜動力學的系統的研究中,統計物理學可以為模型的分析提供嚴格和系統的方法,建立系統微觀和宏觀性質之間的聯系.通過對模型的定量分析,研究者可以深入了解并重新審視研究對象,推測系統隨著參數的變化可能出現的改變并加以實驗驗證,同時也可以在拓廣的參數空間里分析比較系統的性質和行為.模型研究的另一個功能是通過對模型的數學處理和變換,將在不同背景下提出的問題聯系起來,起到相互啟發和借鑒的作用.這是新觀點和新方法乃至普適理論提出的一個重要源泉.
近十年來,統計物理學的基本思想、理論、方法和概念在復雜現象的研究中已經有了廣泛的滲透.舉例來說,人類行為和經濟波動中的異常檢測,以及信息系統中關聯程度的刻畫,都可根植于相應的統計系統;社會系統中恐慌情緒的傳播、信息系統中某一謠言的大爆發,以及突發性的金融震蕩,都可以用相變與臨界現象理論加以近似刻畫;生物調控信號的傳輸,信息和社會系統中意見和信息的傳輸都可以在某種程度上抽象為具有相互作用的多體系統的傳播動力學.可以說,在近年來的生物信息學、人類動力學、復雜網絡等新興交叉學科方向的飛速發展過程中,統計物理學在新概念、新方法的提出等方面都發揮了積極作用.
統計物理學與復雜性科學的深度交叉,不僅為相應學科的發展提供了理論基礎和工具,同時也對本學科的發展開辟了眾多全新的課題,將過去對復雜性的抽象討論引向深入.與經典統計物理學所關注的均勻體系不同,現實世界中,如生物、工程和社會中的復雜系統表現出很多特殊的屬性,例如系統開放、受能量驅動處于非平衡態且不斷演化、結構化但不完全有序、具有記憶、適應甚至主動改變外部環境等功能.這類系統的復雜性突出表現在系統的多層次結構、寬廣和魯棒的響應特性、復雜的內在邏輯和復雜的動力學,在宏觀層次上具有多種功能,以適應外界和自身對其“處理問題能力”的要求.因此,功能的有效實現的相關機制在這類系統的研究中占有主導地位.
本文結合統計物理學在復雜系統研究中近年取得的進展,對相關的工作做一個簡單的回顧.討論按四個方面展開:a.低維和有限體系的非平衡態統計;b.復雜網絡的多層次動力學;c.信息挖掘的統計力學研究;d.生物系統海量數據的整理和建模.由于涉及的問題和研究內容非常廣泛,文獻量也十分巨大,本文的目的并不是對已有的工作進行系統的總結,而是希望通過代表性問題的陳述及相應研究方法和成果的比較,對領域目前的研究現狀加深認識,為制訂未來的研究目標和研究路線圖提供依據.
將低維和有限體系劃分為復雜系統,主要是由于其特有的熱漲落性質、對雜質的敏感性、及其呈現的各類非線性動力學特性.相對于其它復雜系統,它們相對簡單但具有較明確的物理背景.作為實現各類器件和生物功能的載體,此類系統在納米材料研究、細胞內分子過程的生物物理研究中占主導地位,實驗科學領域有大量的成果和知識積累,同時也為理論研究提出了實際而且迫切的科學問題.從上世紀80年代開始,制備和觀察手段的發展開辟了低維小尺度系統研究的新時代,除了微納顆粒、納米線、納米管、石墨烯等低維材料以外,自然界中的生物大分子以及血液循環和污水處理等領域涉及到的微納尺度流體等都屬于這一范圍.低維材料在光、電、熱、磁、聲及力學性能等方面往往表現出不同于塊體材料的性質,其動力學行為也由于小尺度而偏離平衡態系統特別是熱力學極限下已知的規律.在實際應用中,系統往往處于外界驅動的非平衡穩態下,其統計性質的描述也需要在非平衡統計物理的框架下開展[1-5].
平衡態系統由于滿足玻爾茲曼分布,其物理性質可以通過統計平均直接獲得.當系統處于非平衡態時,以上性質便不成立,目前因沒有一般的推導此類系統所處狀態的統計權重的方法,計算系統的各類特性便需從解動力學方程出發,這樣不僅計算量大大增加,統計物理學眾多強有力的計算統計平均的嚴格或近似的方法也都沒有了用武之地.因此,如何有效地計算非平衡態的統計分布函數便是非平衡統計研究最核心的問題.雖然這個問題遠遠沒有解決,但近十幾年來,以漲落定理(fluctuation theorems)和大偏差理論(large deviations theory)為代表的理論工作卻在回答這個問題的進程中開啟了可喜的大門.在與實驗研究的結合方面,理論的進展為低維材料的熱傳導,熱擴散,能量傳輸的不對稱現象,低維系統中微粒物質的熱遷移,微納米尺度流體,分子馬達等課題的實驗和數值模擬研究提供了有力的支撐.
以Jarzynski等式為例,自1997年此等式被提出以來,其研究進展非常迅速[6-11].我們知道如果使某個統計物理系統的某個參數在兩個給定值間轉變,通常將經歷一個非平衡態過程.Jarzynski等式表明,在此過程中對系統所做的功,取決于當系統處在兩個不同系統參數下的平衡態(溫度相同)的自由能之差.這是關于非平衡態過程少有的具有一般意義的嚴格結果之一,也在RNA的單分子折疊拉伸等實驗中得以應用.后續理論工作包括Crooks的漲落定理,量子系統中的Jarzynski等式及其推廣等.Jarzynski等式的討論也為發展全新的平衡態及平衡態之間過渡的計算方法提供了啟示.
已低維系統熱傳導的研究,早在上世紀六七十年代就開始了,最近20年來對各類模型中出現的非線性激發的細致分析,使得人們對傅立葉熱傳導定律在低維系統中的適用性有了深層次的了解,認識到了動量守恒或平移不變性在決定低維系統熱傳導規律方面的重要角色,并且提出了熱傳導規律對空間維數依賴關系的猜測[12-26].低維熱傳導研究目前存在幾個焦點.
a.反常熱傳導的微觀機制是什么?1998年胡斑比、李保文、趙鴻提出了動量守恒導致低維系統反常熱傳導的觀點.目前已經清楚,盡管這一原則具有一定的普遍性,但是也存在個別反例,因此反常熱傳導的存在需要進一步探尋更基本、更深層次的微觀機理.
b.低維系統熱傳導規律對于系統空間維度的依賴關系如何?一些理論猜測認為具有平移不變性的系統熱傳導系數隨著系統尺寸冪指數發散(一維),對數發散(二維),保持不變(三維).這一結果意味著雖然低維系統具有反常熱傳導,三維材料則仍然遵從傅立葉熱傳導定律.圍繞這一猜測展開了一系列的數值檢驗乃至實驗驗證,目前基本認可了這一結論,同時對于具體的依賴方式仍然存在爭論.
c.反常熱傳導和反常擴散之間的關聯.正如昂薩格倒易關系建立了不同非平衡態物理過程系數之間的聯系,一些研究者試圖建立反常熱傳導發散系數和反常能量擴散發散系數之間的普適性聯系并且提出了兩個不同的公式.但是,這兩個公式的正確性仍然處在質疑之中.
d.反常熱傳導和反常能量擴散的微觀機制的探討.這方面的爭論更加激烈,例如趙鴻等在研究了非線性一維晶格中孤波-孤波、孤波-聲子,聲子-聲子散射的定性定量規律的基礎上,通過對有限溫度晶格中能量漲落時空關聯行為的研究,提出一維晶格中的反常熱傳導和反常能量擴散是由于孤波的特殊動力學屬性造成的[16-17],而李保文等則以有效聲子方法(Bogoliubov變換)為出發點討論這一問題,認為有限溫度下只存在有效聲子,并且認為有效聲子能給出某些宏觀量對溫度依賴規律的更準確預測[18].
e.低維材料熱傳導性質的實驗測量.由于實驗技術的發展,納米線、納米管的熱傳導,包括與尺寸的依賴關系,已經有了一些測量工作[19],二維材料石墨烯的熱傳導實驗也已經初步開始[20].
在低維和有限系統的討論中,反常統計特性,肥尾冪指數分布,自相似分形結構,奇異高次統計矩等,都是常見的特征.這些特異現象的研究,不僅為深入發展非平衡統計物理和非廣延統計物理提供了依據,而且可以為統計物理復雜系統的其他課題提供理論參考、研究方法和工具.
時空系統中的自組織現象及其產生的各種規則和不規則的結構長久以來一直是非平衡統計物理學所關注的問題之一.以往的研究集中于以格點模型為代表的空間均勻系統,而經復雜網絡定義的單元間相互作用的系統近十幾年來成為研究熱點,大量的研究成果極大地豐富了動力學系統現象學的知識,為統計物理學向其他學科的滲透提供了大量有價值的參照模型.以下就復雜網絡上的動力學研究近年來在描述人類行為和各類社會經濟系統的統計特性和演化規律、大腦神經元系統同步現象的定量刻畫等方面所取得的進展做一簡述.
人類行為具有高度的復雜性.針對人類行為統計特性的研究起始于2005年Barabasi在《Nature》雜志上發表的針對人類行為時間特性的開創性的工作[27]和2006年Brockmann等發表在《Nature》雜志上的針對空間特性的工作[28].從2005年算起,人類動力學的研究,僅在《Nature》,《Science》,《PNAS》,《Nature Physics》,《Physical Review Letters》,《PLoSONE》等有廣泛影響力的期刊上,就發表了超過50篇研究論文,涉及人類時空行為實證分析、理論模型和具體應用等方面,已經成為復雜性科學領域的一個重要新興領域.研究的內容涉及人類行為對社會系統形成、社會的結構和發展的效應等,在傳染病傳播、城市交通、社會安全、國民經濟發展等重大民生課題的科學探討中也取得了若干初步成果,深化了人們對問題背后各種因數間相互影響和博弈的認識.
流行病的傳播及爆發幾率與其載體——人群的流動和接觸模式有密切關聯.傳統上,流行病的研究主要是假定感染個體與健康個體是均勻混合的,流行病的傳播是通過平均場來進行的.這種做法與真實發生的過程顯然有相當大的距離,比如人類活動是通過交通工具進行的,而且具有其自身的獨特特征如社區性、旅行目的性及對場所的時間段占據特性等.考察真實的流行病傳播過程如薩斯的傳播,人們發現其傳播軌跡并不是從一個區域逐漸向外傳播的,而是具有網絡特征,因此流行病傳播的研究必須在復雜網絡上來進行.這方面的一個重要成果是,由于社會網絡是無標度網,具有大量聯接度的中心節點的存在將導致流行病傳播的閾值幾近于零[29],也就是說,一個非常小的傳染率就能使流行病在人類社會傳播開來.理論的一個重要的應用是在流行病的預防與控制中.計算發現,從無標度網絡上隨機選擇少量節點進行免疫能極大地減少流行病的傳播.網絡上流行病傳播的最新進展是將網絡上的靜態個體拓廣到移動的情形,從而將靜態模型拓廣到個體隨機行走的反應-擴散模型[30]及非隨機行走(即目的性旅行)的加速傳播模型等[31].然而流行病的研究是一項長期而艱巨的任務,還有許多重要問題需要進一步解決,如不同種群間的流行病的傳播、流行病與時變網絡之間的相互作用、多層網間的流行病傳播等.最新研究表明人類流動模式在長時間尺度下具有一定的可預測性,研究這種可預測的流動模式如何影響流行病的傳播,或者更廣泛的輿論、謠言、恐慌等在社會網絡上的傳播,將有助于預防各種突發事件和維持社會的穩定.
在社會經濟領域,金融市場也是高度復雜的動力學系統.2008年金融危機對世界經濟造成的巨大沖擊,使得人們在重新審視主流金融經濟理論的同時,尋找非傳統的方法和理論,探討可能認識和解決金融經濟問題的新思路和新途徑.2008年以來, Bouchaud[32],Lux等[33],Schweitzer等[34],Farmer 等[35]紛紛在《Nature》和《Science》撰文指出,人們應該可以從實際金融經濟數據出發,探索市場的運動規律.而新的金融經濟理論,需要考慮異質主體的相互作用,以及金融經濟網絡的結構、功能和演化規律.這樣構建的金融經濟理論,是以實際市場數據為基礎的實證唯象學說,有別于以邏輯為基礎的公理體系.近年來,物理學家應用統計物理學中研究多體系統的概念和方法,從微觀層面研究金融市場的集體行為,從而建立相應的多體微觀模型,尋找普適和非普適的運動規律,是人們對金融市場從另一角度和另一層次的認識和探索,具有重要的科學意義和潛在的應用價值.同時,物理學家也從金融問題的研究中得到啟發,推動復雜系統統計物理本身的發展.
復雜網絡動力學的另一個例子是大腦神經網絡,它是由幾百億個神經元通過極其復雜的、多層次連接而形成的大腦皮層神經系統,是自然界中所知的最為復雜的動力學網絡體系.它的結構與動力學直接關系到大腦的各種功能及相應的精神疾病及認知障礙.大腦從下到上可以分為7個層次:分子、神經元、神經元群、神經網絡、大腦皮層、功能分區和神經中樞,其中神經元、神經元群、神經網絡和大腦皮層4個層次上都發現了同步現象.然而,神經系統中的不同時空尺度的復雜同步行為是如何實現的,它與大腦神經元之間發放的輸運及信息處理之間的關系如何,這些問題可以通過研究振子網絡中復雜的同步行為而獲得重要理解.最近十多年來,由于腦造影技術的進步,人們已在系統層次對大腦的連接及活動積累了非常多的有益數據.如何分析理解這些數據從而獲得對大腦大規模的復雜結構、動態活動及認知功能之間的關系,必將是未來研究大腦會蓬勃發展的新方向,呼喚著新的統計物理方法來揭示出大腦大尺度的結構和功能網絡與認知過程的關聯.
隨著信息存儲與處理技術以及互聯網與萬維網的發展,我們可以獲取的信息總量呈現爆炸性增長的趨勢.與此同時,我們處理信息的能力卻沒有相應的增長.目前信息科學面臨的最大挑戰是如何解決信息過載問題,也就是如何幫助普通用戶獲取其所感興趣的信息.信息挖掘是極有希望推動并最終解決信息過載問題的關鍵方法.從廣義上說,信息挖掘包括兩部分:一是信息檢索,二是信息發現.前者著力于將已有信息以一種更好的方式進行組織,并以更易于理解和獲取的方式展現給用戶——典型的例子是搜索引擎.后者則是通過分析,自動地推斷一些可能的關聯,這種關聯本身可以看作新的信息——典型的例子是推薦引擎.搜索引擎是以被動的方式服務(需要用戶輸入搜索詞),是對已知信息的再組織;推薦引擎是以主動的方式服務,是對未知信息的發現.
信息的組織和發現是重要的科學問題,事實上,信息挖掘的研究薈萃了計算機科學、物理學和數學的很多思想、方法和技術.與此同時,我們也注意到,盡管信息挖掘一直是一個非常活躍的研究領域,這方面的研究一直停留在具體方法的層面,也就是針對一個具體的問題或一類問題,提出具體的算法并比較算法在某些數據集上的表現.事實上,國際學術界對于信息挖掘方法和技術的研究甚囂塵上,卻一直缺乏對基礎理論的探索.統計力學的系綜理論有望成為信息挖掘的理論基礎,而平均場分析方法有望成為分析估計算法表現的有力武器,這方面的研究進展,不僅可為信息科學帶來重大突破,也能拓廣統計物理對其他學科的滲透,對于建設具有廣闊視野的統計物理學科平臺有重大助益.
傳統的研究主要集中于信息挖掘技術的研究,大多停留在算法設計與高效實現的層面.典型的信息挖掘問題包括鏈路預測和個性化推薦,典型的信息挖掘技術包括:基于相似性的挖掘方法、基于群集智能的協同挖掘方法、基于內容的挖掘方法、基于潛在語義空間的挖掘方法、基于概率模型的挖掘方法、以及混合算法和集成學習方法等.此外,多種數據分析技術,如數據聚類、Bayesian網絡、關聯規則、數據分類、K-means方法、最大熵方法、云模型、多示例學習、神經網絡、線性回歸等均被用于信息挖掘.這方面的研究進展可以參考文獻[36-39].
最近,張翼成及其研究小組將統計物理的方法引入到信息推薦領域中來,利用經典的物理學方法(物質擴散和熱傳導等)來設計個性化推薦算法.他們的工作主要集中在兩方面:基于網絡結構的推薦和基于協同過濾的推薦.在網絡結構方面,張翼成等首次提出將熱傳導理論引入推薦系統[40].周濤等對基于網絡的信息推薦算法進行了比較系統的研究,提出個性化推薦在一定程度上等價于二部分圖向一部分圖的含權投影問題,并依此提出了基于復雜網絡資源分配的推薦算法[41].周濤等提出了一系列刻畫推薦結果多樣性和新穎性的指標,建立了比較完整的包含多樣性、新穎性和精確性的評價體系[42-43],并通過結合物質擴散和熱傳導的混合算法,解決了困擾學術界的多樣性-精確性兼顧兩難問題[44].更復雜的包括社會標簽、噪音、負面評分等因素的討論,最近也被納入到了物理方法的框架中,并得到了明顯優于以往方法的結果[45].
總的來說,信息挖掘是具有重大理論和應用價值的多學科交叉的活躍研究領域.由于目前各類方法缺少堅實和統一的理論基礎,因此無法很好地回答一些基本問題.利用統計力學的思想、方法和概念,建立信息挖掘的理論基礎,將有可能為該領域的研究帶來新一輪在方法論和算法設計層面的創新成果,并有可能取得重大突破.以二部分圖上電子商務商品推薦[46]為例,目前的信息挖掘手段面臨3個重要問題,分別是冷啟動問題——新用戶新商品無法進行精確推薦;稀疏性問題——用戶和商品的直接關系很少,信息不充分,推薦效果差;多樣性-精確性難以兼顧——精確的推薦往往都傾向于推薦熱銷流行的產品,新穎性、多樣性和個性化程度都低,用戶體驗差.這3個問題影響了信息挖掘的應用效果.推動解決或部分解決這些問題,可望引導產生創新高技術產品,帶來可觀的社會經濟價值.
生命現象作為一類特殊的復雜系統,以它高度優化的遺傳和繁衍模式,經過數億年的進化和分化,在地球生物圈這一特定的物理生態環境下,將結構與功能的互動發揮到了極致.生存競爭,資源獵取,優勝劣敗,其中有數不盡的玄機和嘆息.這類現象的科學研究,近年來由于知識的大量積累、高通量數據采集等生化分析手段的發展、以熒光顯示為代表的活體觀察顯微技術的出現和大規模推廣、以及與大規模DNA測序同步發展的生物信息學的誕生,人類對生命的認識正經歷著一個全方位的飛速提升.
生命現象的多層次和千變萬化也為科學地研究和提取其中的規律提出了極大的挑戰.相對說來,細胞內的基本生命運動模式在生物進化的早期就相對地固定了下來,因此更有利于系統優化過程的定量研究.細胞作為一個生命單元,有著非常豐富的功能和相應的調控系統,其中細胞代謝的轉錄調控系統是一個具有代表性的功能化復雜系統.代謝是生命現象中的一個基本過程,細胞生長所需的生物質量(包括氨基酸、核酸、磷脂分子等多種化合物)和化學能是由酶催化的代謝反應所生成的,代謝反應與代謝物形成一個龐大的二分網絡,支撐代謝物的相互轉化.經過大半個世紀的積累,人們對代謝網絡的組成和架構已有較詳盡的了解(見KEGG數據庫http://www.genome.jp/kegg/).Palsson組運用流平衡和線性優化方法,建立了包括大腸桿菌和酵母菌在內的多種細胞的代謝模型,用以計算在特定生長環境下的細胞生長速率,結果部分得到了實驗的證實[47-48].給定生長條件下代謝流的分布近似于樹狀,兼具有明顯的區域性,單個反應的速率依賴于相應酶的數目和活性.而轉錄調控作為細胞內部的一個包含多個輸入節點和多重反饋機制的復雜網絡,可以綜合外界養分及內部需求的信息,控制代謝通路的開關及流量,優化物質和能量的利用率.隨著近來基因測序和基因芯片等高通量技術的發展,有關的實驗數據正在快速積累.雖然不同物種的代謝網絡大致相同,酶蛋白表達水平的調控系統卻千變萬化,具有復雜的拓撲結構和多樣的調控邏輯[49-51].粗略來說,這可以歸結于細胞組分、生長環境、及細胞周期的差異.另一方面,不同物種在進化過程中也可能是找到了同一個問題的不同解,或者當某個參數發生變化的時候,解的結構也發生了變化.不同物種轉錄調控網絡所呈現的豐富的行為,為結構與功能關系的研究提供了大量的實例,但此類海量數據的整理尚缺乏系統性和合適的理論基礎.
建立和認識功能化復雜系統的結構與功能關系,需要引入一整套的分析方法,這與建立系統微觀相互作用與宏觀性質關系的研究有可類比之處,但由于功能這一目標函數的引入,結構的討論為統計物理學提出了新的問題,包括微觀到宏觀定量關系的建立(關鍵變量的引入和準確定義,系統層次的建立)、數據挖掘、方法的評估和系統宏觀特性(功能)的確立與劃分等關鍵科學問題.整體說來,以上關鍵問題的解決依賴于對有關正問題(forward problem,即給定動力學規則來預測系統行為)[52-53]和反問題(inverse problem,即從現象和數據出發確定背后的動力學規則)[54-55]認識的不斷深入.以細胞代謝的轉錄調控系統為例,目前有多種實驗手段通過給予細胞刺激或控制個別基因表達來觀測其形貌和內部狀態演變,獲取大量數據.例如基因組表達譜,蛋白質數量和代謝中間物濃度隨時間的變化等.對數據進行適當的預處理后,運用建立在信息熵等概念上的各類算法來反推調控因子與受控基因間的作用關系,這是研究系統動力學機理的第一步.而正問題則是研究系統結構如何產生和影響功能,將分子網絡動力學模塊與其實現的生物功能直接聯系起來,通過系統的非線性動力學、噪聲傳播及穩定性分析,了解系統的運作機理.在分析大規模生物網絡動力學的研究中,引進多層次結構,合理地將網絡分解成不同層次的功能單元是降低系統復雜性的一個基本和重要的手段[56-57].
分子網絡結構和功能相互依賴的演化過程也是一個解碼生命現象的基本問題,甚至可以說是最基本的問題,因此受到廣泛的關注[58-59].網絡結構變化包括個體數目的增減、節點間相互作用的強度及方式的變化等;而功能的變化則可體現為執行特定任務時“效率”的提高、穩定性的增強以及自適應能力的增加等.對于互演化問題的研究不僅將進一步加強我們對復雜系統中結構和功能之間聯系的認識,同時也將直接提高我們優化和設計分子線路的能力.從網絡系綜的角度出發,統計物理的方法可以應用到網絡演化過程中過渡態及停留時間等問題的定量討論中去[60-61].
近10年的大量研究成果表明,統計物理已經成為復雜系統研究的重要理論依據和方法來源,展示了它的普適性和實用性.在海量數據的挖掘和整理方面,簡化統計物理模型的提出和運用在數據的深度分析中發揮了指導性的作用,為有效地尋找和準確地表述數據背后的規律提供了有力的支撐.量化描述和關系的引入,一方面大大豐富了人文科學的研究內容,由定性的甚至是哲理層次的討論擴展為定量的分析,另一方面也迫使學者們重新審視現有的認知體系,建立與信息爆炸相適應的理論.實際上,一百多年來,統計物理學積累了大量處理多自由度系統的模型和方法,這一知識寶庫可成為復雜系統未來發展的取之不盡的資源.
與此同時,交叉學科研究中涌現的問題常常在時間和空間上呈現多尺度和多層次,結構和動力學具有非線性、有限尺度、復雜關聯、小概率事件等特征.與經典統計物理學對均勻系統物質結構和宏觀物理態的所取得的成就相比,如何有效地運用統計物理學的基本思想和基本方法來處理復雜系統中的各類現象尚有很多問題需要解決.例如,在生物界或現實生活中人們所關心的功能化復雜系統往往屬于一般復雜系統中的特例,從非功能化系統研究中總結出的統計規律通常不適用于此類系統.蛋白質折疊的統計物理研究歷程就提供了一個很好的例子.多肽鏈的折疊需在特定的生理環境下完成,且折疊時間也必須控制在秒的數量級,因此相應的氨基酸序列必須具有某類特性以滿足功能上的要求.以此類推,在更大的尺度上如細胞內部各類生化通道和分子過程的研究中,物理理論的建立需要解決以下幾個問題:a.定義目標函數;b.建立物理化學約束及有關動力學;c.優化資源管理以提高效率和競爭力;d.在基本動力學基礎上,嵌入與環境變化相關的調節機制.顯然,這些問題的解決不僅需要有關學科知識的積累,也需要多層次上相應的統計物理學工具包括理論分析與計算方法的發展.在目前的認知水平下,一條可行的研究策略是從簡單到復雜,從具體系統出發逐步尋找功能化系統的一般規律.
綜上所述,復雜系統的研究,亟待以統計物理為基礎的一套堅實的理論支撐,而這又有待于解決統計物理自身面臨的若干問題,包括非平衡態統計問題、有限系統的分析方法、反問題的分析方法等.我國已經形成了有相當數量和質量的學者,在相關方向上做出了有一定國際影響力的工作.研究的進一步深入,需要更多的具有良好統計物理學知識的年輕學者的加入,同時緊密地結合相應學科的實驗研究,用最新的數據啟發和推動理論工作的開展.在統計物理理論的發展上,我們建議關注以下三方面的工作:a.發展統計物理基礎理論以處理非均勻系統,特別是處于非平衡態的受驅系統中的漲落現象;b.深入研究某些具體但具有代表性的復雜系統,逐步建立基于統計物理思想和概念的理論和方法,譬如信息挖掘和其他反問題的統計系綜理論;c.發現和積累多尺度、多類別的復雜系統的新現象和新規律,加強對功能化模塊的分析和討論.實際復雜系統多層次時空結構的特性,要求研究者不僅對某一層次現象的分析和討論做得深入,對不同層次的銜接也有充分的認識,這樣才可以較準確地把握研究方向,最終解決人們所關心的問題.通過領域同行的共同努力和國家層面上全方位的學科發展和人才培養計劃的實施,我們希望看到在今后的5~10年內,統計物理與復雜系統的這一多學科交叉的基礎領域在我國能夠不斷發揚光大,研究隊伍在數量和質量上都有較大的提高,領域的學者們在具有重大理論和應用價值的問題的研究上活躍于國際學術舞臺并取得矚目的成績,同時為解決與現代社會人類生活與社會發展息息相關的若干重大問題做出應有的貢獻.
[1] 郝柏林,于淥.統計物理學進展[M].北京:科學出版社,1981:411-418.
[2] 霍裕平,鄭久仁.非平衡態統計理論[M].北京:科學出版社,1987.
[3] 陳式剛.非平衡統計力學[M].北京:科學出版社,2010.
[4] ABE S,RAJAGOPAL A K.Revisiting disorder and tsallis statistics[J].Science,2003,300(5617):249-251.
[5] MARCONI U,PUGLISI A,RONDONI L,et al.Fluctuation-dissipation:Response theory in statistical physics [J].Physical Report,2008,461(4-6):111-195.
[6] JARZYNSKI C.Equalities and inequalities:irreversibility and the second law of thermodynamics at the nanoscale[J].Annual Review of Condensed Matter Physics,2011,2:329-351.
[7] BUSTAMANTE C,LIPHARDT J,RITORT F.The nonequilibrium thermodynamics of small systems[J]. Physics Today,2005,58(7):43-48.
[8] LIPHARDT J,DUMONT S,SMITH S B,et al.Equilibrium information from nonequilibrium measurements in an experimental test of jarzynski′s equality[J].Science,2002,296(5574):1832-1835.
[9] COLLIN D,RITORT F,JARZYNSKI C,et al.Verification of the crooks fluctuation theorem and recovery of RNA folding free energies[J].Nature,2005,437 (7056):231-234.
[10] LIU F,OU-YANG Z C.Generalized integral fluctuation theorem for diffusion processes[J].Physical Review E,2009,79(6):060107.
[11] QUAN H T,YANGS,SUN C P.Microscopic work distribution of small systems in quantum isothermal processes and the minimal work principle[J].Physical Review E,2008,78(2):021116.
[12] LEPRI S,LIVI R,POLITI A.On the universality of anomalous one-dimensional heat conductivity[J]. Physical Review E,2003,68(6):067102.
[13] DHAR A.Heat transport in low-dimensional systems [J].Advances in Physics,2008,57(5):457.
[14] MAI T,DHAR A,NARAYAN O.Equilibration and universal heat conduction in Fermi-Pasta-Ulam chains [J].Physical Review Letters,2007,98(18):184301.
[15] DELFINI L,LEPRI S,LIVI R,et al.Nonequilibrium invariant measure under heat flow[J].Physical Review Letters,2008,101(12):120604.
[16] ZHAO H,WENZ,ZHANGY,et al.Dynamics of solitary wave scattering in the Fermi-Pasta-Ulam model[J]. Physical Review Letters,2005,94(2):025507.
[17] ZHAO H.Identifying diffusion processes in one-dimensional lattices at thermal equilibrium[J].Physical Review Letters,2006,96(14):140602.
[18] LI N,LI B,FLACH S.Energy carriers in the fermipasta-ulam?lattice:solitons or phonons?[J].Physical Review Letters,2010,105(5):054102.
[19] CHANGC W,THOMPSON C V,GAN C L,et al. Effects of microvoids on the linewidth dependence of electromigration failure of dual-damascene copper interconnects[J].Applied Physics Letters,2007,90 (19):193505.
[20] CAI W,MOORE A L,ZHU Y,et al.Thermal transport in suspended and supported monolayer graphene grown by chemical vapor deposition[J].Nano Letters, 2010,10(5):1645-1651.
[21] WANG L,HE D H,HU B.Heat conduction in a threedimensional momentum-conserving anharmonic lattice [J].Physical Review Letters,2010,105(16):160601.
[22] CHANG C W,OKAWA D,MA J,et al.Solid-state thermal rectifier[J].Science,2006,314(5802):1121 -1124.
[23] LI B,WANG L,CASATI G.Thermal diode:Rectification of heat flux[J].Physical Review Letters,2004,93 (18):184301.
[24] DESHPANDE V V,CHIU H Y,POSTMA H WC,et al. Carbon Nanotube Linear Bearing Nanoswitches[J]. Nano Letters,2006,6(6):1092-1095.
[25] BARREIRO A,RURALI R,HERNáNDEZ E R,et al. Subnanometer motion of cargoes driven by thermal gradients along carbon nanotubes[J].Science,2008, 320(5877):775-778.
[26] SQUIRES T M,QUAKE S R.Microfluidics:fluid physics at the nanoliter scale[J].Reviews of Modern Physics,2005,77(3):977-1026.
[27] BARABáSI A-L.The origin of bursts and heavy tails in human dynamics[J].Nature,2005,435(7039):207 -211.
[28] BROCKMANN D,HUFNAGEL L,GEISEL T.The scaling laws of human travel[J].Nature,2006,439 (7075):462-465.
[29] PASTOR-SATORRAS R,VESPIGNANI A.Epidemic Spreading in scale-free networks[J],Physical Review Letters,2001,86(14):3200-3203.
[30] COLIZZA V,PASTOR-SATORRAS R,AND VESPIGNANI A.Reaction-diffusion processes and meta-population models in hterogeneous networks[J].Nature Physics,2007,3(4):276-282.
[31] TANG M,LIU Z,LI B.Epidemic spreading by objective traveling[J].Europhysical Letters,2009,87 (1):18005.
[32] BOUCHAUD J P.Economics needs a scientific revolution[J].Nature,2008,455(7217):1181.
[33] LUX T,WESTERHOFF F.Economics crisis[J].Nature Physics,2009,5(1):2-3.
[34] SCHWEITZER F,FAGIOLO G,SORNETTE D,et al.Economic networks:the new challenges[J].Science, 2009,325(5939):422-425.
[35] FARMER J D,FOLEY D.The economy needs agentbased modeling[J].Nature,2009,460(7255):685 -686.
[36] 劉建國,周濤,汪秉宏.個性化推薦系統的研究進展[J].自然科學進展,2009,19(1):1-15.
[37] 許海玲,吳瀟,李曉東,等.互聯網推薦系統比較研究[J].軟件學報,2009,20(2):350-362.
[38] ADOMAVICIUSG,TUZHILIN A.Toward the next generation of recommender systems:A survey of the state-of-the-art and possible extensions[J].IEEE Transactions on Knowledge and Data Engineering, 2005,17(6):734-749.
[39] LüL,ZHOU T.Link prediction in complex networks:a survey[J].Physica A,2010,390(6):1150-1170.
[40] ZHANG YC,BLATTNER M,YU Y K.Heat conduction process on community networks as a recommendation model[J].Physical Review Letters,2007,99 (15):154301.
[41] ZHOU T,REN J,MEDO M.Bipartite network projection and personal recommendation[J].Physical Review E,2007,76(2):046115.
[42] ZHOU T,JIANG L L,SU R Q,et al.Effect of initial configuration on network-based recommendation[J]. Europhysics Letters,2008,81(5):58004.
[43] ZHOU T,SU R Q,JIANG L L,et al.Accurate and diverse recommendations via eliminating redundant correlations[J].New Journal of Physics.2009,11 (12):123008.
[44] ZHOU T,KUSCSIK Z,LIU J G,et al.Solving the apparent diversity-accuracy dilemma of recommender systems[J].Proceedings of the National Academy Science of USA,2010,107(10):4511-4515.
[45] ZHANGZ K,ZHOU T,ZHANG Y C.Personalized recommendation via integrated diffusion on user-item-tag tripartite graphs[J].Physica A,2010,389(1):179 -186.
[46] SHANG M S,LüL,ZHANG Y C,ZHOU T.Empirical analysis of web-based user-object bipartite networks. Europhysics Letters,2010,90(4):48006.
[47] REED J L,VO T D,SCHILLING C H,et al.An expanded genome-scale model of Escherichia coli K-12 [J].Genome Biology,2003,4(9):R54.
[48] FEIST A M,HERRGARD M J,THIELE I,et al.Reconstruction of biochemical networks in microorganisms [J].Nature Reviews Microbiology,2009,7(2): 129-143.
[49] KELLIS M,PATTERSON N,ENDRIZZI M,et al.Sequencing and comparison of yeast species to identify genes and regulatory elements[J].Nature,2003,423 (6937):241-254.
[50] GIANCHANDANI E P,JOYCE A R,PALSSON B O,et al.Functional states of the genome-scale escherichia coli transcriptional regulatory system[J].PLoS Computational Biology,2009,5(6):e1000403.
[51] LEWIS N E,HIXSON K K,CONRAD T M,et al.Omic data from evolved E.coli are consistent with computed optimal growth from genome-scale models[J].Molecular Systems Biology,2010,6:390.
[52] CHIN CS,CHUBUKOV V,JOLLY E R,et al.Dynamics and design principles of a basic regulatory architecture controlling metabolic pathways[J].PLoS Biology, 2008,6(6):e146.
[53] LI F,LONG T,LU Y,et al.The yeast cell-cycle network is robustly designed[J].Proceedings of the National Academy Science of USA,2004,101(14): 4781-4786.
[54] COHEN A A,GEVA-ZATORSKY N,EDEN E,et al.Dynamic proteomics of individual cancer cells in response to a drug[J].Science,2008,322(5907):1511-1516.
[55] ERNST J,VAINAS O,HARBISON C T,et al.Reconstructing dynamic regulatory maps[J].Molecular Systems Biology,2007,3(1):74.
[56] ALON U.Network motifs:theory and experimental approaches[J].Nature Reviews Genetics,2007,8(6): 450-460.
[57] TYSON J J,NOVAK B.Functional motifs in biochemical reaction networks[J].Annual Review of Physical Chemistry,2010,61:219-240.
[58] LI H,JOHNSON A D.Evolution of transcription networks-lessons from yeasts[J].Current Biology,2010, 20(17):R746-R753.
[59] MA W Z,TRUSINA A,EL-SAMAD H,et al.Defining network topologies that can achieve biochemical adaptation[J].Cell,2009,138(4):760-773.
[60] DESAI M M,FISHER D S.Beneficial mutation-selection balance and the effect of linkage on positive selection[J].Genetics,2007,176(3):1759-1798.
[61] VISSER J A G M,PARK S C,KRUG J.Exploring the effect of sex on empirical fitness landscapes[J].American Naturalist,2009,174(1):S15-S30.
Statistical physics approach to the structure and dynamics of complex systems
TANGLei-han1,2, ZHAOHong3, LIUZong-hua4, ZHOUTao5, WANGBing-hong6,7
(1.Beijimg Computatiomal Sciemce Research Cemter,Beijimg 100864,Chima;2.Departmemt of Physics,Homg Komg Baptist Umiversity,Kowloom,Chima;3.Departmemt of Physics, Xiamem Umiversity,Xiamem 361005,Chima;4.Departmemt of Physics,Easterm Chima Normal Umiversity, Shamghai 200062,Chima;5.Web Sciemces Cemter,Umiversity of Electro Sciemce amd Techmology of Chima, Chemgduo 610054,Chima;6.Departmemt of Moderm Physics,Umiversity of Sciemce amd Techmology of Chima, Hefei 230026,Chima;7.Complex System Sciemce Cemter,Umiversity of Shamghai for Sciemce amd Techmology,Shamghai 200093,Chima)
The rapid accumulation of massive amounts of data in biology information technology and various branches of social science in recent years has prompted the development of novel quantitative methods. Statistical mechanics,as a mathematical theory that connects microscopic and macroscopic descriptions of systems with many degrees of freedom,can play an important role in this process.A short review of recent progress in the application of statistical physics methods to a broad range of complex phenomena is presented here.From the examples discussed one may obtain a glimpse of the power of the statistical mechanical approach in capturing the system dynamics at different levels of representation and on many different time scales.With the help of simplified models and approximate treatments,the key variables and their interdependencies can be elucidated.Further theoretical considerations and comparative studies may lead to the discovery of unifying principles.The opportunities and challenges in a closer integration of statistical physics and complex systems science are briefly discussed.
complex system;statistical physics;multi-scale structure amd dymamics;large-scale data amalysis amd modelimg
N 94文獻標示碼:A
1007-6735(2011)05-0409-09
2011-10-24
湯雷翰(1961-),男,教授.研究方向:凝聚態與統計物理、計算物理、非線性動力學及系統生物學. E-mail:lhtang@csrc.ac.cn
汪秉宏(聯系人),男,教授.研究方向:統計物理、非線性科學、復雜系統理論.Email:bhwang@ustc.edu.cn