馬蘭張華
在人對建筑的感知體驗中,視覺無疑是最直接有效的感官之一。文學作品對建筑的描寫也多訴諸視覺體驗,如杜牧《阿房宮賦》中的這段描寫:“五步一樓,十步一閣;廊腰縵回,檐牙高啄;各抱地勢,鉤心斗角。盤盤焉,囷囷焉,蜂房水渦,矗不知其幾千萬落。長橋臥波,未云何龍?復道行空,不霽何虹?”[1]從中我們可以感受到,唐代詩人杜牧從視覺感知方面描述了在阿房宮中行走的體驗,由見之所見,進而感之所感。但在感性之余,如何在建筑的研究中更加科學地分析建筑空間視覺體驗,如何更加準確地理解前人的建造智慧,卻是值得進一步思考的問題。
中國傳統建筑往往以組群形式出現,單體建筑在“禮制”等因素影響下以特定的規則排列組合來體現等級制度。相較于西方傳統建筑的以“體量”取勝,中國古代建筑則依靠“數量”的增長和層次的豐富來完成深遠曠闊的藍圖[2]129-130。例如北京故宮,作為修建于中國明清兩代的皇家宮殿,其南北長961 m,東西寬753 m,占地面積約720 000 m2,是中國迄今為止保存最完整、規模最大的古代建筑群,也是中國宮殿建筑的精華所在。根據1973 年專家現場測量,故宮有大小院落90 多處,房屋980 余座,共計8 707 間。如此規模龐大的建筑群以水平的態勢出現在北京城的中心。
故宮內的單體建筑平面簡潔,一目了然,而廣場庭院空間作為聯系眾多建筑的介質,其平面組織卻變化豐富,嚴謹復雜,“使人從一個層次進入另一個層次的時候,由視覺的效果而引起一連串的感受,并且產生情感上的變化。”[2]153。因此本文在計算機算法技術的輔助下,以分形維數來計算與分析故宮中軸線序列空間中的視覺信息特征。
人腦通過眼睛接收到的圖像,其視覺信息量是不同的。如圖1 中兩幅圖所示,第一幅簡單明了,而第二幅相對復雜,需要人駐睛觀看。也就是說圖像的復雜程度決定了人的視覺興趣點所在[3]。那么對于包羅萬象的世間景物,應該如何測算其視覺信息量?分形維數的概念可以對此有所幫助。
分形幾何理論是由波蘭數學家芒德勃羅(B. B. Mandelbrot)在1973 年提出,用來描述自然界中破碎或不規則的物體,屬于當代復雜性科學的分支之一。分形維數則是分形幾何理論中的度量參數,突破了歐式幾何中整數維(零維、一維、二維以及三維)的限制,將維數擴展至小數的范圍,可以更加準確的測量或描述復雜無規的物體。一般來說,分形可分為兩類:單一分形(uni-fractal)與多重分形(multi-fractal)。單一分形是數學意義上嚴格的分形,其無限迭代,并在所有尺度上保持自相似特征,因此其分形維數也在所有尺度上保持一致;而現實中大多數事物往往沒有明顯的自相似性,或自相似性質只在少數幾級尺度上成立,這種情況則被稱為多重分形,其分形維數會隨著尺度的變化而有所不同。分形維數代表了幾何圖形占有空間能力的大小,某種程度上也是對幾何圖形復雜程度的度量。因此本文以分形維數的測算來分析建筑與空間中所隱含的視覺信息量。

圖1 復雜度不同的兩幅畫(圖片來源:馬蘭繪制)
分形維數的算法有很多,例如拓撲維數、自相似維數、盒維數,以及豪斯道夫(Hausdorff)維數等。不同的計算方法適用于不同的情況,并且計算結果也稍有差異。相較于其他算法,本文使用的盒維數法是一種純幾何式計算方法,其直觀性更適用于建筑學領域[4,5]。以經典分形幾何圖形“Koch曲線”為例(圖2),盒維數的具體計算方法為:對于測算對象S,用邊長為ε 的盒子去覆蓋要計算的平面圖形,記錄下所需最少盒子數N(ε),之后以相同的速率不斷縮小盒子的尺寸ε1,ε2,ε3…εn,分別得到與其相對應的最少覆蓋盒子數N(ε1),N(ε2),N(ε3)…N(εn),建立log(1/εn)與logN(εn)的坐標系,并標出每組數據在坐標系中對應的點,那么貫連這些點的擬合直線的斜率為此測算對象S的分形維數(Fractal Dimension,簡稱FD)。計算函數為式(1)所示,盒維數就是在盒子尺寸的逐步精化的過程中(ε →0),覆蓋圖形盒子數N(ε)增加的對數速率[6,7]。以此方法計算Koch曲線的分形維數,所得結果約為1.253,與Koch 曲線被廣為接受的分形維數值1.262很接近。盒維數計算法存在著不可避免的計算誤差,需要考慮其計算準確度。


根據此算法,筆者以Python 語言編寫了相關分形維數的計算程序,并以此計算了兩位現代主義建筑師勒 · 柯布西耶(Le Corbusier)與弗蘭克 · 勞埃德 · 賴特(Frank Lloyd Wright)各自的的經典作品:薩伏伊別墅(Villa Savoye)與羅比住宅(Robbie House)的主立面分形維數,結果分別為1.4204 與1.6291(圖3),這說明羅比住宅主立面的信息量要高于薩伏伊別墅,這個計算結果也客觀反映了賴特親近自然的“草原住宅”之間與柯布西耶追求純凈的“居住機器”的對比。
本文的計算對象為故宮中軸線中大清門到神武門的空間序列(貫穿大清門、天安門、端門、午門、太和門、太和殿、中和殿、保和殿、乾清門、乾清宮、交泰殿、坤寧宮、坤寧門、天一門、欽安殿、承光門、順貞門,直到神武門),以分形維數計算其空間內的視覺信息量的特征與變化。


在中國傳統建筑布局中,虛空間(庭院、廣場等)往往同建筑單體擁有同等重要的地位,本文在計算過程中,以故宮建筑群高精度3DS MAX 模型①研究方案制定時曾設想過利用現場實拍照片,但由于照片中難以避免游客身影的干擾而改用計算機三維模型。經過筆者多方查證和對模型的多次修改校正后,最終所用的高精度3DS MAX 模型的準確度和細節呈現程度能夠勝任分形維數計算的要求。為研究素材來源,首先在其中軸線序列上各個廣場庭院空間內設置20 m×30 m 的點陣網絡為觀察點(圖4a)。考慮到人在空間中對周圍的事物的觀察一般是全方位的,且人眼的雙眼清晰可見視域范圍約為60°[8],所以在各個觀察點處設置焦距為50 mm②一般來說,人眼對于立體物的焦距為16.7 mm,對圖像的焦距為22.3 mm(參考https://hypertextbook.com/facts/2002/JuliaKhutoretskaya.shtml),但是這取決于我們對“看”如何定義,因為人眼的周邊視覺比中心視覺弱很多,所以本文在模擬中將相機焦距設置為50 mm,此時所觀察物體成像更清晰,并且在很大程度上減小了透視變形。的相機,每隔60°記錄一個視角圖像,并且360°環繞來模擬人的視覺(圖4b)。以其中一個觀察點為例,相機環繞一周捕捉到6 張視覺圖像(圖5a)。由于分形維數著重于測量幾何圖形的復雜性,所以被計算的圖片需要經過邊緣檢測處理,只保留清晰的幾何線條。圖像的邊緣檢測是計算機視覺中特征提取的一種策略,突出圖像的重要結構屬性而剔除與之相關性較弱的信息。本文經過比較后,選取了Canny 邊緣檢測算法①筆者曾嘗試過包括Canny 邊緣檢測、Sobel 邊緣檢測與Laplacion邊緣檢測在內的幾種圖像邊緣檢測算法。其中Laplacion算法所處理的圖像對邊緣的敏感度高,但常會出現虛假邊緣;Sobel 算法的抗噪性稍好,但產生的邊緣有強有弱,連續性差;Canny 算法經過濾波去噪、邊緣增強以及雙闕值檢測,產生的邊緣較完整清晰,能夠更突出圖案的幾何特征,并且有較強的噪聲抑制能力,能夠盡可能多地標識出圖像中的實際邊緣,且誤檢概率非常小。經過比較,筆者認為Canny 邊緣檢測算法是更適用于本文分形維數盒維數的計算方法。,以Python 編寫程序,將相機捕捉的圖像轉化為二值化像素格式(圖5b),再將其輸入到圖片分形維數的計算程序中,由此得到每個觀察點上六個不同視角圖像的分形維數值,并以雷達圖的形式表達該觀察點上(圖6)。以上述方法處理故宮中軸線序列中355 個觀察點的2 130 張圖像,并根據其分形維數計算結果建立整體中軸線序列的可視化雷達圖(圖7),以此為基礎進一步分析故宮空間序列的視覺信息量。
通過上述計算,對所獲得的故宮中軸線建筑空間視覺信息量數據進行分析,可以發現很多值得關注的現象。現分述如下:
在故宮中軸線序列的分形維數雷達圖中,“紅-橙-黃-綠”的顏色序列代表了每個觀察點六個方向的平均分形維數值從高到低的順序:色溫越高,則分形維數值越高,人的視覺所接收到的信息也相應越多;色溫越低,人的視覺所接收到的信息也就越少;而黃色在整個顏色序列里色溫居于中間位置,表示信息量相對適中。通過觀察可以發現,上述雷達圖中最明顯的特征是,雷達圖分布無論在形體還是顏色上,都呈現明顯的對稱性(圖8),這也正反映了故宮建筑群左右對稱、強調中軸線的平面構圖準則。
從整體分布圖中還可看出,雷達圖在門的位置上有較明顯的變化。以序列中天安門、端門、午門、太和門與乾清門為例(圖9),視覺信息量集中在南北兩個方向,體現出極強的視覺導向性;并且平均分形維數很低,呈綠色,在視覺體驗上壓低了信息量。這樣的變化使門成為了空間的轉折點。門是中國傳統建筑的重要組成元素之一,在空間序列中起到連接前后層次的作用,既是前一個空間段落的終結,又是下一個空間段落的起始。從視覺信息量的計算中可明確,故宮中軸線序列中的節奏與韻律主要是依靠門來體現的。
將圖7 的雷達圖改繪為色塊圖(圖10),單獨從顏色分布來觀察,可知所計算空間序列中的視覺信息量分布與空間的形狀是有聯系的。


天安門前的廣場空間呈橫向矩形,視覺信息量高的偏紅色區域亦以橫向長弧形圍繞天安門城樓,并恰好沿城門前金水河的形狀。也就是說,人在金水河畔恰能接收到最多的視覺信息量,這印證了古人的設計智慧。城市規劃理論家維爾納 · 黑格曼(Werner Hegemann)與阿爾伯特 · 匹茲(Elbert Peets)、日本建筑師蘆原義信都曾提出過空間中觀察距離(D)與建筑高度(H)之間的比例關系[9,10]。其中黑格曼與匹茲提出當D/H=2,仰角為27°時,可以觀看到建筑全貌。在天安門廣場的中軸線方向上,視覺信息量最大的紅色區域與天安門的距離恰好約為城樓高度的2倍(D≈72 m,H ≈33.7 m),也就是說,人在能看見天安門城樓的全貌時,可感知到最大程度的視覺信息量。
午門作為紫禁城內外的連接點,其南側的豎向矩形廣場引導著一條縱向持續較高的視覺信息帶,其中紅色區域分布在距午門D ≈75 m—272 m 的范圍內,根據D/H 規則與午門建筑高度H ≈35.6 m 可得D/H≈2.1—7.6,也就是說在人們遠觀午門直至看到午門全貌的臨界點時,會持續收到較高的視覺信息量。
端門、太和門前的廣場以及御花園的空間相對接近方形,視覺信息量的排布也徑向呈現由高到低的發散狀。
對于序列中最重要的兩處:外朝太和殿、中和殿、保和殿區域與內廷乾清宮、交泰殿、坤寧宮區域,雖然二者面積不同,但空間布局相似,因此視覺信息量的計算結果分布也呈相似狀。二者都是在主殿前(分別是外朝太和殿、內廷乾清宮)的方形空間形成徑向分布,跨過主殿之后的活動空間主要分布在兩側,信息量也隨之下降至較低。在太和殿前的廣場中,視覺信息量最高的區域主要分布在兩處,分別是距離太和殿約76 m 與15 m 的區域,在76 m 時,D/H ≈2.2(太和殿總高度H 為35 m 左右),同樣是在能看見建筑全貌的區域中視覺信息量最大,而在距建筑15 m 處時,則由于太和殿的建筑細節逐漸顯現,而使視覺信息量隨之增高。
由此看來,故宮庭院廣場空間的形狀、大小、性質的變化是產生不同視覺體驗的的主要原因之一。故宮的中軸線序列將空間性質與視覺感受巧妙結合,行走在不同的空間可以獲得不一樣的體驗。另外,在重要節點建筑前側的空間中,視覺信息量較高的區域大多分布在距建筑高度兩倍以上的地方(D/H>2),即從遠觀到可見建筑全貌臨界的點之間。這也體現了在中國古代建筑的布局設計中更注重建筑的氛圍渲染,而并不特別強調中心建筑的高大奇巧。這種布局方法,有節制地引導人們對建筑產生期待,使人們按設計意圖逐步靠近并感受建筑。
空間程序的巧妙安排是中國古代建筑的設計精髓之一。建筑群在水平方向上大規模延伸,特殊的“組織程序”使人在其中移動時可以感知到一連串不同的視覺影像,并由此引發綜合心理體驗。如果將計算范圍內位于中軸線上的觀察點提取,基于每個點的分形維數值形成一條平滑的曲線,便能看出人在隨序列移動時視覺信息量的動態變化(圖11):整個序列好比一幅緩緩打開的畫軸,一幕一幕相互襯托、交替出現,對節奏的把控使每個庭院廣場空間都保持了一個視覺信息量的“低-高-低”完整變化周期,而門在序列中起到了節點的作用,使各空間在成為整體序列中有機組成部分的同時,也保持了各自的獨立性。如果自最南端大清門進入沿中軸線前進,經過長廊,視覺信息量緩慢增長(①),而后有浮動地下降,直至穿過天安門(②);接著在端門前與午門前的空間內(③、④),視覺信息量各自經歷了“低-高-低”的完整周期后,直至太和門前;太和門與太和殿前廣場空間是整個序列中最重要的空間,但是從分析結果看,⑤、⑥兩段空間的視覺信息量并沒有明顯增長,而是保持較為平緩的波動,這種“周期式”和“去中心化”的設計手法正是中國傳統建筑的獨特之處:在故宮的中軸線序列上有大大小小十幾種空間,各有其不同的建筑景觀,但其中卻沒有尺度驚人的單體建筑成為壓倒其他一切的存在,即便是地位最高的太和殿也不例外。但這絲毫沒有影響到故宮建筑群的宏偉莊嚴之感,在⑤、⑥兩段空間中視覺信息量呈高低起伏,表明人們在空間中穿梭時,動態視覺體驗豐富多變,這種戲劇般的效果更具有心靈的深度震撼力。最后穿過乾清門,視覺體驗在保持了一個短暫平緩的高信息量之后便逐漸消褪(⑦、⑧)。這種抑揚頓挫的空間序列安排,將“人”的感受置于“物”的自身表現之上,是中國傳統建筑藝術中“以人為本”的境界所在。
故宮中軸線空間內,從觀察點的雷達圖走勢可以看出視覺信息量的導向:雷達圖在哪個方向上延伸的越多,此方向視覺圖像的分形維數越大,那么接收到的視覺信息量也就越高。縱觀圖7 分形維數雷達圖,如果單靠肉眼觀察其走勢,很難做到清晰的分類與歸納。所以本文用機器學習(Machine Learning)中的SOM 算法(Self-Organizing Map)①自組織神經網絡SOM 是機器學習中基于無監督學習方法的神經網絡的一種重要類型,最早是由芬蘭赫爾辛基理工大學圖沃 · 科霍寧(Teuvo Kohonen)于1981 年提出的。算法通過對樣本的學習能夠將輸入樣本自動識別成組分類,它所形成的聚類中心能映射到一維或二維組織上并保持了原樣本的拓撲結構不變。來對整體數據進行分類分析(Python編寫)[11-13],故宮空間序列中有355 個觀察點,每個觀察點都有6 個方向的視覺圖像,組成了355 組分別包含6 個向量的數據集合(表1)。


經過SOM 算法訓練,可將所有觀察點的雷達圖分為六組,分別以不同顏色來表示(圖12)。圖中的數字序號與故宮中軸線序列中觀察點序號一一對應,便于將其還原到空間序列中,并按顏色分類列出,序列中雷達圖的偏斜特征(視覺導向)便一目了然(圖13)。紫色圖塊是向正前方的視覺導向,藍色圖塊是向后方的視覺導向,紅色圖塊的視覺導向偏左側,青色則偏向右側,綠色表示視覺分布相對均衡,而黃色則代表前后視覺加強而兩側視覺弱化。由分析圖可知,在故宮中軸線空間序列中的355 個觀察點中,向前(紫色)與向后(藍色)的雷達圖塊所占比例較大,是序列空間中的主要視覺導向;左右兩個方向(紅色與青色)比例相仿,再次印證了故宮中軸線對稱的布局特征;而強調前后兩個方向的黃色雷達圖大部分在長廊及門的位置。從圖13 的整體視覺導向布局還可看出:序列中端門、午門、太和門、太和殿以及乾清宮南側的五處空間都經過了在軸線方向上“三段式”的布局:紫色(向前)→綠色(四周勻稱)→藍色(向后),在視線上引導人們沿中軸線方向移動;在大清門與天安門之間的長廊以及各座門所對應的空間處,視覺信息量呈現出強烈的前后導向(黃色),引導人沿著南北軸線方向移動;而在天安門前廣場中則以向后的視覺導向為主;在故宮核心景觀的三大殿區域,視覺導向區域混合,表明此區域有最豐富的視覺信息。
無論對于建筑師還是大眾,建筑的外觀與空間的視覺體驗都是最直觀的。而這些因素在以往的建筑分析中,常以“風格”“文脈”“感覺”等主觀詞匯來描述,不僅感性,甚至給人一種“只可意會而不能言傳”的感覺。蘆原義信曾在《外部空間設計》中提出:“空間基本上是由一個物體同感覺它的人之間產生的相互關系所形成,這一關系主要是由視覺確定的。”[10]1因此本文以分形維數的計算分析了故宮中軸線空間序列的視覺信息量,通過系統的圖像捕捉與維數計算將建筑轉化為數據形式,建立視覺復雜度相關的數據庫。根據視覺信息量的大小、分布及傾向等研究視角,將數據處理為不同的結構,從而探索與分析隱藏在建筑背后的視覺復雜度特征。
需說明的是,視覺圖像分形維數的高低并不是判斷空間好壞的依據,視覺信息量的大小只是代表了不同的視覺感受。分形維數作為對幾何形體占有空間能力的度量,如果與人的視覺相聯系,量化人在特定空間對于觀察目標的視覺信息接收量,對建筑分析與空間設計來說,都提供了新的思路,其進一步應用的潛力需要在今后的研究工作中進一步探討。