高智慧,鄒廣天
針對各行各業中積累的大量數據,從中挖掘出關于變換的知識,為處理矛盾問題的決策服務,我國學者于2004年提出了可拓數據挖掘理論[1],它研究用可拓學的理論和方法[2-3],去挖掘數據庫中與解決矛盾問題的變換有關的可拓知識,并快速從單一理論向多學科融合方向發展,相關研究成果已被應用于數據挖掘和人工智能等領域。在信息化社會,充分有效地管理和利用各類信息資源,是進行科學研究和決策管理的前提條件[4]。對已有住宅建筑設計數據進行整合與集成,是研究可拓住宅建筑設計數據挖掘的起點。許多學者研究了數據庫與可拓學之間融合的方法,并取得了突破性進展。曾維等[5]提出利用可拓學基元來描述知識中的信息單元及其聯系,對可拓知識庫進行查詢、插入、刪除、更新操作,實現人工智能構建可拓知識庫;豆增發等[6]將可拓學方法應用于數據庫建模中,對建模對象進行分析和推理以獲得最優數據庫模型,這樣彌補了傳統E/R圖和面向對象建模依靠建模人員經驗和能力的不足,使數據庫建模趨向可推理、可優化及智能化;張銘等[7]提出城市軌道交通數據中心平臺的分層框架和功能定位,結合某城市軌道交通數據中心建設案例,描述了基于數據倉庫的搭建過程及相關業務的調用邏輯。謝穎等[8]撰寫的《多媒體數據庫研究》在總結多媒體數據庫研究現狀的基礎上,討論了多媒體數據庫的關鍵技術,分析了多媒體數據庫的結構,并闡述了此類數據庫構建的關鍵技術,以此提供完善的多媒體數據檢索及維護功能。但是以上知識庫或數據庫的構件方法只針對單一類型的數據,如關系型數據或E/R圖等結構化數據或多媒體型數據的集成方法,并未涉及到針對多維、復雜的設計類數據的數據庫構建方法。
住宅建筑設計數據所具有的非結構化、多源復雜性特征決定了在存儲管理上的特殊性,而地理信息系統(geographical information system,GIS)具有較強的地理信息存儲、管理能力與功能拓展的可能性。因此,本文針對住宅建筑設計綜合數據信息存儲需求,構建基于ArcGIS軟件的可拓住宅建筑設計數據庫,為計算機輔助管理和利用海量住宅建筑設計信息及后續的可拓數據挖掘提供數據支持。
可拓住宅建筑設計數據是運用可拓學的理論與方法對住宅建筑設計信息進行記載的基元符號或基元符號的組合。它是可以被計算機識別的、抽象的符號,這些符號不僅指數字,而且包括字符、文字、圖形等。歸納起來,分為圖像和屬性數據(見圖1)。

圖1 可拓住宅建筑設計數據組成Fig. 1 Data composition of extension residential architectural design
圖像數據表示住宅建筑設計的地理位置及形態信息,包括位置、尺寸、形態及其特征等信息,同時具有定位、定量和空間關系描述等特征的二維工程圖。通常以矢量結構(dwg文件格式的AutoCAD文件等具有點、線、多邊形特征的圖形)和柵格結構(以像素圖塊形式出現的照片、遙感圖片、地圖等)兩種形式表達(見圖2)。矢量數據解決數字化圖形記錄的精度問題;柵格數據解決建筑面狀圖形性質及直觀形象等問題。

圖2 圖像數據類型Fig. 2 Graphic data type
屬性數據是從圖形數據中得到的設計的語義信息,是對圖像數據的描述與解釋。包括聲音、數值、文字等在內的居住區綜合技術經濟指標,包括各種類型的建設用地面積、居住戶數、居住人口、總建筑面積、容積率、綠地率、建筑密度等信息;住宅建筑設計高度、層數、面積、結構形式、戶型等信息以及含有評價信息的模糊數據。可拓學的基元模型作為聯系建筑設計與數據挖掘的橋梁,從理論上把住宅建筑屬性信息與可拓集的基元(復合元)對應起來,為后續的數據庫系統設計工作提供從現實世界到信息世界的抽象方法。
1.2.1 物元表達住宅建筑的基本信息
以Om為對象,cm為特征,Om關于cm的量值vm的有序三元組作為描述住宅建筑M的基本信息,用n維物元表示住宅建筑多個特征及其對應的量值,即

對典型的模糊數據,應將這些數據轉化為可拓集合(–∞,+∞)中的一個量值再進行存儲,以便實現數據表達的一致性,滿足量化挖掘比較。
例如,不同的家庭人口構成需要有不同的住宅套型設計與其相適應。住戶評價信息從側面反映了套型的需求。按照滿意程度依次由高到低劃分為5個等級,并逐次從個體樣本中得到以評價信息為變量的評價數據。其中1表示“很差”,5表示“很好”,其余評價等級變量以此類推,將其轉化為定量數據信息。

1.2.2 關系元表達住宅建筑的關系信息
例如,由F. L. Wright設計的流水別墅,位于美國匹斯堡市郊區的河畔。那里遠離公路、高崖林立、草木繁盛,甚至有一溪瀑布緩緩流下。場地現狀狹窄、條件復雜。正是在這樣一種“惡劣”的場地環境條件下,賴特將別墅建于溪流之上,使溪水成為建筑的一部分,別墅如同生長在瀑布之上的巨石之間,使得建筑與溪水、山石、樹木自然地結合在一起,成為現代建筑的杰作之一。這一構思用關系元模型描述為

為了敘述方便,對于復雜的數據信息,如人、事、物組合或復合的結果,需要使用物元、事元和關系元復合的形式來表達,統稱為復合元。復合元的構成、運算和變換成為研究復雜問題的基礎[6]。
基元是進行可拓分析和可拓變換的基礎[9]。為了發揮可拓學的優勢,獲取并生成更多有意義的住宅建筑數據,利用事物變換的可能性,運用拓展分析與共軛分析方法,建立數據信息,使設計目標、設計問題的理解更為系統和深刻。對拓展后的基元進行評價,評價的標準從住宅建筑設計的目標出發,層層發散,直到找出對應的住宅建筑基礎數據(設計條件)為止,且數據不可再分割;當數據缺失時,根據可拓學相關網理論由其他可知數據推導不可知數據,反之則刪除這一屬性信息。
圖像和屬性數據信息共同描述一個建筑實體,構建住宅建筑設計數據庫要處理的不僅僅是圖形信息,常常是多結構化的信息。對其數據信息的分類存儲需要同時兼顧其圖像要素和屬性要素兩個特征。
作為體現建筑設計意圖的重要載體,建筑圖紙廣泛流通于建筑設計、施工等不同階段。文本和圖片數據是進行數據挖掘的一個分支,也是住宅建筑數據的重要來源。如,住宅建筑設計投標方案文本、建筑設計說明、建筑設計資料集、策劃書等,設計單位是這類數據的可靠來源。
1.3.1 圖像數據整理
ArcGIS提供了空間拓撲分析功能,有去除冗余頂點、重復線、節點類型識別等[10];圖面上有水平或垂直的直線條,以這根直線做參考進行矯正;對于地圖的橫、縱向誤差,通過掃描圖長寬尺度與地圖實際尺寸相比較進行糾正;對于遙感影像在進行解譯時,一般選用和遙感影像比例尺相近的地形圖或正投影,做重合比對分別糾正。
1.3.2 屬性數據整理
根據基元特征及量值的唯一性,進行匹配性校驗。當數據之間的特征與量值完全相同,則只需合并保留一條數據,將多余數據清除;當數據中對象相同,而其對應的特征的量值不同,則需進一步確認真實性,保留可靠數據源,將其余刪除;若中數據對象相同,特征不同,則應將該特征作為對數據源有意義的補充,予以保留;無法填補的缺失數據值刪除忽略掉,并在數據表中刪除與其對應的基元,以保證后續挖掘的準確性;若缺失發生在源數據中,則運用可拓分析方法,從相關數據網絡中,根據可拓相關分析、可擴分析,由已知數據推導缺失數據值。
可拓住宅建筑設計數據庫(Extension residential architectural design database)是指長期存儲在計算機內、結構化、大量的、可共享的可拓住宅建筑設計數據的集合。在計算機實現方面,以ArcGIS為軟件平臺,以基元符號為系統語言,以空間數據管理為核心,利用計算機技術、遙感航測技術和數據庫技術,采用統一地理坐標系把各種住宅建筑屬性信息與圖形信息一起存儲為計算機可識別數據,形成具有統一表現形式和結構的體系。
面向住宅建筑設計的可拓數據挖掘信息集合包括圖像數據庫和屬性數據庫兩部分。圖像數據庫描述有關建筑對象的形態及位置的數據,如點、線、面、坐標等。而屬性數據庫描述建筑圖形特征的有關信息,如名稱、容積率、高度、戶型及其組合等。針對不同的用戶,無論是查詢功能、管理需求或挖掘需要,數據庫需要集中體現出在怎樣的場地現狀、住戶要求等條件下,最終得出怎樣的住宅建筑設計結果,歸納起來體現出設計條件和設計成果之間的聯系。單就住宅建筑設計而言,數據庫構建需求界定在設計條件與設計目標之間設計問題的解決,既包含住宅建筑設計的相關數據,又包含描述解決設計問題的途徑、經驗和方法(知識)。
可拓住宅建筑設計數據庫的構建主要實現以下目標:
1)用可拓學語言描述建筑設計相關要素,整合數據并構建統一的表達語言,便于計算機識別;
2)形成高效的住宅數據存儲平臺,為可拓住宅建筑設計和后續的數據挖掘過程提供豐富的數據基礎。
從用戶的角度對住宅建筑數據進行建模,其任務以住宅建筑設計、規劃與挖掘、決策所需數據為基礎,描述住宅建筑工程實例的設計信息模式。根據住宅建筑設計數據的類型,劃分為居住區信息、性能信息、設備信息、平面、立面、剖面信息。用住宅建筑設計圖形和它的屬性名稱的抽象形式描述設計條件,一個住宅建筑需要多個屬性來進行描述并反映屬性之間的依賴關系(圖3)。

圖3 可拓住宅建筑設計數據建模Fig. 3 Model building of extension residential architectural design database
邏輯結構設計分為兩步,1)圖形結構設計,將不同類型、不同級別圖形要素進行分層存放,每一層存放一種專題或一類信息。共分為3層:地圖層,反映一定區域范圍內的數據庫構建邊界;規劃圖層,反映居住區規模和住宅建筑分布狀況;住宅建筑設計要素層,包括建筑的平面、立面和剖面等數據信息。2)屬性信息組織形成過程:屬性數據最終以數據表的形式來管理。
地圖數據主要提供空間地理位置數據,包括地形圖、行政區劃圖等。各種地圖,經過數字化轉換輸入數據庫后,地圖上的信息轉換為對應區域地理坐標。
根據地理信息系統特征坐標點的唯一性,進行圖形數據與屬性數據的匹配。在計算機實現方面,ArcGIS自帶地圖加載功能,該地圖能實現定點查詢經緯度,并通過位置坐標實現與AutoCAD拼接[11]。當地圖下載完成,可生成所下載底圖的經緯度,這一地理位置信息成為實現建筑平面坐標系與大地坐標系匹配的重要依據[12]。在ArcGIS軟件平臺基礎上,圖像數據中的AutoCAD矢量圖形信息,將建筑場地內的平面坐標嵌入更大的地域坐標系中。屬性信息匯總成二維表,連同調研、資料查詢獲取的圖片、現狀照片等存儲為若干網頁文件,將文件的存儲路徑寫入屬性信息統計表,完成圖像信息和屬性信息的匹配[13]。
為檢驗本文方法的可行性和有效性,以某居住小區內的住宅建筑為例展開試驗性數據庫構建。數據來源于建筑設計院設計圖紙。
該項目(圖4)為普通商住小區,其中高層住宅八棟,臨街商業用房及配套公建四棟。設計院提供的數據包括AutoCAD圖形、JPG圖片與文本。

圖4 某居住小區項目Fig. 4 The project of a residential district
首先,打開百度地圖下載器,在行政區劃菜單中確認市域范圍內遙感地圖作為底圖。其次,在ArcGIS的工具欄中選擇【Add Data】,選擇導出的地圖即可完整加載。此時地圖上的信息轉換為對應區域地理坐標。根據特征點:居住區北門、東門(125.166 396,43.828 142)位置坐標定位AutoCAD居住區平面坐標。
根據圖3所示建模方法,構建該小區屬性數據信息數據庫。經過轉換特征量值,刪除冗余數據、補全缺失數據、修正錯誤數據后,利用物元模型描述居住區屬性數據信息 (見圖5(a))。

圖5 ArcGIS軟件中加載居住區住宅建筑數據信息Fig. 5 ArcGIS loaded residential area planning data information
以1#住宅樓為例(圖5b),建筑面積為12 591.06 m2,一梯三戶,共有兩種套型,分別為兩室兩廳一衛和一室一廳一衛。數據中包含圖紙與文本信息。其中CAD圖形數據以建筑4個角點為依據,定位到地圖中。連同平面屬性信息嵌入1#住宅樓的1單元套型平面圖中。文本信息轉化為屬性信息以基元形式存儲。該套型單元用符號”來進一步表達戶型圖中的套型組合方式,分別記作M11、M12。

在存儲住宅建筑數據時,通過數據庫實現多源數據集成是必然的選擇。本文根據住宅建筑設計特點,針對圖像及其屬性信息集成問題,從交叉學科角度提出數據庫構建方法,得出以下結論:
1)屬性數據中存放的諸如場地、規模、面積、戶型等數據信息以基元的形式表達,與以矢量結構描述的AutoCAD文件和以柵格結構描述的圖片、影像等圖形數據信息的匹配與互查,實現了對住宅建筑數據的組織、管理;
2)通過給出查詢條件,即可列出數據庫內相關的住宅建筑設計信息,開展數據的提取和分析;
3)可拓住宅建筑設計數據庫給用戶提供了充分的可擴展空間,通過增刪葉節點來修改子數據,使數據結構更加豐富和合理。這也是目標–條件邏輯結構的優勢。
可拓住宅建筑設計數據庫解決了定量和定性數據與圖像數據的集成問題,為可拓數據挖掘與住宅建筑信息的無縫銜接搭建了統一的數據平臺。此外,通過建立可拓住宅建筑設計數據庫,數據的查詢、統計、可視化分析等應用更為高效,同時也為可拓住宅建筑設計提供了有力的數據支撐。
下一步研究將進一步提升居住區定位和居住區地形描述精度;提取其他相關數據信息改善挖掘性能,同時考慮評價量值的加載和優選問題及自動化抓取網絡數據信息的能力。建筑師可以根據獲取數據的深度和廣度,推而廣之到建筑設計其他方面的構建研究,為實現計算機輔助設計奠定基礎。
[1]楊春燕, 李小妹, 陳文偉, 等. 可拓數據挖掘方法及其計算機實現[M]. 廣東: 廣東高等教育出版社, 2010: 25–32.YANG Chunyan, LI Xiaomei, CHEN Wenwei, et al. Extension data mining method and its computer implementation[M]. Guangdong: Guangdong higher education press, 2010:25–32.
[2]陳文偉, 黃金才. 可拓集與可拓數據挖掘[M]. 北京: 科學出版社, 2008: 37–41.CHEN Wenwei, HUANG Jincai. Extension set and extension data mining[M]. Beijing: Science press, 2008: 37–41.
[3]蔡文, 楊春燕, 何斌. 可拓邏輯初步[M]. 北京: 科學出版社,2003: 15–17.CAI Wen, YANG Chunyan, HE Bin. The preliminary exten-sion logic[M]. Beijing: Science press, 2003: 15–17.
[4]王珊, 薩師煊, 張俊. 數據庫系統概論[M]. 北京: 高等教育出版社, 2014.WANG Sa, SA Shixuan, ZHANG Jun. Introduction of database system[M]. Beijing: Higher education press, 2014.
[5]曾維, 魏蛟龍. 可拓知識庫的構建[J]. 船舶電子工程, 2004,3: 53–55.ZENG Wei, WEI Jiaolong. Extension repository designing[J].Ship electronic engineering, 2004, 3: 53–55.
[6]豆增發, 王保保. 基于可拓學的數據庫建模方法[J]. 西安郵電學院學報, 2006, 9: 79–82.DOU Zengfa, WANG Baobao. The method of database modelling based on extension theory[J]. Journal of Xi’an university of post and telecommunications, 2006, 9: 79–82.
[7]張銘, 曹鴻飛. 城市軌道交通線網數據中心與評估決策平臺[J]. 智能系統學報, 2017, 12(3): 1–9.ZHANG Ming, CAO Hongfei. The platform of data center and evaluation decision making of urban rail transit[J].CAAI transactions on intelligent systems, 2017, 12(3): 1–9.
[8]謝穎, 張毅, 操駿峰, 等. 多媒體數據庫研究[J]. 重慶郵電大學學報: 自然科學版, 2017, S1: 134–137.XIE Ying, ZHANG Yi, CAO Junfeng, et al. Research of multimedia database[J]. Journal of Chongqing university of posts and telecommunications: natural science, 2017, S1:134–137.
[9]趙燕偉, 周建強, 洪歡歡. 可拓設計理論方法綜述與展望[J]. 計算機集成制造系統, 2015, 5: 1157–1167.ZHAO Yanwei, ZHOU Jianqiang, HONG Huanhuan. Overview and prospects of extension design methodology[J].Computer integrated manufacturing systems, 2015, 5:1157–1167.
[10]李江, 周浩, 羅吳亮. ArcGIS空間數據庫中拓撲錯誤的檢查與批量處理方法[J]. 北京測繪, 2017, 2: 156–157.LI Jiang, ZHOU Hao, LUO Wuliang. Research on the conversion of DLG data to data factors of important geographical conditions[J]. Beijing surveying and mapping, 2017, 2:156–157.
[11]李瀟瀟. 簡述ArcGIS在DEM數據格式轉換及DEM、DOM數據質量檢查過程中的應用[J]. 測繪與空間地理信息, 2015, 2: 5–8.LI Xiaoxiao. Described on the application of ArcGIS in DEM data format conversion, DEM and DOM data quality inspection process[J]. Geomatics and spatial information technology, 2015, 2: 5–8.
[12]孫霞, 曹剛, 王偉東. ArcGIS影像管理解決方案淺析[J].測繪與空間地理信息, 2017, 1: 175–176.SUN Xia, CAO Gang, WANG Weidong. Analysis of Arc-GIS image management solution[J]. Geomatics and spatial information technology, 2017, 1: 175–176.
[13]段正勵, 劉撫英. 杭州市工業遺產綜合信息數據庫構建研究[J]. 建筑學報, 2013, 10: 47.DUAN Zhengli, LIU Fuying. Study on the comprehensive information database of industrial heritage in hangzhou[J].Architectural Journal, 2013, 10: 47.