潘 燕
(福建農業職業技術學院 福建 福州 350007)
目前,在可視化數據挖掘工作中,以傳統的方式并不能對諸多數據信息進行挖掘。例如針對地質體來講,其特點即為不規則、不連續且資料有限等,這時就可以借助三維建模技術來真實體現出地下的地質體,既可以描述地質構造與屬性特點以及分布情況等,還可以在實現地質數據三維可視化的基礎上,便于更加真實、直觀和形象地進行現象分析,進一步說明了三維建模不僅是為了模型的可視化效果,更重要的是為了在此基礎上能夠充分利用各類隱藏在數據中的知識。
科學計算可視化,在過程中可以運用計算機圖形學與圖像處理技術將已經產生的數據和數據計算結果轉變成圖像進行展示。計算科學化的含義已經得到了拓展,既包含了科學計算數據可視化,同時還包含了工程計算數據的可視化,例如有限元分析的結果[1],另外,還包含了測量數據的可視化,可以將其運用到醫療領域中,保障斷層掃描或核磁共振數據的可視化,這也是可視化領域需要重點研究的課題。
數據挖掘可視化技術主要是尋找與分析數據庫,并且找出數據庫中有用的信息或潛在需要的信息過程,之后以直觀的方式呈現信息模式與數據之間的關聯。這種可視化的數據挖掘方法可以為決策人員深入分析數據關系[2]。模型是數據挖掘可視化的重要體現,模型可視化方法與數據挖掘運用的算法有一定的關聯,如決策算法可以運用三維建模方式來加以體現,在過程中可視化可以通過立體圖形來體現知識發現過程,數據挖掘可視化技術屬于一種輔助方式,其運用直觀的圖形方式將數據進行呈現,全面拓展了數據的表達與理解力,在數據深度挖掘方面有著十分重要的促進作用,在發展中受到了廣泛關注和重視。
另外,三維建模與可視化工具在數據準備階段的重要性相對明顯,在建模完成之后就可以直接對數據信息進行分析,因為三維形態有著直觀且可視化優勢,同時還能夠在計算機中進行體現,在圖形的幫助下就會直接找出數據關系和異常數據,這是以往單一借助數據分析難以實現的。三維建模可視化數據分析技術全面拓展了以往傳統的圖標功能,數據分析和剖析也較為清晰且深入,可以全面且有效地體現出數據信息的內在本質。
從內容角度分析,三維模型檢索技術主要分為以下兩類:
1)基于幾何的三維模型內容檢索技術
從幾何角度來開展三維模型內容檢索主要是應用統計模型中的幾何分布,也可以借助幾何變化來使三維模型轉變成為一種定向信息,之后再將模型之間的相似性轉變成向量間的相似性。針對幾何變化方式來講,其主要是利用三維模型的空間信息再通過數學變化方式呈現出向量信息,相關學者[3]提出了3D離散傅里葉變化的相似性評價模式,在過程中應在離散化給定的三維模型中得出體素化模型,然后運用加權主元分析來對已經給定的三維模型轉變坐標,再借助3D離散傅里葉變化描述三維模型形狀,最后通過相應的范式來對三維模型間的相似性特征開展評價。通常來講,從幾何角度來提出數據信息和內容較為便捷,相似性評價效率也可以得到全面提升,但需要事先對模型開展PCA預處理,如果PCA對齊存在問題,那么就會直接影響到幾何變換檢索效率。
2)基于拓撲的三維模型內容檢索技術
因為幾何信息難以很好地描述幾何體型結構中的信息,這樣就會導致兩個結構較為相似的三維模型在幾何三維模型中難以實現有效檢索,相似度也會相對較差。結構信息在CAD模型中的重要性較為明顯,而拓撲結構能夠反映出模型內部單元的關聯關系,進而體現出模型的本質特征。在開展CAD設計時,結構需求也普遍大于幾何需求,為進一步滿足這一需求,隨之出現了拓撲三維CAD模型內容檢索技術。
模型拓撲結構基本上都需要在計算機中借助圖形或樹形結構來加以呈現,其中樹形結構較為簡單,且算法也更加及時有效。但需要注意是,樹形結構所表達的信息量較少,難以全面滿足實際需要[4]。從這一角度分析,基于內容檢索可以將模型通過圖的方式呈現,每一個圖中的結點都屬于一個單元模型,結點關聯關系即為單元之間的關系,當前,具有代表性的拓撲方法主要為以下幾類:其一即為基于屬性鄰接圖。屬性鄰接圖主要針對的模型即為B-Rep模型,在過程中可以將各個表面視為節點,面之間的相鄰關系即為圖結構,模型表面屬性與邊屬性就是圖節點和邊的屬性。從CAD模型的B-Rep表示中提取出MSG是一種極具代表性的工作模式,隨之將MSG轉變成為特征向量,應依照圖譜理論來將其劃分為多個較小子圖,最后再運用高維數據索引技術來支撐高效檢索[5]。其二為Reeb圖。Reeb圖即為通過圖節點來體現模型空間中相同屬性值的聯系區,同時使用圖邊來體現區域之間的相鄰關系,進而構成圖結構。在過程中相關工作人員可以選擇不同的屬性函數,然后將Reeb圖演化成為多個變種,基于積分測地距離的多分辨率Reeb圖三維模型檢索方式具有較強的代表性,其主要是以不同密度來對函數值進行劃分,這樣就會產生諸多不同分辨率的Reeb圖,進而節點之間的包含關系就可以確定成為父子關系,依照這種方式來開展層次式匹配,這對于三維模型有效識別有一定的幫助。
針對可視化數據挖掘工作來講,以往傳統的分析方式難以對海量數據進行全面且有效地分析,并且也難以實現可視化,而將可視化技術與信息獲取以及分析技術進行融合,就可以很好地幫助可視化數據挖掘工作有序開展[6]。但需要注意的是,在過程中需要對可視化模型和可視化對象以及可視化技術度量評測模型進行深入分析和探索,以下幾點即為可視化數據挖掘工作開展中需要注意的關鍵問題:
1)如何構建選擇需要描述的數據對象和挖掘過程以及結果準則等,如何建立科學有效的描述數據對象和挖掘過程及結果可視化模型等[7];
2)如何能夠科學給出評價可視化技術,并且如何建立度量指標和度量指標體系及度量模型等;
3)如何保障用戶可以直接參與到分析過程中,如何有效實現決策支持;
4)如何在可視化的用戶決策中有效替代一個分析過程中的多個步驟;
5)如何在難以自動生成決策時可以保障用戶借助可視化輔助支持來更好地完成各項決策。
當前,這些方面的研究和探索并沒有全面實現突破,因此,需要相關工作人員細致分析和思考如何有效解決數據挖掘可視化中存在的問題,這對于科學發展和數據運用有著十分重要的幫助[8]。另外,還應探索如何將可視化與數據挖掘及數據分析過程進行融合,在這一基礎上構建一個完善且統一的可視化數據挖掘工具是需要深入思考的課題。
數據挖掘需要在數據的支撐下完成,也是基于數據推動的一種歸納性學習方式,借助有效的數據分析不僅可以從中找出一些未知的知識,還可以發現諸多有用的知識?;诮5臄祿诰蚰J揭彩窃谶@一基礎上出現和發展的,即為從三維模型中提取知識和空間關系,也可以將沒有顯示出來的數據信息進行存儲,使相關人員更好地理解數據信息并發現空間數據以及相關屬性數據關系等,三維模型的構建可以通過簡單的方式來體現數據信息[9]。
針對建模數據挖掘的數據源來講,可以從要素類別這一層面將其劃分為空間數據和屬性數據兩種,隨之將其劃分為二維、三維、四維(時間維)以及不確定維等。另外,數據挖掘技術包含了統計分析和空間分析以及空間聚類等,建模數據挖掘在初期階段需要探究統計分析和三維緩沖區分析以及三維相交分析等,而關鍵技術則包含了三維建模技術與ArcGIS空間分析和基于SPSS Modeler的數據挖掘,工作開展思路即為如下內容:借助三維建模來建立三維模型,將其作為數據源,其中需要包含ArcGIS的三維模型格式轉換,并且還需要在這一基礎上開展三維空間分析,使用ArcGIS實時數據篩選并提取剖面數據信息,并運用SPSS Modeler軟件來對數據進行深度挖掘,最后再將挖掘到的數據內容體現到三維模型上,全面實現可視化表達。
在構建模型庫的過程中,其建立難度主要體現在三維建模的精模和低模轉化階段,在構建三維模型之前,應對數字資源進行全面收集和整理,資源主要包含了測量數據和設計圖紙以及常用模型的數據資源等,三維仿真系統中的模型資源庫是在三維靜態模型基礎上形成的,為確保靜態模型資源可以得到科學利用,需要設置模型信息分類存儲,這樣可以確保數據信息有效挖掘[10]。
靜態模型資源庫類型多樣,例如公共模型設施、水體模型以及建筑三維模型等,模型庫資源的構建運用了AutoCAD和3DSMAX,即為在AutoCAD中建立三維場景平面圖,然后將平面圖導入到3DSMAX中,這時就可以建立地面模型,同時科學分割地形與地勢,這樣就可以確保三維模型面數和貼面不會出現問題。在運用3DSMAX開展初始模型建立時,因為其造型能力相對較強,并且模型仿真和立體效果都有一定優勢,針對植物模型的創建來講,大部分植物建模的面數都相對較高,這樣就會產生諸多數據,當前植物建模效果展示真正應用植物模型較少,基本上都是以面為單元進行植物貼圖,這種方式也可以很好地體現出場景中的視覺效果,在這種三維模型構建完成之后,就可以借助三維仿真資源數據庫來開展管理與操作。
三維模型資源庫可以將模型劃分為諸多類型,例如高、中、低精度模型,這種仿真場景可以很好地滿足近景、中景以及遠景的不同需求,在攝影機跟隨路徑約束達到視圖遠景時,顯示的模型即為低精度模型,這樣就可以節省模型計算量,并且還可以實現實時交互的要求,反之則可以實現高精度的視覺要求。三維場景數據庫模型資源很好地體現出了真實環境中模型合并到虛擬場景中的細節效果反應,色彩強度也可以得到提升,進而更好地開展數據深度挖掘[11]。
計算機仿真技術在虛擬環境中構建三維幾何體模型雖然可以實現并體現交互效果,但針對實時仿真來講,其難以很好地滿足用戶對可視化視覺效果呈現的要求,三維物體性質可以融合并運用到動態模型,即從三維物體運行的位置和物體之間碰撞以及三維模型角度等方面來獲取信息。在過程中可以以視圖坐標為核心,然后以運動物體自身坐標的運動變化為軸向,在三維場景中,各個對象都有屬于自己的坐標,并且物體也可以以自身軸向開展運動,這一坐標即為自身坐標系統,同時這一坐標系統的位置也會隨著物體變化而出現移動、旋轉以及縮放等變化。針對三維動態建模來講,可以借助關鍵幀設置來更好地完成動態模型創建工作。另外,三維場景中還有一個世界坐標,場景中的所有模型都需要以這一坐標為核心,通常來講,動態現象建模主要運用的是粒子系統和動力學系統,水景與云霧以及水體模型建模在地形變化中的作用都十分明顯,并且也是科學體現建筑表現效果的關鍵內容,如果場景想要達到實時渲染這一要求,就需要運用粒子系統來完成水晶動態特效,然后再輸出動態文件,最后再將其借助貼圖紋理的模式呈現到場景已經建立好的面片中。針對虛擬對象reactor的空間綁定來講,其是配合粒子系統動力學系統實現的,也是一種物理建模方式,即為借助對虛擬物體進行空間綁定來確定reactor質量和重力以及物體反彈參數值等,從這一角度分析,將其與三維建模及仿真平臺進行融合就可以很好地呈現出一個虛擬的模型空間,以便為數據挖掘提供幫助和支持。
綜上所述,在三維建模中實施可視化數據挖掘是在虛擬層面實現了高層次數據挖掘,在此過程中需要有物理學和計算機圖形學的支撐,并且在一些環節中還會涉及動力學系統,即為三維模型的重力與摩擦力以及反彈值等。另外,除人機交互作用之外,還可以在計算機三維仿真系統平臺中體現出粒子系統與動力學系統,即為構建粒子系統動畫運行模型,確保虛擬仿真系統平臺可以實現自主化控制,在這種場景設定完成以后,用戶可以不用進行交互,這一層面的交互主要是指三維物體活動變化和周圍環境與運動實體間的動態關系,其在不受到用戶輸入控制下也能夠很好地完成數據挖掘。