金玉潔 王 超 王 潔
(南京市水利規劃設計院有限責任公司,江蘇 南京 210006)
高維數據處理的探索性數據分析方法從20世紀70年代以來不斷涌現,投影尋蹤分類模型是其中一種新的數據分析技術,它同時集合了統計學、數學和計算機科學,應用前景十分廣闊[1-3]。相對于其他數學分析模型,如熵權系數模型、主成分分析模型、灰色關聯度分析模型等,投影尋蹤模型深刻的理論背景、科學的計算依據及便捷的使用方法,使其應用優勢更為凸顯。目前,投影尋蹤分類模型在洪水分類[4],水資源利用效率評價[5],水質評價[6],洪水災情評估[7],生態環境質量評價[8],水土資源[9],甚至在房地產評估[10]中都得到了很好的應用,取得了豐碩的成果。工程方案的優選涉及很多因素,是典型的高維數據處理問題,筆者將投影尋蹤分類模型應用于河道清淤工程方案的優選,以南京市江寧區橫溪街道河道清淤工程為例進行實例分析,旨在為今后河道清淤工程方案的優選提供理論與實踐依據。
傳統的分析方法是假設數據服從某種分布,在此基礎上先假定、后模擬,最后進行檢驗,這種分析方法實際上是一種證實性數據分析方法[11]。投影尋蹤(projection pursuit,簡稱 PP)采用一種全新的思維,即直接審視數據,模擬數據結構,最后進行檢驗。因此,投影尋蹤分類模型被認為是一種用來分析和處理高維數據,尤其是處理非線性、非正態分布高維數據的一種新興的、科學的、有深刻理論背景的方法[12]。……