蘇忠玉, 李 瑋, 李 晴, 孫 玉
(大連海洋大學 信息工程學院, 遼寧 大連 116023)
大量的高維數據在許多現代應用中變得越來越普遍,例如成像分析和數據分析。這些數據的巨大規模對計算速度和內存方面構成了巨大挑戰[1-2]。分析我國各省的經濟發展狀況應該從多方面考察,比如該省(自治區或直轄市)的工業生產總值、固定資產投資、居民消費水平、進出口等指標。但是,由于這些指標都是對經濟發展基本狀況的反映,它們自身之間就存在著較強的相關性,這樣在用這些指標反映經濟發展狀況時就造成了信息的大量重疊。這種信息的大量重疊有時甚至會抹殺經濟發展狀況的內在規律,所以如何能找到一組較少但卻包含著較多信息量的變量,抓住主要矛盾分析數據,同時使問題得到簡單化,成為了一個難題。本文提出的綜合數據分析方法解決了這一難題。利用主成分分析法使用SPSS軟件結合聚類分析,對31個省的經濟發展狀況進行了綜合數據分析,該結論將為我國各省的經濟發展和產業布局的科學規劃提供重要的數據分析依據。
本文提出了一種高效的綜合數據分析方法。首先,利用主成分分析法對31個省的經濟發展數據進行了分析,有效減少了數據的維數和提取了主要成分。其次,采用聚類分析方法對上述主要成分進行分類,進一步降低數據量,最終獲得綜合分析結果。
主成分分析是一種多元統計方法,利用降維的思想將多個指標轉化為多個綜合指標,并將信息的丟失最小化。……