劉曉麗 劉毅娟 雷 鳴 何 旸
(華北理工大學冀唐學院 河北唐山 063000)
淺談粒度計算模型
劉曉麗 劉毅娟 雷 鳴 何 旸
(華北理工大學冀唐學院 河北唐山 063000)
近年來,人們開始將粒度計算應用到數據挖掘領域中,并初步取得了一些成果,成為當前數據挖掘領域一個新的研究方向。本文研究了模型中的粒度計算,淺談了幾類粒度計算模型。
數據挖掘 粒度計算 粒度計算模
1979年,美國數學家Zadeh在模糊集合論的基礎上,首次提出并討論了模糊信息粒化問題,推動了模糊邏輯理論及其應用的發展,但當時未引起普遍的重視。1985年,Hobbs提出一種粒度理論,在人工智能中將一個表示待求解的整體問題的邏輯公式用粒度理論方法分解成若干個小問題或子公式,然后分別對這些子公式求解并最后合并成整體公式的解。Hobbs在文中提出的這個模型實質上是把較大的整體粒度拆成較小的局部粒度,反過來又從較小的粒度合并成整體粒度解,但該文只是提出了這個模型的假設,并沒有給出粒度計算的規則,只是用謂詞或函數項定義了粒度和劃分粒度。T.Y.Lin等人于1997年正式提出粒度計算概念,隨后,在短短的幾年里,人們在各個不同的角度中廣泛研究粒度計算,但更多的還是從模糊集和粗糙集方面入手,目前粒度計算都是和這些學科結合起來,沒獨立成形。
1.粒度計算定義
L.A.Zadeh提出了人類認知的三個基本概念:粒化(granulation)、組織(organization)和因果(causation)。粒化指將整體分解為部分,組織指從部分合并為整體,因果指原因和結果的關聯。他進一步指出粒度計算是信息處理的一種新的概念和計算范式,覆蓋了所有有關粒度的理論、方法、技術和工具的研究。粗略地講,一方面它是模糊信息粒度理論、粗糙集理論、商空間理論、區間計算等的超集,另一方面是粒度數學的子集。具體地講,凡是在分析問題和求解問題中應用了分組、分類和聚類手段的一切理論與方法均屬于粒度計算的范疇。
2.粒度計算的基本問題
粒度計算主要涉及兩個方面的問題:粒的構造和利用粒作為對象的運算、推理。對于其中的每個問題都可以從語義和算法兩個方面來進行研究。
粒的構造涉及粒的形成、表示。在集合理論中,一個粒可以被理解為一個子集,在詞計算理論中,將語句作為一個模糊粒。
一個粒的構造可以采用自頂向下(top-down)的分解形成,也可以自底向上(button-up)的合成。分解或合成到什么地步以達到所需的粒度,一般來說是基于相互之間的關系來確定是不是應該合成或分解,有時也會借助于語義或領域知識的幫助。
具體說來,粒的構造包含以下三個方面的內容:
(1)構造粒的標準、準則。準則是用來確定、規定為什么不同的對象需要放到同一粒中,準則必須信息?;慕Y果對問題的本質有更深入的理解。
(2)構造粒的方法。構造?;蛘咝畔⒘;姆椒ㄊ菑乃惴ń嵌葋砜紤],也就是回答如何將不同的對象放到同一個粒中。
(3)粒的表示及描述。一旦粒化結束,也即粒已經構造好了,必須使用某種語言去描述它??梢越o不同層次的粒度標上標記,也可以用數學公式形式化地描述它,也可以用粒中的中心點來表示,或者可以通過描述不同粒度的范圍來區分不同的粒度。
(4)定性、定量分析。通過對粒的定性、定量分析,可以提取必要的規則。
3.粒度計算模型
目前有關粒度計算的理論與方法,主要有三個。一是Zadeh的“詞計算理論”(Theory of Works Computing),二是Z.Pawlak的“粗糙集理論”(Theory of Rough Set),三是國內的張鈸院士和張鈴教授提出的“商空間理論”(Theory of Quotient Space)。
(1)詞計算理論
Zadeh認為人類在進行思考、判斷、推理時主要是用語言進行的,而語言是一個很粗的“粒度”,如我們說“九寨溝的風景很美”,其中州良美”這個詞就比較“籠統”,也就是說其粒度很粗,如何利用語言進行推理判斷,這就是要進行“詞計算”,早在二十世紀六十年代Zadeh提出模糊集理論,就是“詞計算”的雛型。沿Zadeh的模糊集論的方向,用模糊數學的方法進行有關粒度計算的方法和理論的研究,就構成“粒度計算”的一個非常重要的方法和方向。這也是人們比較熟悉的一個方法。
(2)粗糙集理論
知識的含糊性包括:①語言的模糊性,如大小、多少;②數據的不完整性,如噪聲、干擾;③知識本身的粗糙性,如規則的前后間的依賴關系不確定性等。
波蘭學者Z.Pawlak在1982年首先提出了粗糙集理論,它不僅能夠在缺少關于數據的先驗知識的情況下,僅僅以觀測數據的分類能力為基礎,解決模糊或不確定性數據的分析和處理,而且算法簡單,易于理解。粗糙集理論把知識看成是對有關對象論域的劃分,而等價關系和由其產生的等價類則是關于的有效信息東或知識。
分類和概念形成的實際需要促進了理論的發展,目前粗糙集模型已成功應用于智能研究領域的方方面面,表現出巨大的實用價值和通用性、。為了本文以后的研究需要,本節敘述一些有關粗糙集的基本概念與記號。
(3)基于商空間的粒度計算
粒度概念可以用子集來表示,不同粒度的概念就體現為不同粒度的子集,一簇概念就構成空間的一個劃分—商空間(知識基),不同的概念簇就構成不同的商空間。故粒度計算,就是研究在給定知識基礎上的各種子集合之間的關系和轉換。以及對同一問題,取不同的適當的粒度,從對不同的粒度的研究中,綜合獲取對原問題的了解。這種對粒度的理解與模糊集對粒度的理解不完全一樣。
本文主要介紹了粗糙集理論和粒度計算模型的基本理論和相關概念。粒度計算是信息處理的一種新的概念和計算范式,覆蓋了所有有關粒度的理論、方法、技術和工具的研究,現己成為人工智能領域研究的熱點之一。主要討論了粒度計算的基本問題,三種不同模型。
[1]Hobbs,J.R.Granularity.In:Proc of IJCAI[Z],Los Angeles,1985:432-435.
[2]Zadeh,L.A.Fuzzy logic=computing with words[J],TEEE Transaction on fuzzy Systems,1996,2:103-111.
[3]Zadeh,L.A.Towards a theory of fuzzy information granulation and its centrality in human reasoning and fuzzy logic[J],Fuzzy Sets and Systems,1997,(19):111-127.
[4]粒度計算方法,趙立權,計算機工程與應用,2006(35):1-1.
[5]粒度計算與圖像匹配技術改進,汪建,電腦知識與技術,2013(33):50-53.