999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

歸納邏輯視野下的數據挖掘研究綜述

2012-08-15 00:53:20楊寧芳
關鍵詞:數據挖掘人工智能理論

楊寧芳

(1.西南大學邏輯與智能研究中心,重慶 400716;2.中國計量學院,杭州 310018)

歸納邏輯視野下的數據挖掘研究綜述

楊寧芳1,2

(1.西南大學邏輯與智能研究中心,重慶 400716;2.中國計量學院,杭州 310018)

對歸納邏輯思想在數據挖掘中的應用研究進行了綜述。國外的研究主要集中在人工智能方面,重點是高階歸納邏輯研究,通過多態歸納邏輯、機器學習等方面發展了歸納邏輯理論。國內的研究集中在知識發現方面,例如通過研究關聯規則等探討知識發現的內在機理。相對來說,國外的發展更偏重于應用領域,而國內也在不斷擴展歸納邏輯的理論應用,但在數據挖掘領域研究仍然偏少。

歸納邏輯;數據挖掘;知識發現;人工智能

主持人語:中國邏輯學會秘書長 鄒崇理研究員

本期的“邏輯學與科學方法論”欄目收錄的兩篇論文分別是關于邏輯哲學理論的闡述與邏輯方法應用之探析的。楊寧芳博士的《歸納邏輯視野下的數據挖掘研究綜述》一文系統梳理了國內外學界對于歸納邏輯思想在數據挖掘領域應用的研究,并總結了該研究在理論與實踐中的意義。陳昱竹的《蒯因論邏輯真理》一文則關注于邏輯哲學的核心——邏輯真理,該文在梳理萊布尼茨到維特根斯坦等前輩學者對邏輯真理的論述的基礎上,系統地介紹了蒯因從結構、代換、模型、證明和語法上對邏輯真理作出的不同于以往的闡釋。

一、歸納邏輯與數據挖掘的發展

科學發展史表明,歸納邏輯在推動科技進步、促進科技發展方面起著巨大作用,自然科學的經驗定律、經驗公式大都是應用歸納法總結出來的。隨著信息技術的發展,歸納邏輯在計算機應用方面得到了廣泛的發展,例如歸納邏輯與知識創新,歸納邏輯與人工智能,歸納邏輯與認知科學,歸納邏輯與科學決策,以及從應用歸納邏輯角度對人類思維的認知基礎與方法進行系統的研究等。知識發現與數據挖掘作為互聯網及相關產業的核心技術,有著廣泛的應用領域和發展前景,因此歸納邏輯和數據挖掘及知識發現的研究有著巨大的理論價值和應用價值。

數據日益增多的現實推動了數據挖掘和知識發現技術空前的繁榮。從保健管理到社群網相互作用,數據已經成為我們生活的組成部分。數據挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識的過程。該技術根據人們的特定要求,從浩如煙海的數據中找出所需的信息來,供人們的特定需求使用。從理論上說,數據挖掘就是在操作者的主動參與下進行知識發現的過程。知識發現是指在積累了大量的數據后,從中識別出有效的、新穎的、潛在的、最終可以理解并加以有目的運用的知識,該技術是信息化社會發展到一定程度的必然產物,是從宏觀角度利用積累數據進行知識抽象的高級階段。而歸納邏輯是指人們以一系列經驗事物或知識素材為依據,尋找出其服從的基本規律或共同規律,并假設同類事物中的其他事物也服從這些規律,從而將這些規律作為預測同類事物中的其他事物的基本原理的一種認知方法。從歸納邏輯和數據挖掘的定義來看,兩者之間存在著某種必然的聯系。兩者的聯系到底體現在哪些方面?如何將已有的歸納邏輯理論應用到數據挖掘中,從而為數據挖掘提供新的思路和新的技術和方法?這些問題的研究都具有很高的理論意義和現實意義。

據國外專家預測,隨著數據量的日益積累和計算機的廣泛應用,在今后的5至10年,數據挖掘將在中國形成一個新型的產業,應用領域包括設計、零售、金融、銀行、醫療、政府決策、企業財務、商業決策等,具有廣闊的發展前景。應用歸納邏輯提升數據挖掘在相關領域的技術和方法,不僅具有實用價值而且具有巨大的經濟價值。如果能夠找到新的數據挖掘技術和方法,將帶來非常大的經濟利益。

隨著人們認識與研究的深化,尤其是現代科技和社會的發展、信息化時代的到來,人們原有的對問題的描述處理工具和方法受到嚴峻挑戰,現實要求研究必須是經驗與理性的結合,必須以現實世界的實際問題為出發點,而不是以公理為出發點,因而歸納邏輯的作用顯得尤為突出。這在人工智能、知識工程、虛擬技術、網絡化和數據挖掘等的需求中充分地表現了出來。以人工智能研究為例,誠然,演繹邏輯是計算機科學的理論基礎,但人工智能研究卻離不開歸納邏輯。可以說,沒有歸納邏輯,特別是沒有現代歸納邏輯,就沒有人工智能研究。在人工智能研究過程中,一些計算機專家不得不踏入歸納邏輯領域,從而也推動了歸納邏輯理論的進一步發展,同樣,歸納邏輯理論也必然會推動數據挖掘技術和方法的探索。

目前,歸納邏輯研究的重點正從理論體系構建逐漸轉向實際應用。本文沿襲這一發展趨勢,通過研究歸納邏輯,為數據挖掘技術提供新的理論支持,同時為邏輯學界擴展了一個新的應用領域,為歸納邏輯的發展提供了動力。通過將歸納邏輯理論應用于數據挖掘以及知識發現中,以及將計算機邏輯和人腦邏輯之間的運行機制進行比較,必將對數據挖掘算法的研究產生影響,推動其更新。

二、國外研究現狀

20世紀40年代到70年代是國外歸納邏輯蓬勃發展的時期,現代歸納邏輯分成了四大派別,即經驗主義學派、邏輯貝葉斯主義學派、主觀貝葉斯學派(頻率學派、邏輯學派)和私人主義學派。這一階段取得了很多成果,也遇到了不少難題,隨后邏輯學界對歸納邏輯的研究逐漸減弱。80年代之后人工智能的學者進入了這個領域,他們汲取邏輯學的思想精華,不斷推出新的成果,為歸納邏輯的研究帶來了生機和活力。人工智能領域機器學習的核心是歸納學習問題,與歸納邏輯有關的機器學習方式主要有:示例學習、基于說明的學習、啟發式學習、類比學習、聯結主義學習等。這些方面的研究使人們重新開始重視歸納邏輯的相關研究。

國外新的歸納邏輯理論研究較少,只有Jürgen Landes、Jeff Paris和 Alena Vencovská介紹了多態歸納邏輯,提出一些de Finetti風格的、滿足譜交換的概率函數[1]。目前大部分最新的研究集中在高階歸納邏輯程序和數據挖掘的研究方面。歸納邏輯與歸納邏輯程序在研究對象上是一致的,都以歸納為研究對象。只不過歸納邏輯側重于歸納推理,強調理論研究,它的目標主要是追求理論上的協調與完美;而歸納邏輯程序設計則側重于模擬人類最初的歸納思想,也即亞里士多德提出的從個別到一般的過程,它以實用性和效益為出發點,例如運用高階歸納邏輯程序設計以解決形式相關的數據挖掘方法存在的問題。例子、背景知識、假設和目標的概念都可用于高階邏輯程序設計語言。這種程序設計語言能夠描述復雜數據所表達的語意和模式,明確地支持包括圖形在內的各種不同的數據類型。

David、Skillicorn和Yu Wang提出歸納邏輯是機器學習與邏輯程序的交叉點,其應用越來越廣泛,對數據挖掘的方法有很好的指導意義[2]。他們認為可以從實例提煉歸納邏輯研究構架,從子句提供邏輯。這樣就提供了一個統一的表現形式和表達手段的例子、背景知識。而由此引起的理論都是表達的一階邏輯。這樣一種富于表現力的表達非常重要,所以人們會很自然地考慮運用平行度提高歸納邏輯數據挖掘的性能。他們提出一個并行化技術,并實施了一個核心歸納邏輯程序設計系統:Progol。該技術提供了一個最理想的分割計算數據訪問和交流需求的手段,使線性加速很容易實現。同時他們還討論,為什么信息流程的技術允許在多個數據集的性能結果和平臺報道中使用線性加速標準序列的算法。

Luc de Raedt提出值得注意的幾個問題,推理涉及不確定性、數據挖掘、機器模擬學習。他重點介紹基于邏輯編程方法的原則[3]。他關心形式化和系統、實現和應用,以及理論歸納邏輯程序設計的概率。他同時介紹了概率歸納邏輯程序;而且詳細介紹了機器學習中最重要的概率邏輯關系的形式化和系統等技術,并應用馬爾可夫的邏輯、棱鏡系統、貝葉斯邏輯程序、自主選擇的邏輯進行程序設計。

哲學邏輯的發展中,模態邏輯、道義邏輯、多值邏輯,包括量子邏輯越來越受到關注。而歸納邏輯相對關注度在下降,目前歸納邏輯思想主要體現在歸納邏輯程序設計、人工智能、知識發現等方面。數據挖掘則建立在高階的歸納邏輯程序設計的基礎上。

三、國內研究現狀

與國外相比,國內對數據挖掘的研究起步稍晚,沒有形成整體力量。1993年國家自然科學基金首次支持該領域的研究項目。目前,國內的許多科研單位和高等院校競相開展知識發現的基礎理論及應用研究。其中,北京系統工程研究所對模糊方法在知識發現中的應用進行了較深入的研究;北京大學也在開展對數據立方體代數的研究;華中理工大學、復旦大學、浙江大學、中國科學技術大學、中科院數學研究所、吉林大學等單位開展了對關聯規則開采算法的優化和改造;南京大學、四川大學和上海交通大學等單位探討、研究了非結構化數據的知識發現以及Web數據挖掘。

國內在歸納邏輯和計算機技術結合方面,王雨田首先倡導并開展了概率邏輯與人工智能相結合的研究。他提出將現代歸納邏輯與人工智能“嫁接”起來的設想,并建立了一個包括邏輯工作者和計算機工作者的課題組。我國學者鞠實兒、陳煒、陳曉平、韓建超等在這方面做了大量的工作。其他學者包括任曉明、何向東、桂起權、熊立文、楊炳儒等也在這方面取得了相關的研究成果。

桂起權認為,經典邏輯(尤其是歸納邏輯)的研究已經進入新階段,不僅突破了經典演繹邏輯的狹隘眼界,而且開始突破純粹邏輯學家的圈子,計算機人工智能研究者已經加盟于歸納邏輯知識創新的事業。歸納邏輯學者不再僅僅滿足于公理系統的抽象的形式美,而是更多地考慮人工智能應用研究的新特點和新要求,并與之接軌。在科學哲學、人工智能和歸納邏輯的交叉點上已經出現了一個新的研究領域。

劉宏嵐、高慶獅、楊炳儒提出:標準概率邏輯系統是標準概率空間的邏輯表示。其中命題是隨機事件的語言表示,命題的真值是命題所表示的事件的概率,真值滿足概率的公理化定義,具有概率的一切性質;命題間的關系是命題所表示的事件間的關系;命題的邏輯運算是事件運算的邏輯表示。概率邏輯中,命題或命題公式間的相等關系有兩個層面:等值和等義。其中等值就是真值相等[4]。

崔陽、楊炳儒提出關聯規則挖掘一直是數據挖掘領域中最重要、最活躍的研究內容之一[5]。關聯規則描述事物之間的關聯性,但是通過支持度和置信度這兩個評價標準可知,關聯規則的挖掘過程中僅僅關注聯合概率表的一部分,因此存在著無法完全反映出事物間相關性的缺點。針對這一問題,研究者通常采取一些關聯分析方法,對得到的關聯規則挖掘結果作進一步分析,以便盡可能多地獲取有意義的和用戶感興趣的規則,但尚不能完全克服上述缺點。

因果關聯規則是一類特殊的關聯規則,指規則的前件與后件之間存在因果關系,由于“因”的出現而導致“果”的發生。因果關聯規則與一般關聯規則的不同之處在于:前者規則的前件與后件之間不但具有關聯性,而且具有因果性;前者可以使用較為完備的推理機制進行推理。有關因果關聯規則的挖掘,目前專門的研究還不是很多。但實際上因果關聯規則是知識發現中一個重要的知識類型,它能夠反應客觀事物之間更為本質和內在的聯系。之所以選擇廣義歸納邏輯因果模型,主要是考慮到其具備較好的歸納推理機制,有利于在此基礎上形成不確定性因果歸納推理的計算模型和自動推理機制。

李琳娜、楊炳儒提出,邏輯的復雜結構歸納學習方法的成果最早見于基于一階邏輯知識表示方式歸納邏輯程序設計(Inductire Logic Programming,LIP),繼而出現了基于高階邏輯的復雜結構學習方法[6]?;诟唠A邏輯的復雜結構學習方法涵蓋并拓展了基于一階邏輯知識表示方式的ILP方法的學習能力。他們首先介紹基于一階邏輯知識表示方式的ILP方法,然后在分析一階邏輯與高階邏輯知識表示方式及其學習機制之間區別和聯系的基礎上,介紹基于高階邏輯的復雜結構學習方法。目前,ILP已經在知識獲取、科學發現以及邏輯程序設計方面取得了許多重要成果。

梁開健、梁泉、楊炳儒提出隨著數據量的海量擴張、數據類型的復雜化,矛盾知識的問題越發突出,成為KDD領域中一個亟待解決的問題[7]。通過對知識發現內在機理的研究,探討在動態的知識發現過程中矛盾知識的產生原因以及矛盾區間的求解方法,對解決當前所面臨的若干難題將具有一定的理論和實踐意義。

四、國內外研究之比較

從對國外和國內的研究現狀的梳理可以看出,國外研究主要集中于高階歸納邏輯程序設計方面,以實際應用為主。國內學者也開始注重歸納邏輯的應用問題,目前主要將歸納邏輯應用于人工智能和知識發現,但很多研究都是介紹性的,缺乏具體的應用實例。而我們想將數據挖掘這一目前熱門的應用問題和歸納邏輯理論結合起來,相對來說,國內外相關研究仍舊較少。通過對這個問題的研究,希望能推動我國數據挖掘方法和技術的進一步發展,將歸納邏輯理論應用于數據挖掘中,從而使其更好地應用于實踐。

五、在歸納邏輯的視野下研究數據挖掘的創新之處

1.理論上的創新

首先,相關研究從歸納邏輯和數據挖掘的角度分別深入研究了兩者的特征,對數據挖掘的理論基礎進行了總結概括,探討了如何將已有的歸納邏輯理論應用于數據挖掘。研究涉及凱恩斯類比理論在數據挖掘中的應用,萊辛巴赫、卡爾納普的歸納邏輯思想,勃克斯歸納邏輯機器哲學在數據挖掘中的體現,以及科恩的歸納邏輯理論在數據挖掘中的應用和馮賴特的條件化歸納邏輯與數據挖掘。研究思路主要是試圖通過對歸納邏輯思想的探討,挖掘出有價值的方法將其應用于數據挖掘。這些研究領域和研究內容都具有創新性。

其次,數據挖掘研究為歸納邏輯的理論發展提供了重要的支持。歸納邏輯的研究方法可以借助于數據挖掘搜集數據的方法,數據挖掘應用可以對歸納邏輯理論進行評價和判斷。數據挖掘產生的新問題,可以用歸納邏輯理論進行解釋和說明。數據挖掘的算法和技術對歸納邏輯方法的進步也有重要作用。通過我們的研究,最終將為豐富和發展歸納邏輯理論提供一定的思路。

2.技術上的創新

基于歸納邏輯視野下的數據挖掘豐富和發展了現有的數據挖掘的技術模式。一方面優化了現有的方法,另一方面也為新的數據挖掘技術方法的出現奠定了基礎。從歸納邏輯的視野研究計算機技術,目前主要在人工智能領域應用較多。我們將其應用于數據挖掘以及知識發現必將豐富和發展數據挖掘技術和方法,在技術上進一步推進相關領域的研究的發展。

[1]Jürgen Landes,Jeff Paris,Alena Vencovská.Some Aspects of Polyadic Inductive Logic[J].Studia logica,2008,90(1):17 -23.

[2]David B,Skillicorn,Yu Wang.Parallel and Sequential Algorithms for Data Mining Using Inductive Logic[J].Knowledge and Information Systems,2001,3(11):405-421.

[3]Raedt Luc de.Inductive Logic Programming [M].[S.l.]:springer verlag gmbh,2011.

[4]劉宏嵐,高慶獅,楊炳儒.概率命題邏輯中命題相等關系的兩個層面與命題演算[J].哲學研究,2009(10):113-120.

[5]崔陽,楊炳儒.知識發現中的因果關聯規則挖掘研究[J].計算機工程與應用,2009(31):9 -11.

[6]李琳娜,楊炳儒.復雜結構歸納學習研究[J].計算機工程與應用,2008(5):1-6.

[7]梁開健,梁泉,楊炳儒.動態KDD過程中矛盾規則的研究[J].計算機應用研究,2006(1):79 -81.

Data Mining from the Perspective of Inductive Logic

YANG Ning-fang1,2
(1.Logic and Intelligence Center,Southwest University,Chongqing 400716,China;2.China Jiliang University,Hangzhou 310018,China)

The induction logic thought in data mining application of relevant research is reviewed in this paper.Foreign researches mainly focus on artificial intelligence,and the major point is the high order induction logic research.Through polymorphism inductive logic,machine learning,etc.,the inductive logic theory is developed.The domestic research focuses on the knowledge discovery,such as the formulation of association rules and discusses the inner mechanism of knowledge discovery.Relatively speaking,foreign development puts more stress on the fields of application;and the application of the inductive logic theory is also expanding domestically,but in data mining field,the study is still inadequate.

inductive logic;data mining;knowledge discovery;artificial intelligence

B81

A

1674-8425(2012)05-0006-04

2012-02-29

楊寧芳(1970—),女,浙江仙居人,哲學博士,副教授,碩士生導師,研究方向:論證理論。

(責任編輯 王烈琦)

猜你喜歡
數據挖掘人工智能理論
堅持理論創新
當代陜西(2022年5期)2022-04-19 12:10:18
神秘的混沌理論
理論創新 引領百年
探討人工智能與數據挖掘發展趨勢
相關于撓理論的Baer模
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
主站蜘蛛池模板: 国产精品美女免费视频大全| 午夜激情福利视频| 丁香六月激情综合| 亚洲男女天堂| 91av成人日本不卡三区| 97在线免费视频| 永久免费AⅤ无码网站在线观看| 国产第八页| 99re在线视频观看| 日本免费高清一区| 666精品国产精品亚洲| 国产日韩欧美中文| 激情乱人伦| 国产美女视频黄a视频全免费网站| 国产成人精品无码一区二| 亚洲一区二区三区中文字幕5566| 精品国产福利在线| 国语少妇高潮| 9久久伊人精品综合| 波多野结衣无码中文字幕在线观看一区二区 | 日韩天堂视频| 性激烈欧美三级在线播放| 精品国产www| 精品一区二区三区水蜜桃| 99色亚洲国产精品11p| 欧美在线国产| 激情在线网| av在线5g无码天天| 国产成人亚洲毛片| 免费在线国产一区二区三区精品| 毛片在线播放网址| 免费激情网址| 伊人中文网| 免费看美女自慰的网站| 精品国产自在在线在线观看| 欧美一道本| 一区二区三区四区日韩| 伊人久久大香线蕉综合影视| 亚洲欧美不卡视频| 在线中文字幕网| 欧美不卡视频一区发布| 国产在线精品香蕉麻豆| 找国产毛片看| 美美女高清毛片视频免费观看| 国产九九精品视频| 久久久精品无码一区二区三区| 欧美人在线一区二区三区| 国产欧美性爱网| 99久久精彩视频| 伊人精品视频免费在线| 国产一区二区人大臿蕉香蕉| 日本欧美视频在线观看| 亚洲欧美日韩中文字幕在线| 波多野结衣一二三| 国产精品手机视频| 成人无码区免费视频网站蜜臀| 91青青视频| 一级福利视频| 亚洲中文精品人人永久免费| 国产视频一二三区| 99久久精品无码专区免费| 日韩久久精品无码aV| 小说区 亚洲 自拍 另类| 草草影院国产第一页| 欧美黄网站免费观看| 亚洲IV视频免费在线光看| 99re热精品视频国产免费| 视频在线观看一区二区| 亚洲日本中文综合在线| 欧美天天干| 精品剧情v国产在线观看| 国产色伊人| 97人人模人人爽人人喊小说| 国产办公室秘书无码精品| 亚洲午夜福利在线| 欲色天天综合网| 欧美日韩精品综合在线一区| 国产在线观看精品| 国产一国产一有一级毛片视频| 亚洲av片在线免费观看| 亚洲中文字幕在线精品一区| 九九九精品成人免费视频7|