人工智能教育研究專家系統構建框架及實施

2020-01-10 00:31:51李強

天津市教科院學報 2020年1期

李強

人工智能(Artificial Intelligence,縮寫AI),最常見的定義有兩個：一是馬文·明斯基(Marvin Lee Minsiky美國人工智能學者)提出的“人工智能是一門科學,是使機器做那些人需要通過智能來做的事情”；另一是尼爾森(Nils John Nilsson 美國人工智能學者)提出的“人工智能是關于知識的科學”,研究知識的表示、獲取和運用。[1]通俗地講,人工智能是制造近似人類接受信息(看、聽、感受),處理信息(分析、判斷),產生結果(表達、行為)的機器或系統,盡可能替代人類實現人類社會行為。該領域的研究主要有機器人、語言識別、圖像識別、自然語言處理和專家系統等,專家系統是其中最令人矚目的熱點。

一、專家系統及其結構和功能

(一)什么是專家系統

專家系統,縮寫為ES,是智能化的計算機程序系統,其內部含有某領域豐富的專家水平的知識與經驗,能夠利用人類專家的知識和解決問題的方法,模擬人類專家處理復雜問題。有學者(Firebaugh)比較了人類專家和專家系統,認為專家系統的主要特征應該包括解決問題、學習、重構知識、打破規則、了解自己的局限、平穩降級以及保持簡單的推理引擎和利用冗余性。[2]

在發展初期,ES就是一類“問題求解”的計算機程序,可以輔助人們進行定理證明和邏輯推理,但還不能解決復雜的實際問題,因為復雜的實際問題還不能用計算機理解的方式表達,計算機還不能“看懂”。1965年,圖靈獎(Turing Award)獲得者,最早倡導“知識工程”(Knowledge Engineering)的美國人工智能專家愛德華·費根鮑姆(Edward Albert Feigenbaum)與諾獎獲得者、遺傳學家萊德伯格(Joshua Lederberg)合作,在總結“通用問題求解系統”成敗經驗的基礎上,開發了世界上第一個專家系統程序DENDRAL。DENDRAL 中保存著化學家的知識和質譜儀的知識,可以根據給定的有機化合物的分子式和質譜圖,從幾千種可能的分子結構中挑選出一個正確的分子結構。DENDRAL 的成功被認為是人工智能研究的一個歷史性突破。

至今,ES的發展經歷了三代：第一代就是以費根鮑姆的DENDRAL 為代表,具有高度專業化、求解專門問題能力,但體系結構的完整性、可移植性、系統透明性和靈活性等方面尚不足,求解問題能力尚弱。第二代以著名的MYCIN(也是費根鮑姆的研究小組研制的)為代表。MYCIN 是較著名的幫助醫生診斷傳染病和提供治療建議的ES。MYCIN體系結構較完整,移植性有所改善,而且其人機接口、解釋機制、知識獲取技術、不確定推理技術、增強ES的知識表示和推理方法的啟發性、通用性等都有改進。第三代屬多學科綜合型系統,采用多種人工智能語言,綜合采用多種知識表示方法和推理機制及控制策略,并開始運用知識工程語言、骨架系統及ES開發工具來研制,典型的如HPP’－80。

近年來,在總結前三代ES的設計方法和實現技術的基礎上,已開始研發新一代ES。第四代ES采用“多ES高度集成協同”的工作模式,具備高級描述語言和知識表示語言、高級人工神經網絡知識獲取和學習功能、全新的推理機制、糾錯和自完善能力、先進的智能人機接口等,實現多知識庫、多主體型的ES。ALPHAGO 系統就是典型的代表之一。

(二)專家系統的基本結構

1.知識庫。知識庫用來存放專家提供的知識。知識庫包含所有用“如果：〈前提〉,于是：〈結果〉”形式表達的領域知識規則。人工智能中的知識表示形式有很多種,ES中常用“產生式規則”。ES的問題求解過程就是通過知識庫中的知識來模擬專家“思考”的,因此,知識庫是決定ES質量水平的關鍵,知識庫中知識的質量和數量決定著ES的質量水平。

2.綜合數據庫。綜合數據庫中包含求解領域問題的世界范圍內的事實和斷言。它還用于存儲推理過程中所需的原始數據、中間結果和最終結論。

3.推理機。又稱規則解釋器,它運用控制策略(推理程序)為ES用戶找到可以應用的知識規則。推理機針對當前問題的條件或已知信息,反復匹配知識庫中的規則,獲得新的結論,以得到領域問題求解結果。

為使計算機能“理解應用”某領域專家的專業知識,必須要采用計算機能“懂”的方式表示知識。目前常用的知識表示方式是產生式規則,基于規則的產生式系統是由知識庫、綜合數據庫和推理機三部分組成,因此,知識庫、綜合數據庫和推理機組成了ES的核心。

4.人機界面。也稱人機交互界面,是ES與用戶進行交流的界面。通過該界面,用戶輸入基本信息、回答系統提出的相關問題,系統輸出推理結果及相關的解釋信息等。

5.解釋器。解釋器能夠根據用戶提問對結論、求解過程作出說明,因而使ES更具人情味和可信度。例如,ES可以通過解釋器向ES用戶解釋系統為什么要向用戶提出該問題,計算機是經過怎樣的推理過程得出最終結論的,等等,這使ES不僅為用戶提供問題答案,而且提供該答案的可信度估計。

6.知識獲取。通過“知識獲取”模塊,專家和用戶可以擴充和修改知識庫中的內容,因此它是ES知識庫構建和不斷提升水平的關鍵。將來甚至可以逐步實現知識庫自動學習功能。

(三)專家系統的基本功能

ES基本工作流程是：用戶通過人機界面回答系統的提問,推理機將用戶輸入的信息與知識庫中規則進行匹配,并把匹配結論存放到綜合數據庫中。最后,通過人機界面將最終結論呈現給用戶。因此,ES一般都具備以下主要功能：

存儲功能——存儲問題求解所需的知識、具體問題求解的初始數據和推理過程中涉及的各種信息。

推理功能——根據輸入的數據,利用已有的知識,按照推理策略解決問題,并能夠對推理過程、結論或系統自身行為作出必要的解釋。

更新功能——提供知識獲取、機器學習以及知識庫的修改、擴充和完善等維護手段,以有效地提高系統自身的問題求解能力及準確性。

表達功能——提供用戶接口,便于用戶使用,又便于分析和理解用戶的各種要求和請求。

上述諸多功能中,存儲和推理是ES的兩個最基本的功能。

ES是一個基于知識的系統,它利用人類專家提供的專門知識,模擬人類專家的思維過程,解決人類專家都可能難以面對的問題。因此,高性能的ES應具備啟發性、透明性及靈活性特征。[3]

(四)專家系統構建的條件和原則

1.技術性條件。ES雖然是基于“知識”的系統,但其對“知識”有一定要求。ES對“知識”及其所屬領域的要求是其構建的技術性條件,這類條件主要有以下幾方面：在該知識領域有真正公認的專家；該領域專家對該領域知識相關問題的答案基本一致；領域專家能夠描述和解釋他們解決領域問題的方法；領域知識容易獲得；涉及的相關問題難度不太大,范圍不寬泛；用戶給出的任務很好理解,而且不是太新；用戶給出的任務不涉及大量常識。

2.經濟性條件。ES構建需要耗費大量人力和財力,在構建前,還需要評估ES未來實用價值,這是ES構建的經濟性條件,這類條件主要有以下幾方面：應用領域對構建ES的需求程度如何?任務完成或問題解決是否帶來較高效益?領域問題解決過程是否適用ES的技術路線?領域內人類專家是否稀少,專家知識是否昂貴?領域內人類專家是否損失嚴重,問題解決代價是否較高?問題解決環境是否不友好甚至具有危險性?

3.構建基本原則。相關研究者和設計者一般比較強調以下原則：

其一,專門性原則。ES要面向專業性強的專門任務。用戶提出的任務要具體明確,指向性強,能較快產生具體經濟或社會效益。

其二,最小化原則。ES的構建要堅持“最小系統”原則,針對領域問題解決采用最核心最原型的系統設計,首先實現解決最核心問題的功能,以后逐步修改、擴充和完善,這也盡量降低初期成本。

其三,合作性原則。ES的構建和發展需要領域專家、知識工程專家等多方專家合作以及直接用戶的參與。多方合作參與不僅可以提升工作效益,而且對知識獲取水平的提升具有重要意義。尤其是對于規劃型、預測型的ES,意義就更加重大。[4]

其四,工具輔助原則。由于近來ES 開發工具的發展,以及ES開發任務復雜程度的快速提升,ES開發工作越來越需要借助良好的開發工具支持。

二、教育研究ES的基本框架

(一)什么是教育研究

教育研究,一般是指以教育科學理論為基礎,以教育領域內發生的現象為對象,以探索教育內在規律為主要目的,以教育規律指導推進教育實踐改革和發展為主要作為的創造性社會活動。

教育研究的主要類型包括基礎研究、應用研究、評價研究、行動研究和取向研究。[5]一般意義講,一項規范的教育研究工作或者活動要包含以下環節：選擇研究方向,聚焦研究問題,立項研究課題,實施研究計劃,總結研究成果,落實成果轉化,追蹤轉化效果,發現新研究問題。

為方便“教育研究專家系統構建”主題的表述,這里以國家或省市級教育規劃課題研究為標準,本文此后論及的教育研究均指教育規劃課題研究。

(二)教育研究的過程和關鍵環節

按照教育規劃課題研究的一般要求,研究課題立項才是規范的教育研究的真正開始,《教育規劃課題管理辦法》[6]一般要求研究者填寫課題申請評審書,其中規定要填寫的重要內容包括以下幾方面：

第一部分,課題名稱、主題詞、研究類型和研究成果形式等。

第二部分,課題設計論證,其中要填寫“選題”“內容”“價值”“研究基礎”。“選題”中要寫出本課題國內外研究現狀述評和選題的意義；“內容”中要填寫本課題研究的主要思路(包括視角、方法、途徑、目的)和重要觀點(提出研究假設)；“價值”中要填寫本課題的創新程度、理論意義和應用價值；“研究基礎”中要填寫研究者已取得的相關成果和主要參考文獻。

其余部分,包括完成課題的條件和保證、課題組已經取得的相關成果、預期成果形式和安排、經費預算、推薦專家和單位意見、評審意見和結果。[7](具體內容略)

規范的教育研究一般包括以下關鍵環節：

1.聚焦問題。現實社會中教育現象豐富多彩,教育問題復雜多樣,作為規范的教育研究,必須首先聚焦研究的核心問題,確定具體研究范圍和問題域。要完成這個聚焦的過程就要搜集查閱國內外大量的相關研究資料,對其中相關的研究觀點進行全面考察和評述,要根據研究意義、價值、創新從優的取向,發現有價值的研究新層次、新角度和新問題。

2.提出假設。在確定了研究新問題之后,依據專業規范,設計和表述研究假設。研究假設要具備科學性、明確性、可檢驗性。按照性質和復雜程度分,研究假設包括描述性假設、解釋性假設、預測性假設、條件式假設、差異式假設、函數式假設等。(研究假設是ES構建中的重要問題。)

3.設計方案。就是根據研究假設的需要和研究者的實際能力,具體制定研究技術實施計劃,包括研究課題的具體表述、研究類型的確定、主要研究方法的選擇、研究技術路線的規劃以及研究成果的預期設計等。

4.實施研究。依據研究技術路線,在設計的范圍或層次內具體落實研究計劃和步驟。遵循計劃的研究思路和方法,搜集整合分析研究對象的反饋信息,積極印證研究假設。同時,客觀分析研究獲得的信息,若發現與研究假設不符的證據,要予以重視,認真分析,必要時積極調整研究技術路線,甚至調整初始的研究假設。

5.總結成果。根據研究計劃總結研究結論,并形成研究成果。提出研究結論要慎重,總結研究成果要全面,評價研究成果要密切聯系實際。總結研究成果時還要認真反思本研究的局限和不足。

6.成果轉化。按照研究計劃,積極推進成果轉化。成果轉化有兩個目的,一是落實研究成果的經濟社會價值；二是發現研究成果的不足,以引出新的更深層次的研究問題。

實踐證明,教育研究水平甚至成敗的關鍵更多取決于前文所述的第一、二、三環節,特別是研究者能發現和選擇一個好的研究問題,準確表述這個研究假設。有研究者認為,選題有三個來源：有爭議的理論問題、亟待解決的實際問題和寫作中生成選題。[8]

(三)教育研究ES構建的可行性

教育研究是一項復雜的社會活動,從準備、立項、實施到總結、轉化,從計算機技術視角看,是個包含多層子系統、關系復雜、用戶問題復雜多樣的大系統。這樣復雜的大系統,是否需要構建ES,是否可能構建ES 等重要問題需要進行認真考察和整體分析。

1.對教育研究ES的經濟性條件進行考察

教育研究領域和用戶是否真的需要ES?回答應該是肯定的。依據：一是,教育研究本身專業性較強,從準備、立項、實施到總結、轉化,需要依據專業性較強的視角、方法和思路去設計、實施和評價,因此,承擔者在教育研究全過程和各個重要環節都需要專家級的觀點和技術支持。二是,隨著國家教育事業改革實踐的不斷深入和發展,“群眾性”教育研究越來越受到重視,國家教育事業各層面的工作都希望積極開展教育研究,在教育研究的指導下不斷推進,使較多專業水平和經驗相對不足的承擔者也積極參與進來,他們特別需要教育研究ES的支持。三是,隨著國家經濟社會的形勢發展,對教育研究的成果水平要求越來越高,對教育研究成果的轉化服務范圍和層次要求越來越廣,越來越細。這都要求教育研究承擔者需要ES的多層次多方面的支持。四是,隨著中國特色社會主義教育事業發展新階段對教育學學科發展的新要求,以及哲學、心理學、生理學、社會學、倫理學等教育學相關學科的研究和發展,我國教育學學科在新階段的政治性、科學性、專業性、服務性等亟待進一步增強,教育學學科的新概念、新觀念、新思路、新范式都需要積極研究,需要ES的支持和輔助,以盡快形成我國新階段教育研究的新特征、新趨勢和新成果。

2.對教育研究ES的技術性條件進行考察

教育研究領域是否有真正公認的專家?回答是有的。這里討論的“教育研究”是特指教育規劃課題研究,而不是泛指一般教育問題的研究。這里討論的教育研究ES是支持和輔助教育規劃課題研究的準承擔者在實踐探索和理論考究中發現研究新問題,將新問題轉化為一個符合教育科研規范的課題,并進行研究實施設計,以至輔助研究實施,取得研究成果。全國教育科學規劃領導機構,以及各省市自治區級的教育科學規劃領導機構,都有公認的教育研究專家。教育研究領域專家對該領域的“知識”相關問題是否有基本一致的答案?回答也是有的。但這個回答的依據較復雜,需要比較全面的分析：一是,關于教育規劃課題研究的規范和要求的“知識”問題是有一致的答案的,這個內容在各級別課題管理辦法中都已明確寫明。二是研究類型和研究技術路線等設計方法和規范的“知識”問題也都有一致答案,這是教育學科本身的要求。例如定量研究的基本規范、調查法的基本要求等。三是關于具體課題的命題及主要研究假設的設計和表述“知識”問題是否有一致答案?這個問題比較復雜,因為具體課題和假設涉及了教育學科的基本理論問題及教育學各分支、交叉學科的基本理論問題。不同的專家因研究領域、視角和層次的不同,對某個研究領域內的“知識”問題可能答案不一致。但是,作為本文討論的教育研究ES來講,這個不一致也不是障礙,將構建的教育研究ES的主要功能和目的是輔助準課題承擔者把自己選定的研究問題設計意向轉化為符合教育規劃課題研究規范的課題命題和假設,而這個轉化過程可以與未來構建的教育研究ES的“綜合數據庫”中已有的、規范結題的相同領域和類型的課題命題和假設相比較而部分或全部實現。

3.教育研究ES構建如何落實ES構建原則

首先,教育研究ES 要堅持專門性原則。要討論教育研究ES將來要面向哪些專業性強的專門任務,解決教育研究中的哪些專門任務能較快產生具體經濟或社會效益。如果我們將教育研究整個大系統按照前文所述劃分為“聚焦問題”“提出假設”“設計方案”“實施研究”“總結成果”“成果轉化”6個子系統,那么就要依據已有的教育研究經驗和未來教育研究的發展需要,研究確定這6個子系統中哪些專門任務是最重要的,或者說其中哪些專門任務是用戶最需要求助ES的。

要準確回答這個問題,必須進行深入的調查研究和較全面的教育研究成果文獻研究。筆者就此提出一些假設性觀點,供相關研究參考：“聚焦問題”中的文獻全面綜述、“提出假設”中的假設準確表述、“設計方案”中的研究方法和創新點恰當選擇、“實施研究”中的研究技術路線的保證和重要信息的獲取、“總結成果”中的研究重要信息的分析評價、“成果轉化”中的成果轉化局限分析評價等。這些專門性任務可能是未來教育研究ES構建的重點。

其次,教育研究ES的構建要堅持最小化原則。針對教育研究領域問題解決采用最核心最原型的系統設計,實現解決最核心問題的功能。未來研究中,可以依據具體的調研分析結果再進一步聚焦最核心問題。例如,“提出假設”中,再聚焦用戶提出哪類假設最為困難?(可能是條件式假設,或者差異式假設。)“實施研究”中,再聚焦用戶執行哪種研究技術最困難?(可能是實驗法或調查法。)教育研究ES構建中,ES就是由那些輔助用戶解決最核心最重要的具體任務的局部ES逐步集成的。

(四)教育研究ES的教育專業腳本

討論了教育研究ES的技術框架之后,還要討論教育研究ES的專業腳本。這個腳本不是技術性的,但要在ES構建技術理念指導下,未來教育研究ES構建的架構中,體現教育研究自身規律和特點的,為提升教育研究整體水平服務的關鍵點和重要關系。教育專業腳本的設計需要涉及計算機腳本語言,計算機腳本語言是比較專業的問題,我們這里不做解釋。[9]

首先,“已有的研究觀點”是個重要“角色”。教育研究這臺“劇”就是依據已有的“觀點”按照教育發展邏輯產生新的“觀點”,教育研究簡單講就是要發現和整理出新舊觀點之間的邏輯關系和演變過程。

其次,“恰當的研究方法”也是個重要“角色”。這里包括從“聚焦問題”“提出假設”“設計方案”等,直到“成果轉化”,所有研究環節中的重要方法及其正確選擇與應用。“研究方法”是保證教育研究全“劇”有始有終和圓滿落幕的重要條件。

再次,“對研究獲取信息的合理評價”,這并不是“小人物”,而常常為研究者忽略,甚至歪曲。研究的根本目的是運用合理的思路和方法進行充分的論證,而不是急于得出結論,教育研究尤其如此。因此,教育研究ES 要高度關注“下結論”的條件和方式。

最后,“直接佐證材料”,這里指“提出假設”“設計實施”“總結成果”等各環節的佐證材料,而且保證其為“直接”佐證材料,是與本研究邏輯關系最密切的佐證材料。直接佐證材料也是貫穿全“劇”的重要“角色”。

按照教育研究承擔者的視角,教育研究主要情節可以概括為四大部分：預備、立項、研究和評價。預備情節是前提,立項情節是關鍵,研究情節是基礎,評價情節是保證。

三、教育研究ES構建前期準備重點

構建教育研究ES是一項規模巨大的工程,雖然要堅持專門性和最小化原則,但是在構建初期必須對工程全面把握,系統考察,頂層設計,從全局高度安排協調步驟和突破的重點。

前文已述,構建教育研究ES要在全面調研的基礎上設計和實施,哪怕是局部的專門化最小系統也要做前期充分的調研,在此基礎上由教育研究領域專家和知識工程師(計算機技術人員)以及最終用戶共同參與謀劃設計,綜合不同專業視角的考察與思考結果,才能保證ES構建成果的技術和專業水平以及健康可持續發展。

首先,從技術角度分析構建重點。知識庫、綜合數據庫和推理機組成了ES的核心系統。從技術角度看這也是教育研究ES的技術構建重點。

教育研究ES知識庫的重點是教育研究知識的產生式規則的設計。前文已述,在ES中運用較為普遍的知識是“產生式規則”。產生式規則,以“IF(如果)…THEN(于是)…”的形式體現,IF 后面是條件,THEN 后面是結論……但這是知識產生式的基本原理,對于教育研究領域的知識來講,是更復雜多層嵌套的知識邏輯關系。教育研究ES根據領域知識的復雜性特點將來肯定需要采取更先進的知識表達規則和技術,目前以神經網絡算法為主要代表的新一代ES設計往往不是固定程序驅動,而是發展為“環境模式驅動”下的知識推理過程,知識的收集、編碼、存儲、管理方式完全不同于傳統模式。例如谷歌下屬公司Deepmind報告新版程序AlphaGo Zero：從空白狀態學起,在無任何人類輸入下,它能迅速自學圍棋,并以100：0的戰績擊敗“前輩”。其關鍵技術是采用了新的reinforcement learning(強化學習算法),能讓系統自主學習,并達到“驚人”的知識水平。[10]

綜合數據庫的重點是更加全面有序地采集、儲存、管理世界范圍內教育研究領域的事實和斷言,存儲和處理效率更高。事實和斷言以何種方式表達更具權威性、專業性、規范性,是數據庫構建的重點和難點,既要符合ES的技術要求,也要保持教育研究領域知識的專業性和特殊性。

推理機的重點是推理算法復雜化。教育研究ES的構建肯定不是傳統算法能勝任的,要根據教育研究專業性特點和需要慎重選擇和設計推理算法。這要與知識庫設計協調配合,一并進行,保證未來教育研究ES知識產生式系統達到人工智能技術的前沿水平。

而且,從技術角度評測知識庫和推理機等重要模塊的指標很多,教育研究ES的構建前期要依據教育研究知識特點對評測指標進行全面修訂。

其次,從教育專業角度分析構建重點。從教育研究專業視角看,立項系統肯定是全局重點,其中尤其是假設提出輔助系統是重中之重。如果將來的調研結果支持這個結論,那么,觀點評述式和假設表述式就是立項系統的重點研究和設計內容。教育研究已有觀點如何按照ES的技術規范和思路去評述,如何設計規范的假設表達式,這都是教育研究ES的知識產生式的最主要內容。用戶的假設表述如何識別、存儲、管理、匹配、修訂、表達、解釋……一系列重要問題都是這方面設計參與者必須高度關注和深入研究的內容。

再次,從ES用戶角度分析構建重點。應當注意,用戶中可能有未經教育研究專業訓練的人員。從ES用戶的角度看,提出新問題可能是最為困難的,最需要ES輔助支持,因此,聚焦問題提出輔助系統應該是構建重點。這個系統的構建重點又集中在文獻檢索分析和研究綜述表述兩個方面。人類研究者提出新問題能力不足的表現往往在于“重檢索輕分析”“重羅列輕概括”。聚焦問題提出輔助系統可以針對這些最具體的問題開展設計,當然這方面設計要涉及大面積、多層次的文獻檢索、匹配等難題。目前文獻檢索系統發展較快,但是其主要功能只是檢索,距離ES的標準還相去甚遠,需要重新設計或作較大改造。

最后,有必要對教育研究ES設計構建實施的參與者給予重要提示——必須堅持“主體性保護”原則,即參與者有義務對未來教育研究ES用戶提示以下重要問題：教育研究ES是在一定的技術規范下模擬教育研究專家的思考和判斷,給出的建議是有局限的,很可能忽略或者去掉了一些“活知識”,而這些“活知識”可能才是真正有價值的。這需要給用戶足夠的提示。教育研究ES始終是輔助,最終下結論的還是研究者本人,因此,教育研究ES設計構建過程中要始終提示用戶保持主體性,這應該成為教育研究ES設計構建的一個特殊原則。