劉建剛,趙軍產
(湖南商學院數學與統計學院,湖南 長沙 410205)
“大數據”研究機構Gartner指出:大數據(Big Data)是指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。IBM提出大數據具有5V特征:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。麥肯錫全球研究將大數據定義成一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,指出其具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征。現任牛津大學網絡學院互聯網研究所教授,被譽為“大數據時代的預言家”的維克托·邁爾-舍恩伯格與肯尼斯·庫克耶在他們編寫的《大數據時代》一書中指出:大數據不用隨機分析法(抽樣調查)這樣捷徑,而采用所有數據進行分析處理[1]。
人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等[2]。
不少媒體將2013年作為世界的大數據元年,2017年12月,人工智能入選“2017年度中國媒體十大流行語”。現如今,大數據、人工智能已經滲透到各行各業,影響和改變著我們的生活,種種跡象表明我們已進入大數據與人工智能新時代。作為計算機科學與技術、軟件工程等專業的核心主干課程,離散數學課程在大數據與人工智能時代背景下,面臨新的挑戰與變革。
屈婉玲等針對離散數學課程的教學目標、教學內容、教學設計等提出了相應的教學實施方案。該方案特點是:提供一個分層的、模塊化的知識框架,教師可根據科學型、工程型、應用型的不同培養目標對教學內容做靈活配置;在教學設計中強化離散數學課程與其他專業課程之間的聯系,強化素質和能力培養[3]。常亮等分析了計算思維培養與離散數學教學之間的內在關系,在此基礎上分別從課程引入和課程教學兩個階段探討如何將離散數學教學與計算思維培養有機地結合起來[4]。張艷等從離散數學課程的實用性出發,在分析課程定位的基礎上,以網絡化的形式構建知識單元之間的聯系,引入任務驅動的實踐教學環節以改變傳統的教學模式[5]。
然而,在大數據與人工智能時代背景下,如何對離散數學課程重新審視和定位;瀝青離散數學課程內容與大數據、人工智能之間的關聯性,提出何種相應的教學、改革舉措;還有很多問題,值得我們進一步探究。
離散數學是傳統的邏輯學,集合論(包括函數),數論基礎,算法設計,組合分析,離散概率,關系理論,圖論與樹,抽象代數(包括代數系統,群、環、域等),布爾代數,計算模型(語言與自動機)等匯集起來的一門綜合學科,是研究離散量的結構及其相互關系的數學學科,是現代數學的一個重要分支,也可以說是計算機科學的基礎核心學科[6]。他可以看成是構筑在數學和計算機科學之間的橋梁,因為離散數學既離不開集合論、圖論等數學知識,又和計算機科學中的數據庫理論、數據結構等相關,大數據與人工智能時代背景下,數學和計算機科學尤為重要。作為它們之間的橋梁,離散數學課程應定位在更加突出的位置,它是計算機專業課程(如程序設計語言、數據結構、操作系統、編譯技術、人工智能、數據庫、算法設計與分析、理論計算機科學基礎等)必不可少的先行課程,而數據結構、數據庫、算法設計與分析等又是能夠進行大數據分析與處理的基礎課程。
離散數學課程內容大體包括:數理邏輯、集合與關系、圖論、代數系統、組合分析、形式語言和自動機、算法設計等內容[7]。
大數據帶給我們的三個顛覆性觀念轉變:是全部數據,而不是隨機采樣;是大體方向,而不是精確制導;是相關關系,而不是因果關系。其中,離散數學課程中的集合與關系部分,主要講授集合的基本概念與基本運算,關系的運算與性質、關系的閉包、等價關系、偏序關系,函數的定義和性質。在這一部分,分別從集合、關系矩陣、關系圖等三種形式定義和描述關系,這部分內容的學習有助于大數據分析與處理中相關關系的描述與刻畫。
在人工智能的研究與應用領域中,邏輯推理是最持久的子領域之一。邏輯是所有數學推理的基礎,在人工智能上有實際的應用,人工智能專家系統便是以數理邏輯為基礎構建的。采用謂詞邏輯語言演繹過程的形式化,有助于我們更清楚地理解和推理某些子命題。離散數學中的數學推理和布爾代數這兩部分內容,就為早期的人工智能研究打下了良好的數學基礎[8]。
自動機是描述計算的數學模型,用來識別語音或計算函數。形式文法也是一種數學模型,用來產生形式語言,計算機使用的程序設計語言就是一種形式語言,形式語言和自動機理論密切相關,對計算機科學的實踐和理論有著深刻的影響和廣泛的應用,對人工智能的成功實踐具有重要的推動作用。
在大數據與人工智能時代,智能電網中網絡的負載均衡、頻率電壓同步,海洋采樣網絡中滑翔機的協同采樣,智能交通系統中無人車輛的自主駕駛,作戰系統中自主車輛的多點監視、巡邏、協同偵查、目標收集、無人機的編隊飛行,衛星系統中的航天器與飛行器的姿態調整與同步、移動傳感網絡中的目標追蹤,颶風跟蹤,火場監測,無線傳感器網絡中節點的部署與覆蓋等應用領域,常常借助有向圖、無向圖等刻畫網絡化系統中個體間的通信關系,這就需要用到離散數學課程中的圖論這部分內容。
在大數據與人工智能背景下,離散數學課程教學不僅要保證傳統內容的基礎性,而且還要結合大數據、人工智能等相關概念,不斷更新教學內容。在大數據包括的類型中,不僅有可以存儲于關系型數據庫的結構化數據,還有更多的無法存儲于關系型數據庫的非結構化數據。如何刻畫和分析這些非結構化數據間的相關關系,在離散數學課程集合和關系這一部分,需要結合大數據進行內容上的更新。在多機調度、機器人任務分配中,常常使用集合、關系、函數等概念形式化描述這一問題,因此,需要結合具體的應用場景來學習掌握“形式化描述”相關內容。
在多移動機器人系統、智能交通系統、智能電網、無線傳感網絡等網絡化系統的分布式協同控制應用中,常常用到有向圖、無向圖對應的拉普拉斯矩陣、隨機矩陣,以及這些矩陣的特征值,便于分析整個網絡化系統的動力學特征,因此,在講解離散數學課程圖論這一部分內容時,不僅要講述圖的鄰接矩陣、可達性矩陣,而且還要結合上述多智能體網絡化系統,講解拉普拉斯矩陣、隨機矩陣。
圖靈于1936年提出一種數學模型,現在稱之為圖靈機,這個模型很好地描述了計算過程,其屬于離散數學課程形式與語言與自動機這部分內容,講解這部分內容時,要結合圖靈機機器人進行講解,圖靈機器人平臺,是基于自然語言處理、知識庫和云計算等技術,為廣大開發者、合作伙伴提供的一系列智能語義處理能力(包括語義理解、智能問答、知識庫對接等)的服務平臺。
在傳統教學基礎上,確保多媒體教學、實驗教學的比例,更進一步引進翻轉課堂教學理念,引導學生通過MOOC、互聯網等媒體在課下提前查找閱讀離散數學課程與大數據、人工智能相關的內容,將一些熱點問題帶到課堂進行研討,在研討過程中進行頭腦風暴,產生的新問題、以及未能明確解決的問題,再一次回到課下查閱相關資料進行解決。
在離散數學課程教學中存在著很多富于歷史趣味的故事以及富于啟發性的問題,比如:生死門問題、悖論問題、哥尼斯堡七橋問題、蘭姆賽問題、過河問題、迷宮問題、一筆畫問題、地圖著色問題等。在課堂教學中,將“問題驅動”理念融入進來,引領學生一起探索將這些問題加以解決。
圖1為2015-2016學年第一學期計算機科學與技術專業離散數學課程成績分布圖,從統計的成績中可以看出參考人數共計90人,不及格人數共計4人,60分以上人數共計86人,及格率為95.56%,平均分為77.14,80分以上的優秀人數共47人,優秀率為52.22%。

圖1 2015-2016-1計科專業離散數學課程成績分布
圖2為2015-2016學年第一學期軟件工程專業離散數學課程成績分布圖,從統計的成績中可以看出參考人數共計71人,不及格人數共計3人,60分以上人數共計68人,及格率為95.77%,平均分為73.65,80分以上的優秀人數共27人,優秀率為38.02%。

圖2 2015-2016-1軟件專業離散數學課程成績分布
從圖1和圖2比較中可以看出,雖然兩個專業大部分學生成績都及格,但是,軟件工程專業學生的平均分、優秀比例相對計算機專業均稍低一些。
圖3為2016-2017學年第一學期計算機科學與技術專業離散數學課程成績分布圖,參考人數共計111人,不及格人數共計15人,60分以上人數共計96人,及格率為86.48%,平均分為70.07,80分以上的優秀人數共36人,優秀率為32.43%。

圖3 2016-2017-1計科專業離散數學課程成績分布
圖4為2016-2017學年第一學期軟件工程專業的離散數學課程成績分布圖,從統計的成績中可以看出參考人數共計88人,不及格人數共計8人,60分以上人數共計80人,及格率為90.9%,平均分為72.76,80分以上的優秀人數共41人,優秀率為46.59%。

圖4 2016-2017-1軟件專業離散數學課程成績分布
從圖3與圖4的比較可以看出,在2016-2017學年第一學期軟件工程專業學生相對于計算機科學與技術專業的學生而言,離散數學課程成績的平均分、優秀率、及格率均稍高一點。
圖5為2017-2018學年第一學期計算機科學與技術專業離散數學課程成績分布圖,從統計的成績中可以看出參考人數共計111人,不及格人數共計17人,60分以上人數共計94人,及格率為84.68%,平均分為71.85,80分以上的優秀人數共53人,優秀率為47.74%。

圖5 2017-2018-1計科專業離散數學課程成績分布
圖6為2017-2018學年第一學期軟件工程專業離散數學課程成績分布圖,從統計的成績中可以看出參考人數共計80人,不及格人數共計8人,60分以上人數共計72人,及格率為90%,平均分為72.41,80分以上的優秀人數共34人,優秀率為42.5%。

圖6 2017-2018-1軟件專業離散數學課程成績分布
比較圖5和圖6可知,在2017-2018學年第一學期雖然軟件專業學生的及格率稍高于計算機專業,但是優秀率卻比計算機專業低一些。
縱觀近三個學年的離散數學課程成績,可以看出及格率均在84%至96%之間,說明計算機專業、軟件專業的大部分學生能夠掌握離散數學課程的基本內容;平均分在70至77分之間,并呈稍微下降趨勢,原因在于加大了對數理邏輯部分等值演算、主析取范式、主合取范式等涉及公式推導類型題目的考察力度,以及增添了集合論與關系部分考察哈斯圖的題型,這在一定程度上稍微增加了考試題目的難度。優秀率在32%至52%之間,并呈現波動趨勢,說明這三屆學生對課程重點內容的掌握程度參差不齊。
⑴ 學生對離散數學的整個課程體系不夠清晰,這就要求任課教師不僅要在期初對這門課的內容體系進行簡介,最重要的是要在學期末,這門課快要結束的時候,對這門課的內容體系再次進行歸納、概括、總結,能夠讓學生對這門課的內容從整體、從全局,有一個清晰的認識。
⑵ 在數理邏輯部分,部分學生對什么時候使用命題符號化、什么時候使用謂詞進行符號化分不清,造成在命題符號化的過程中使用混亂。一部分學生對等值演算判定公式類型、求主析取范式、求主合取范式等涉及公式推導的題目感覺比較頭疼,以至于對這類題目有種畏懼感,導致在考試過程中這類題目失分較多。此外,推理理論、量詞的轄域收縮與擴張等內容,無論從講授的角度,還是從理解的角度,都可以稱得上數理邏輯部分的難點。
⑶ 在集合與關系論部分,涉及抽象集合元素的計數問題,部分學生理解不夠透徹,導致個別題目難以解答。在判斷關系的性質過程中,自反性、反自反性、對稱性、反對稱性和傳遞性等個別性質的定義比較難理解,涉及到具體的題目,有些性質容易漏判,導致在考試的過程中失掉一些不該失的分數。在利用關系矩陣求傳遞閉包的過程中,不知道何時終止關系矩陣的運算。在利用關系圖求傳遞閉包的過程中,容易漏畫一些關系線條。針對偏序關系所對應的哈斯圖,部分學生不能夠準確的畫出哈斯圖,而且部分學生對極小元、最小元、極大元、最大元、上界、上確界、下界、下確界的辨別不夠準確。涉及集合、關系、函數的多機調度問題是本部分的難點,如何對此問題進行形式化描述更是難點中的難點。
⑷ 在圖論這一部分,最短路徑、關鍵路徑和著色、二部圖、平面圖等內容在學習過程中具有一定的難度,其中涉及求最短路徑的Dijkstra算法不容易理解;判定圖的同構不是非常容易;判定一個圖是否是平面圖,并尋找這個平面圖的一個平面嵌入不是那么簡單;如何畫一個平面圖的對偶圖,并將平面圖的面著色轉化成對偶圖的點著色,具有一定的難度。個別學生在考試過程中將求無向連通帶權圖的最小生成樹和求最短路徑混淆,導致整個題目不能得分。對于求最優二叉樹的Huffman算法,在涉及具體題目求解過程中,容易出現節點層次不清的錯誤。
通過對離散數學課程內容與大數據、人工智能內容的關聯分析,可以清楚的認識到,在大數據和人工智能背景下,要進一步加大對離散數學課程內容的重視力度。尤其要加強課程內容中關系論、圖論、形式語言與自動機等內容的學習力度,這幾部分內容和大數據、人工智能的關聯度比較大,學好這幾部分內容將非常有助于大數據、人工智能的應用實踐。
參考文獻(References):
[1]邁爾-舍恩伯格,庫克耶.大數據時代[M].浙江人民出版社,2013.
[2]蔡自興,劉麗玨,蔡競峰等.人工智能及其應用(第5版)[M].清華大學出版社,2013.
[3]屈婉玲,王元元,傅彥等“.離散數學”課程教學實施方案[J].中國大學教學,2011.1:39-41
[4]常亮,徐周波.離散數學教學中的計算思維培養[J].計算機教育,2011.14:90-93
[5]張艷,劉亞.離散數學課程教學新思考[J].計算機時代,2016.5:89-91
[6]教育部高等學校計算機科學與技術教學指導委員會.高等學校計算機科學與技術專業核心課程教學實施方案[M].高等教育出版社,2009.
[7]耿素云,屈碗玲,張立昂編著.離散數學(第5版)[M].清華大學出版社,2013.
[8]莫愿斌.凸顯計算機專業特色的離散數學教學研究與實踐[J].計算機教育,2010.14:111-114