朱 濤,夏玲玲,袁 明
(江蘇警官學院 計算機信息與網(wǎng)絡安全系,南京 210031)
隨著國家大數(shù)據(jù)戰(zhàn)略在社會經(jīng)濟各行各業(yè)的全面實施,信息基礎設施云化的持續(xù)推進,行業(yè)內(nèi)部統(tǒng)一的大數(shù)據(jù)平臺逐步落地,大數(shù)據(jù)應用已經(jīng)走入日常生產(chǎn)生活,大數(shù)據(jù)建設帶來的“數(shù)據(jù)效益”強力地推動了各個領域的發(fā)展與改革。大數(shù)據(jù)作為一種新穎的思維方式和解決問題的方法論[1],已經(jīng)成為各個學科專業(yè)必須學習和認識,并探索如何在本學科中應用的一項重要技術(shù)。構(gòu)建不同學科背景下人才的大數(shù)據(jù)理念和知識結(jié)構(gòu),掌握在各個學科中運用數(shù)據(jù)的基本素質(zhì)能力,是擺在大學本科通識教育面前的一項重要任務。
近年來,為順應大數(shù)據(jù)發(fā)展應用的要求,各學科專業(yè)針對如何開展大數(shù)據(jù)技術(shù)通識類課程進行了初步探索?;诖髷?shù)據(jù)技術(shù)與物理學的緊密關系,分析了在物理學專業(yè)中開展數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)類通識課程的重要性,設計了具體的課程設置方案[2]。基于混合教學模式進行了大數(shù)據(jù)概論課程的教學改革和課程設計[3]。針對培養(yǎng)具有數(shù)據(jù)素養(yǎng)的人才所需要的大數(shù)據(jù)知識,融入豐富案例的大數(shù)據(jù)通識教材[4]也開始出現(xiàn)。然而,大數(shù)據(jù)知識作為通識課程來講授還處在初級階段,其教學內(nèi)容也需要進一步研究,具有十分重要的現(xiàn)實意義。
智能時代來臨,高素質(zhì)人才知識結(jié)構(gòu)中必然有大數(shù)據(jù)知識素質(zhì)的一席之地,這是這一時代本科通識教育的應有之義,也是助推學科專業(yè)進步發(fā)展的新動力。
雖然人才的價值體現(xiàn)在其針對特定領域的專業(yè)性,但專業(yè)性是在其完整知識架構(gòu)基礎上,通過觸類旁通的通用智慧,靈活的多學科交叉引用能力實現(xiàn)的單點突破。在智能時代,一切都被記錄為數(shù)據(jù)??创龜?shù)據(jù)的觀念,認識數(shù)據(jù)的能力,適應數(shù)據(jù)變化的思維方式,都是將大數(shù)據(jù)素質(zhì)融入到專業(yè)領域,獲取新知識,進而實現(xiàn)創(chuàng)新的關鍵要素。正確地認識了大數(shù)據(jù),掌握了運用大數(shù)據(jù)的基本技術(shù),學會讓數(shù)據(jù)說話,進而指導實踐,也就形成了大數(shù)據(jù)觀念和思維,這些都有利于培養(yǎng)各專業(yè)人才的健全素質(zhì)。另一方面,大數(shù)據(jù)本身就代表了智能時代的人文精神,必將成為智能時代人才的核心素質(zhì)。數(shù)據(jù)共享的開放思想,客觀數(shù)據(jù)驅(qū)動的理性思考,跨學科數(shù)據(jù)帶來的廣闊視野,數(shù)據(jù)偶然性和關聯(lián)規(guī)律必然性形成的思辨精神,都將與人類哲學思想遙相呼應,使人類文明在每個人身上更加熠熠生輝。
具備大數(shù)據(jù)素質(zhì)的復合型人才是各個專業(yè)領域在大數(shù)據(jù)時代的高端人才。這類人才熟悉所在領域知識,對信息化、智能化和大數(shù)據(jù)基礎設施認識深刻,掌握各類大數(shù)據(jù)應用的功能特點,善于使用數(shù)據(jù)挖掘工具、方法從海量數(shù)據(jù)資源和周邊信息中發(fā)現(xiàn)內(nèi)在價值和規(guī)律,能夠采用相應的數(shù)學模型來理性地描述問題、處理數(shù)據(jù)、解釋規(guī)律和預測趨勢,對挖掘結(jié)果中隱含的價值趨勢、風險隱患、現(xiàn)象規(guī)律等有直覺敏銳感知。盡管此類人才的培養(yǎng)不可能經(jīng)過本科院校四年學習就能夠一蹴而就地“精品產(chǎn)出”,而進一步需要在領導決策、信息技術(shù)等多種類型崗位上,長期打磨歷練,不斷刻苦學習,經(jīng)過對知識經(jīng)驗和思維技能的反復檢驗,才能最終培養(yǎng)成功。但是,大學本科教育可以在“以本為本”的根本思路上,通過大數(shù)據(jù)通識課程提出對大數(shù)據(jù)素質(zhì)的學習要求,聚焦大數(shù)據(jù)核心能力培養(yǎng),注重構(gòu)建大數(shù)據(jù)知識框架,為復合型人才的最終養(yǎng)成奠定廣博厚實、博學多能的基礎。
當前,各個學科科研數(shù)據(jù)海量性趨勢已成為智能時代科研的重要特點。大數(shù)據(jù)技術(shù)為科研工作中的數(shù)據(jù)分析、模型化描述和可視化展現(xiàn),提供了強大的處理工具。同時,數(shù)學理論和方法通過大數(shù)據(jù)技術(shù)得以更加廣泛地擴展到社會人文學科,推動各個學科的交叉融合發(fā)展。而且,大數(shù)據(jù)體現(xiàn)規(guī)律關聯(lián)性的特點,也可推動學科研究的思維方式從線性因果型向網(wǎng)狀關聯(lián)型發(fā)展轉(zhuǎn)變。另外,作為大數(shù)據(jù)技術(shù)的重要來源,系統(tǒng)科學的觀念和方法已經(jīng)深入應用到社會科學和自然科學研究的各個方面,而復雜性科學[5]作為系統(tǒng)科學的新階段,為多個學科的發(fā)展提供了思維方式和方法論引導。大數(shù)據(jù)代表了數(shù)據(jù)密集型研究的科研新范式,強調(diào)學科交叉和系統(tǒng)關聯(lián),這是對復雜性科學的重要發(fā)展,為各個學科的研究發(fā)展提供了新的思路和途徑。
大數(shù)據(jù)通識教育旨在健全智能時代人才的大數(shù)據(jù)人文素養(yǎng),使學生能夠掌握大數(shù)據(jù)基礎知識,養(yǎng)成大數(shù)據(jù)思維,通過潛移默化的思政教育,形成大數(shù)據(jù)價值觀和職業(yè)素質(zhì),幫助其在大數(shù)據(jù)領域的發(fā)展。
具備大數(shù)據(jù)人文素養(yǎng)的重要特征是了解大數(shù)據(jù)技術(shù)的來龍去脈,掌握其歷史發(fā)展過程。這一內(nèi)容不僅能提高對大數(shù)據(jù)技術(shù)的認識,還對我國大數(shù)據(jù)的未來發(fā)展有重要的借鑒意義。在闡明大數(shù)據(jù)技術(shù)的源起之后,還應當從法制變革、技術(shù)發(fā)展、國家治理與商業(yè)應用等四個方面來說明大數(shù)據(jù)對國家社會的重要意義。首先,關于公共信息的公開自由和開放透明的法制變革是大數(shù)據(jù)技術(shù)興起的社會環(huán)境因素。我國要注重使用法律制度來保證公民個人信息的做法,實現(xiàn)與公眾信息的有效切分,同時注意研究實施依法公布公共治理信息的途徑。其次,世界各國大數(shù)據(jù)信息技術(shù)的發(fā)展路徑可以成為我國社會經(jīng)濟各領域大數(shù)據(jù)戰(zhàn)略實施的有益借鑒。大數(shù)據(jù)發(fā)展的關鍵過程,是智能時代各國社會發(fā)展都會經(jīng)歷的,相互參考可提供豐富的借鑒。第三,用數(shù)據(jù)來決策、管理和創(chuàng)新的制度過程,將使國家社會的大數(shù)據(jù)治理獲益,將推動智能時代完成從生產(chǎn)生活數(shù)據(jù)到社會規(guī)律知識的跨越。
大數(shù)據(jù)技術(shù)盛行的背后,實際上是各類數(shù)據(jù)法則的建立、相關利益之間的博弈,闡明這些過程,對我國大數(shù)據(jù)建設有重要意義。大數(shù)據(jù)應用本質(zhì)上是數(shù)據(jù)的采集、處理、使用和管理的過程。教學內(nèi)容可以通過介紹現(xiàn)代智能社會這一龐大數(shù)據(jù)來源的數(shù)據(jù)運作和管理過程,說明數(shù)據(jù)收集的合法性,收集方式的科學性,盡量減少數(shù)據(jù)收集導致的負擔加重問題。同時,在數(shù)據(jù)使用過程中,要說明注意隱私保護,即使是用于公共安全,隱私保護也是必要和必須遵循相關法律的。在數(shù)據(jù)發(fā)布時,則要關注如何在盡量免費的基礎上,同時為民眾提供更多的增值服務,避免產(chǎn)生算法歧視和壓迫問題。最后,則是要認識數(shù)據(jù)質(zhì)量問題,這將對社會治理的可信性和權(quán)威產(chǎn)生重大意義。對于我國大數(shù)據(jù)建設來說,需要借鑒先進國家社會在大數(shù)據(jù)全生命周期管理中得到的經(jīng)驗和教訓,建立數(shù)據(jù)就是公平、數(shù)據(jù)就是隱私、數(shù)據(jù)就是權(quán)威的意識。另外,還要在大數(shù)據(jù)通識教學內(nèi)容中加入針對大數(shù)據(jù)價值觀的思政引導,樹立大數(shù)據(jù)從業(yè)人員純潔的思想信念,鑄牢“智能和數(shù)據(jù)都為人類服務”的觀念,堅決避免大數(shù)據(jù)帶來的“無政府主義”“技術(shù)為上主義”等具有危害性的思想。
預見大數(shù)據(jù)技術(shù)發(fā)展的辦法,就是去建設大數(shù)據(jù)。大數(shù)據(jù)技術(shù)及其應用既是國家社會發(fā)展的大趨勢,也向國家社會的各個方面提出了各種各樣的挑戰(zhàn)。社會經(jīng)濟各領域的大數(shù)據(jù)建設,同樣必須在認清這種趨勢的同時,應對類似的挑戰(zhàn)。大數(shù)據(jù)應用的深入,國家社會的資源配置將更加精細和優(yōu)化,運行消耗得到有效的控制,同時還可開發(fā)出更多創(chuàng)造社會價值的機會,使國家和社會都受益,成為一種先發(fā)優(yōu)勢。在教學內(nèi)容中,要重點關注數(shù)據(jù)的開放問題,相關的范圍、標準,構(gòu)建的平臺等,都必須有相關的政策法規(guī)來支撐和保障。同時,互聯(lián)網(wǎng)的智能大數(shù)據(jù)屬性也向國家社會各個領域提出了挑戰(zhàn)。“得數(shù)據(jù)者得天下”,如何規(guī)范數(shù)據(jù)的獲取、管理和開放,將會影響到各個領域發(fā)展的多個方面;國家經(jīng)濟之間的競爭,都將體現(xiàn)在數(shù)據(jù)的收集、分析和付諸實施的行動上;如何應對收集數(shù)據(jù)、使用數(shù)據(jù)、開放數(shù)據(jù)等方面的大數(shù)據(jù)挑戰(zhàn)。這些都是值得研究的教學內(nèi)容。
大學通識教育在關注思政人文素養(yǎng)的同時,還必須強調(diào)以學生學習為中心的科技實踐。特別是對于理工科專業(yè),大數(shù)據(jù)通識教育可以建立起溝通基礎課與專業(yè)課的橋梁,發(fā)揮融合貫通的作用。
盡管數(shù)學是大學大多數(shù)學科專業(yè)的基礎通識課,但許多學生在學完數(shù)學科目后,要么在后續(xù)課程中很少使用,要么就認為數(shù)學只是用來計算的,特別是理工科專業(yè),后續(xù)的專業(yè)課當中直接就進入了對數(shù)學的艱深運用。這說明在數(shù)學基礎課與專業(yè)課之間缺乏對數(shù)學邏輯框架的構(gòu)建和對應用的初步探索,盡管數(shù)學建模這一課程可以填補這一空白,但對非理工科專業(yè),數(shù)學建模課程還是太偏數(shù)學理論了,掌握起來有難度。大數(shù)據(jù)通識課恰好可以擔當這一角色使命,可以通過一些簡單的大數(shù)據(jù)算法就能展現(xiàn)數(shù)學各門課程的邏輯框架。例如,通過對線性回歸的講解,就能清楚地說明概率統(tǒng)計理論是發(fā)現(xiàn)規(guī)律方法,線性代數(shù)是處理數(shù)據(jù)的工具,而微積分則提供了得到最優(yōu)解的功能。理解數(shù)學運用中的邏輯結(jié)構(gòu)后,將這些算法再通過實例應用到解決具體的問題當中去,就可實現(xiàn)對數(shù)學的應用落地。
作為智能時代人才,信息技術(shù)能力已經(jīng)是基本素質(zhì)。特別是程序設計能力,現(xiàn)在已經(jīng)在少兒階段就開始著重培養(yǎng)。但是,在大學的非理工科專業(yè)中,信息技術(shù)作為一門通識課完成,解決了基本的應用軟件使用后,后續(xù)就幾乎沒有對信息技術(shù)能力的進一步培養(yǎng)了。而對非信息類的理工科專業(yè),程序設計、數(shù)據(jù)處理等信息能力大多是通過自學完成的。因此,大數(shù)據(jù)通識課當中可以加入培養(yǎng)基本編程能力、數(shù)據(jù)分析工具使用等內(nèi)容的實踐實驗課,在豐富課程內(nèi)容的同時,調(diào)和理論講解太過枯燥,實例分析又不能動手等問題,為各個學科專業(yè)課程中大數(shù)據(jù)應用打下良好的技術(shù)能力基礎。
一般的通識課程,注重知識點傳授的知識導向型學習,關注以教為中心的知識點傳授,用知識點掌握的多少來衡量學生的學習成效。而大數(shù)據(jù)通識教育卻不是這樣,其本身就涵蓋以學生自我學習和實踐為中心的要求,通過大量問題的提出,引導學生去依據(jù)思考點和實踐點來搜集資料、思考問題和完成實踐,這其實就是一種研究導向型的學習過程。大數(shù)據(jù)通識教育中可以通過引入大量的示例引導學生使用大數(shù)據(jù)工具進行研究,逐步過渡到自我學習,以研究點引導學習的各個階段。
大數(shù)據(jù)通識教育主要是培養(yǎng)數(shù)據(jù)挖掘和分析的基本能力,通過對數(shù)據(jù)特征、基礎挖掘算法、應用實踐等方面的教學,培育在大數(shù)據(jù)理論和實踐應用上的職業(yè)素養(yǎng)。
大數(shù)據(jù)的價值源于數(shù)據(jù)本身,算法只是去擬合并逼近數(shù)據(jù)決定的性能上限,因此,大數(shù)據(jù)技術(shù)的實踐應用必須對數(shù)據(jù)本身的特性有充分認識,數(shù)據(jù)特征工程是認識數(shù)據(jù)的有效工具,也是在數(shù)據(jù)挖掘的準備階段必須完成的任務。首先,教學內(nèi)容要說明針對不同種類數(shù)據(jù)如何進行特征的提取和構(gòu)造。文本、圖像、語音及關聯(lián)型數(shù)據(jù)等各種不同類型數(shù)據(jù)的特征表現(xiàn)都有不同,必須能夠應用專業(yè)領域知識、直覺和數(shù)學手段設計不同的特征提取方法,盡量使特征能夠反映預測目標,并體現(xiàn)不同特征的不同重要程度。其次,教學內(nèi)容要講清特征的轉(zhuǎn)換,達到滿足應用要求的條件下,盡量提高模型算法的預測性能。數(shù)據(jù)的無量綱化處理、離散化、缺失值處理、異常值處理,及后續(xù)的特征組合,都是關鍵的數(shù)據(jù)預處理方法。隨后,還要認識在盡量減少數(shù)據(jù)信息丟失的前提下,將高維多元數(shù)據(jù)映射為低維數(shù)據(jù)的降維方法,減少高維數(shù)據(jù)容易引起的過擬合問題,去除特征間的相關性,綜合提取特征數(shù)據(jù)中的有效信息,達到降低模型復雜度,減少訓練時間,便于進行數(shù)據(jù)可視化展現(xiàn)的目的。最后,教學內(nèi)容還要說明特征的選擇方法,以利于構(gòu)造更好的模型,提高模型性能,更好地理解和解釋數(shù)據(jù)規(guī)律。
數(shù)據(jù)挖掘算法是大數(shù)據(jù)技術(shù)的核心,大數(shù)據(jù)通識教育必須培養(yǎng)能夠運用算法的基礎能力。這主要有兩個層次的教育進程。一是在掌握大數(shù)據(jù)結(jié)構(gòu)特點的基礎上,理解數(shù)據(jù)挖掘算法的基本原理、算法過程。這可以通過編程實現(xiàn)算法基本過程的訓練方式,將算法基本原理融入到編程實現(xiàn)中去理解算法的基本流程,同時檢驗前期各類編程語言學習成效的同時,提高動手實踐的水平。二是掌握算法的具體功能、性能和適用條件。這可以通過依托相關的大數(shù)據(jù)實訓平臺,以小任務的方式將對算法功能和性能的理解融入到解決實踐問題當中,在問題場景中認識哪些算法能夠適用,哪些算法能夠達到應用要求,在完成任務的過程中,加強團隊研討式的訓練,提高協(xié)同工作能力。
解決實際工作中的大數(shù)據(jù)應用問題是大數(shù)據(jù)通識教育能否引起學生學習興趣的關鍵。教學內(nèi)容可以安排在實踐環(huán)節(jié)中解決大數(shù)據(jù)問題進行著重培養(yǎng)學生興趣。具體來說,教師可以利用培養(yǎng)方案中要求的實踐環(huán)節(jié),提前安排學生在書籍、案例和文獻中去尋找問題,帶著問題去參加實踐,在實踐過程中將遇到的問題與自己帶過去的問題進行類比,并嘗試使用大數(shù)據(jù)技術(shù)和方法去分析和解決問題,讓學生能夠帶著答案回到學校。
大數(shù)據(jù)通識素質(zhì)是智能時代人才核心能力的基本要素,成為大學本科培養(yǎng)必須構(gòu)建和固化的核心競爭能力。而大數(shù)據(jù)通識教育的內(nèi)容則成為大數(shù)據(jù)理念和方法通識化、大數(shù)據(jù)思維泛在化的關鍵。通過大數(shù)據(jù)通識教育的開展,可以奠定各專業(yè)領域的大數(shù)據(jù)人文基礎,讓各個業(yè)務領域在大數(shù)據(jù)方面形成一致的概念理解和能力認識,構(gòu)建出以各專業(yè)能力為核心,大數(shù)據(jù)素質(zhì)加持的人才能力素質(zhì)結(jié)構(gòu)。經(jīng)過多個崗位的綜合性鍛煉后,就可以培養(yǎng)出一批既懂專業(yè)領域業(yè)務,又懂大數(shù)據(jù)技術(shù)的專業(yè)人才。寄望將來,本科院校及其教師團隊應該積極探索通過通識教育培養(yǎng)學生大數(shù)據(jù)素質(zhì)能力的途徑和方法,培養(yǎng)出更多基礎扎實、綜合素質(zhì)強的復合型人才。