林碧芬
(福州職業技術學院 福建 福州 350000)
深度學習是一類算法集合,是機器學習的一個分支,它將特征提取和分類結合到一個框架中,用數據學習特征,是一種可以自動學習特征的方法。深度學習嘗試為數據的高層次摘要進行建模,把原始的數據通過非線性的復雜模型轉換為更高層次、更抽象的表達。簡單來說,假設有兩組神經元,一個是接受輸入的信號,一個是發送輸出的信號。當輸入層接收到輸入信號的時候,它將輸入層做一個簡單的修改并傳遞給下一層。在一個深度網絡中,輸入層與輸出層之間可以有很多的層,算法使用多個處理層對數據進行轉換,最終得到某一種判斷的結果,從終端的層發送最終的輸出信號。
隨著人工智能和大數據的興起,深度學習技術的發展發揮著巨大的推動作用,引領各個領域紛紛從傳統方法到深度學習方法進行轉變。深度學習的應用領域在不斷擴大,在圖像識別、語音識別、搜索引擎、機器翻譯、醫療診斷、金融預測等領域都得以成功應用,并且相關方法和技術日益成熟。深度學習在圖片,語音等感知領域已經處于領導地位,在自然語言處理領域也不斷取得突破。
例如,搜索作為以自然語言呈現的最主要的應用,對自然語言理解以及語義匹配都有著非常高的要求,深度學習技術在搜索應用上,可應用于文本分析、語義匹配、搜索引擎排序模型等。據媒體報道,國內幾個知名搜索引擎,都應用了深度學習來解決自然語言理解和語義匹配的問題,甚至深度學習技術在搜索引擎中已經起到一個重要的技術支撐作用。
而在預測方面,深度學習技術也施展著它的不凡身手。在電子商務領域,深度學習技術能夠對消費者進行精準營銷,為用戶推薦感興趣的產品廣告;在金融領域,深度學習技術可以用來預測股價,還可以用來識別欺詐;在政務監管領域,深度學習技術能夠對輿情進行監測分析,預測輿情情感走向,為政務決策提供幫助。
在教學領域,我們認為,深度學習在搜索和預測方面的作用,可以應用到學生學習平臺的設計當中。應用基于深度學習的搜索和預測功能,能夠幫我們設計出一個更貼合個體學習習慣的智能學習平臺。
一般來說,深度學習需要三個核心的要素:算法設計、高性能計算能力、大數據。其中,高性能計算能力屬于硬件范疇,在此不進行討論。下面就算法設計和大數據兩個方面,分析一下基于深度學習的智能學習平臺開發的技術可行性。
曾經有人對深度學習的描述是:簡單的說,深度學習就是一個函數集,如此而已。換句話說,深度學習主要是一些算法的集合。事實上,深度學習就是一類有效訓練深層神經網絡的機器學習算法。基本的深層網絡模型可以分為兩大類:生成模型和判別模型。生成是指從隱含層到輸入數據的重構過程,而判別是指從輸入數據到隱含層的歸約過程。復雜的深層結構可能是一個混合模型,既包含生成模型成分,又包含判別模型成分。
無論是生成模型,還是判別模型,都包含了多種網絡架構模型。生成模型主要包括受限玻耳茲曼機(RBM)、自編碼器(AE)、深層信念網絡(DBN)、深層玻耳茲曼機(DBM)以及和積網絡(SPN)模型;判別模型主要包括深層感知器(deep MLP)、深層前饋網絡(deep FNN)、卷積神經網絡(CNN)、深層堆疊網絡(DSN)、循環神經網絡(RNN)和長短時記憶(LSTM)網絡模型。而各個網絡架構模型通過結合不同的算法設計,又生成多種具體的模型架構,例如CNN發展至今,出現了 Lenet、Alexnet、GoogleNet、VGG、Deep Residual Learning等模型架構。
基于各種模型和算法,深層網絡能夠從大量的復雜數據中學習到合適且有效的特征。應該說,任何數據都是有特征的,所以,在學習平臺上處理的數據,也是有特征的。比如學習過程中的搜索數據、選擇數據、練習數據、答疑數據等,都具有特征,它們的特征,能體現學生個體的學習特性。如果通過深層網絡的學習,得到這些數據的特征,再通過判別模型判斷學生操作的特征歸類,那么就能得到一個貼合個體學習習慣的智能學習平臺。
在應用深度學習的過程中,需要對模型和算法進行合理的選擇。有一個簡單通用的模型選擇方法[1]:
本研究在教學實驗中制定了考核評價標準(見表3),對學生游泳能力進行評價同時還對安全自救能力、救助能力及基本救生常識進行考核評價,并將游泳技能表現與救助能力表現整合起來,為教師游泳教學提供教學內容參考、明確學生學習的目標,進一步完善學生游泳自救與救助技能評價標準,再將標準開發為目標和監控手段,有力地提升教學質量,促使更多學生掌握游泳生存自救及救助能力。
●DBN: 通用的分類問題
●RNN: 序列化學習,時間序列
●CNN: 圖像、音頻、文本分類
●RBM: 特征提取
●Autoencoder: 特征提取
其中,CNN模型既包含了對特征提取的實現,也包含了對分類判別的實現,CNN能夠進行文本特征提取、文本特征表示、歸一化、最后進行文本分類,所以對于以文本為主要數據的學習平臺來說,CNN可以作為其應用深度學習的網絡模型。
一般認為,深度學習需要大量的數據,但是只有極少數情況下,你才能拿到足夠的數據,如果真是如此,深度學習的用處有明顯的局限性。
還有文章表示,應用mnist數據集的實驗證明,在數據量較少時,多層神經網絡的效果要比單層神經網絡要好。所以當數據較少又想用深度學習來處理數據時,建議再網絡模型中多搭幾層[3]。
因此,對于教學中使用的學習平臺來說,雖然沒有大量的數據可以提供給深度學習,但是,我們依然可以使用深度學習來獲得數據特征,并進行數據分類判斷。
一般來說,學生的在線學習平臺,至少應該具備以下功能:
●提供各種學習資料,學生可以按需搜索,進行自主學習;
●提供多種任務或練習,供學生進行實踐操作;
●提供在線答疑功能。
結合深度學習的應用特點,以及在線學習平臺的基本功能要求,針對智能化的功能設計如下。
每個學生的搜索習慣不同,搜索同一份資料時會使用不同的關鍵字,或不同的語序。對于每個學生輸入的搜索內容,平臺將學習其特征,從而記錄每個學生的搜索習慣。依據學生的搜索習慣,在搜索時,能給出最貼合學生思路的搜索提示,實現更快捷的搜索。
智能排序包括搜索結果的排序和操作選擇的排序。
對于搜索結果來說,平臺將根據學生之前對搜索結果的鏈接選擇習慣,來進行排序。平臺會將最符合學生搜索意圖的結果排在最前面。
對于操作選擇來說,學生會面對許多的任務列表,或練習列表。同一個知識點,可能有多個任務或練習,這些操作題目,應該按從易到難的順序排列。而難易的程度,最開始可能由平臺后臺數據管理人員輸入,但是,在被調用進行操作和評分之后,平臺將學習它們的難易特征,然后對題目的難易程度進行實時的調整,這樣的排序,對于后來的學習者,能提供更客觀的選擇依據。
學生在做題的過程中,對于同類的題目,往往會有同樣的錯誤傾向。針對學生個體操作過程中產生的錯誤數據進行深度學習,能收集學生的操作錯誤特征,對于學生后面的操作,能進行個體錯誤預測,提出錯誤預警,或者錯誤提示,實現智能糾錯。
通過深度學習,記錄學生個體對問題和答案的選擇匹配特征,使得平臺具有自我學習的功能,并逐漸讓答疑智能化,最終實現,當學生輸入問題時,對應的答案不再是多個,而是將準確列出匹配問題的答案。
深度學習的發展,讓很多產品實現了智能化。對于已經存在的軟件平臺來說,應用深度學習模型,再加上已有的數據,一樣能實現智能化的升級。在軟件平臺設計中,如何選用深度學習的模型和算法,是值得進一步探討的問題。