楊祥生
摘 要:本文主要研究大數據背景下線性代數課程改革,根據大數據對線性代數的要求,在線性代數課程改革建議如下:適當放寬學生對知識點的運算能力要求,讓學生借助MATLAB等計算軟件運算出計算結果;在線性代數教學過程中增加矩陣分解等內容,以適應大數據對線性代數的要求。
關鍵詞:大數據 課程改革 線性代數 矩陣分解
大數據就是指在一定時間范圍內無法使用傳統數據庫工具對其進行捕捉、管理、計算、分析和處理的數據集合。大數據主要有以下四個特性:數據容量大(Volume)、數據類型多(Variety)、數據存取速度快(Velocity)以及數據應用價值高(Value)。
在“互聯網+”大數據背景下,許多實際應用場景的分析對象我們都可以抽象的用矩陣來表達。大量Web頁面之間關系、微博用戶之間關系、文本與詞匯的關系等等都可以用矩陣表達。例如Web頁面之間關系用矩陣表達時,可以用矩陣元素0和1來代表頁面A與頁面B的關系,0表示A和B之間沒有超鏈接,1表示A和B之間有超鏈接。
一、大數據對線性代數課程的影響與要求
“互聯網+”時代,信息以指數級速度增長,大數據的出現,雖然這為推薦技術帶來了新的機遇,但同時也帶來了新問題,如:大數據稀疏性問題。雖然用戶和商品的數量巨大(這里的商品包括,網頁、文獻、音樂等信息數據),但是兩個用戶之間的選擇相重疊的部分卻非常小。如果用用戶和商品之間已有的選擇關系占所有可能存在的選擇關系的比例來表示稀疏度,[1]如淘寶網上有10億件商品,平均一個用戶瀏覽1000件商品,則稀疏度為百萬分之一。數據非常稀疏就會影響絕大多數基于關聯分析的算法效果。一般數據規模越大,則越稀疏,因此處理稀疏數據的算法就非常重要。
大數據的技術開發與線性代數的知識關系非常密切,例如在大數據分析和建模中是常用的技術手段有:矩陣、轉置、分塊矩、矩陣的秩、正交矩陣、向量、向量空間、特征值和特征向量等。
以矩陣為基礎的各種運算,例如矩陣分解則是分析對象特征、提取信息的途徑,因為矩陣可以代表某種映射或變換,因此分解后所得到的矩陣就代表分析對象在新空間中的一些新特征。所以,矩陣的特征值分解、奇異值分解(SVD分解)、主成分分析(PCA分解)、矩陣分解(MF分解)、非負矩陣分解(NMF分解)等等在大數據分析中的具有廣泛的應用。
二、線性代數課程改革建議
線性代數課程主要是圍繞著行列式、矩陣、線性方程組這三大知識塊,展開分析和討論。根據大數據對線性代數的要求,在線性代數課程改革建議如下:
(1)針對分塊矩陣、線性方程組、線性方程組解的結構、方陣對角化等需要大量計算內容,適當放寬學生對這些知識點的運算能力要求。用一些計算量小的典型算例替換原有復雜的算例,通過簡單的算例讓學生掌握知識點的原理;對于復雜的算例,讓學生借助MATLAB等計算軟件運算出計算結果,并要求學生給出計算軟件中的執行命令。
(2)增添矩陣分解內容。矩陣分解作用很多:矩陣填充(通過矩陣分解來填充原有矩陣)、清理異常值與離群點、降維、壓縮、間接的特征組合(計算特征件相似度)等等。在線性代數教學過程中增加矩陣的特征值分解、奇異值分解(SVD分解)、主成分分析(PCA分解)、矩陣分解(MF分解)、非負矩陣分解(NMF分解)等內容。
三、推廣價值
本文主要研究大數據背景下線性代數課程改革,根據大數據對線性代數的要求,在線性代數課程改革建議如下:適當放寬學生對知識點的運算能力要求,讓學生借助MATLAB等計算軟件運算出計算結果;在線性代數教學過程中增加矩陣分解等內容,以適應大數據對線性代數的要求。該研究具體豐富的理論和實踐價值。
參考文獻
[1]林子雨.大數據技術原理與應用[M].北京,人民郵電出版社,2017,1-20.
[2]陳明.大數據核心技術與實用算法[M].北京,北京師范大學出版社,2017,36-37.