張琳,王楠楠
(大連海事大學,遼寧大連 116026)
隨著信息技術的飛速發展,當今社會已經進入了大數據時代。為了全面推進我國大數據的發展和應用,2015年,國務院印發《促進大數據發展行動綱要》,對我國大數據發展進行了頂層設計和統籌規劃,彰顯和強化了大數據在國家戰略中的突出地位[1]。黨的十八屆五中全會提出了要實施“國家大數據戰略”,標志著大數據戰略正式上升為國家戰略。2016年,“十三五”規劃綱要把大數據作為基礎性戰略資源,對全面促進大數據發展提出方向性目標和任務。2020年,中共中央、國務院發布的《關于構建更加完善的要素市場化配置體制機制的意見》中首次將數據作為一種生產要素,強調要加速培育數據要素市場,推進數據開放共享,提升社會數據資源價值。
在國家政策的推動下,大數據技術得到了快速發展,并對各行各業都產生了巨大影響,也使各行各業都積累了海量數據。隨著數據量的增長,人們越來越深刻地認識到數據的價值,但如此龐大、分散、類型繁多且價值密度低的數據資源經常讓企業束手無策,不知該如何挖掘其價值,導致很多企業面臨“海量數據,知識匱乏”的局面。因此,如何快速、準確、實時地從這些數據中獲取所需要的信息,成了各個行業面臨的重要問題。
數據分析是指為了產生有用信息,利用處理數據和分析數據的相關理論和方法,對收集來的大量數據進行詳細研究和概括總結的過程[2]。數據分析可以為企業的管理決策提供可靠依據,增強管理的科學性。在大數據環境下,數據分析已成為各行各業發展的迫切需求。以電商行業為例,根據艾瑞咨詢對國內超過1 000家企業的調查,97.9%的企業認為數據分析對電商運營很重要,同時有75.7%的企業認為自身分析數據和挖掘數據價值的能力欠缺,而且超過一半的企業希望專業數據分析人才的加入,并愿意為其支付更高的薪資[2]。
信息管理類專業主要指《普通高等學校本科專業目錄(2020年版)》專業分類代碼中1201和1208下屬的相關專業,主要包括信息管理與信息系統、大數據管理與應用、電子商務等專業[3-4]。信息管理類專業具有跨學科的特點,致力于培養集計算機技術、管理理論、信息資源管理于一體的復合型應用人才。
為了適應市場對數據分析人才的需求,信息管理類專業對學生數據分析能力的要求逐漸提高。多數高校的信息管理類專業已經將數據分析能力作為學生的核心能力之一,將培養具有數據分析能力與管理決策能力的復合型、創新型人才作為專業的培養目標之一。
信息管理類專業既有的課程體系中包含了一些與數據分析相關的課程,如《信息處理概論與計算機原理》《C語言程序設計》《Java程序設計》《管理統計學》《數據結構》《商務智能方法與應用》《數據庫原理》《XML與Web數據管理》等,因此,信息管理類專業的學生具備一定的統計學思維和編程能力,掌握一些典型的數據結構和算法,了解常用的數據分析和挖掘模型,能夠熟練使用C語言和Java語言編寫程序,實現對少量數據的分析挖掘,也能夠使用SPSS等軟件工具對數據進行統計分析[5]。雖然信息管理類專業學生具備一定的數據分析能力,但在大數據背景下,學生在數據管理和信息分析方面還存在以下問題:
(1) 數據意識亟待提高。用數據說話,以數據支撐決策可以幫助企業加強科學化管理,提高經營管理水平。但學生對數據能幫助我們解決什么問題、數據之間的關聯、數據對管理決策的作用不是很了解[6]。學生的數據意識還比較薄弱,需要進一步提高學生的數據分析能力,讓學生不斷加深對數據用途和作用的了解,提高對數據的認知能力。
(2)雖然掌握一定的數據分析和挖掘模型,能夠運用模型進行數據分析,但由于教學過程中采用的數據多是模擬數據,沒有與實踐相結合,且不需要學生自己采集,因此學生缺乏對能客觀反映實際背景的真實數據的獲取、處理、分析和運用的經驗,發現知識的能力不足,對于得到的分析結果也不能很好地理解其意義。需要進一步提高學生的實踐能力,將實踐與理論相結合,提高學生的數據分析水平,讓學生積極參與數據采集、數據整理到數據分析和運用的過程中,提高對理論知識的理解能力,增強運用能力。
(3)學生在課堂上接觸的數據大多是少量的結構化數據,所以學生對規模龐大的結構化數據(如關系型數據庫中的數據)、半結構化數據(如XML數據)和非結構化數據(如文本數據)的分布式處理、存儲和分析能力不足,對大數據相關技術平臺、NoSQL數據庫,以及Python等數據分析工具的了解較少。
(4)數據的質量會影響對數據分析和挖掘的效果和效率,也會影響決策的正確性,而部分學生對提高數據質量的處理方法,如數據清洗、集成、轉換、約減等,不能熟練使用。
(5)能夠使用Excel,通過生成餅圖、柱狀圖等統計圖表,對數據和數據分析結果進行可視化,但數據可視化能力還有待進一步提高。
目前信息管理類專業既有課程體系中的《數據庫原理》課程主要介紹的是對結構化數據的存儲操作,涉及的數據庫主要是關系型數據庫,如MySQL,SQL Server等。而大數據不僅包含結構化數據,也包含規模巨大的半結構化數據和非結構化數據,因此增加《NoSQL數據庫原理及應用》課程可以幫助學生掌握對半結構化和非結構化數據的處理和存儲方式,了解常用的NoSQL數據庫,如HBase、Mango DB、Neo4j的使用方法,為提高學生數據分析能力做準備。
增加《人工智能》課程或調整《商務智能方法與應用》課程為《人工智能與商務智能》,增加對人工智能相關知識的講解,同時增加該課程的教學學時,增加《機器學習》課程。這兩門課程的設置可以幫助學生掌握常用的數據分析處理技術、數據挖掘模型以及機器學習算法,了解模型算法的本質,提高學生利用模型發現知識的能力。
增設《大數據分析的Python基礎》《大數據管理與技術》《大數據應用案例分析》《大數據可視化》等與大數據分析相關的課程[7],幫助學生了解當前流行的大數據技術平臺,如Hadoop、Map-Reduce、Spark等、Python數據分析工具,以及大數據可視化工具,如Tableau、ECharts等,并通過大數據案例分析幫助學生了解大數據技術與傳統BI和數據挖掘技術的區別,使學生認識和理解大數據的價值,提高其在大數據分析與處理方面的能力。
另外,也可購買大數據基礎分析平臺,以輔助大數據相關課程的實踐教學環節,提供對海量數據的預處理、特征工程、多維分析以及機器學習模型的訓練預測評估,幫助學生了解如何對全量大規模數據進行建模,提高學生的大數據建模和分析能力。
除了增加《大數據應用案例分析》課程外,在《XML與Web數據管理》《數據庫原理》《人工智能與商務智能》《機器學習》等與數據分析相關的課程實踐環節,教師可以通過設計和選取大量典型案例構建案例庫,通過案例教學引導學生用數據思維分析實際問題,運用掌握的數據挖掘、人工智能,以及機器學習模型算法等理論知識對數據進行建模,并使用掌握的程序設計語言,如C、Java或Python等,來處理數據和實現模型,發現隱藏在數據背后的規律。將案例教學引入課堂,既可以激發學生參與數據分析的興趣,培養學生的數據意識和數據思維,也可以提高學生的編程能力,幫助其深刻理解數據挖掘模型、人工智能算法和機器學習算法的原理和本質,體會數據分析的作用和意義。
為了幫助學生體會數據的作用以及數據背后隱藏的知識,除了課堂教學外,信息管理類專業可以與企業簽訂合作協議,讓學生在課程實踐環節或實習環節參與一些企業實際項目,親身體驗數據的采集、清洗、加工、存儲、分析以及結果呈現過程。在這個過程中,教師或項目負責人需要指導學生讀懂數據,理解數據的實際意義,了解數據之間的關聯。校企合作方式具有很強的實踐性,有助于培養學生的數據思維和數據意識,提高學生在數據獲取、處理、存儲、分析和可視化等方面的能力。
《信息管理課程設計》是本校信息管理類專業在大三第三學期開設的一門2學分的實踐課,旨在指導學生對大學期間所學的專業知識進行綜合運用。教師可以充分利用該實踐課程和畢業設計環節,根據學生的研究興趣,對想從事數據分析工作的學生,結合市場對數據分析人才的能力要求,為其分配一個與數據分析相關的研究課題,指導學生用所學的理論和技術分析問題和解決實際問題,提升學生理論聯系實際的能力和數據分析能力。
鼓勵學生參加中國國際“互聯網+”大學生創新創業大賽、全國大學生電子商務“創新、創意及創業”挑戰賽、大學生創新創業訓練計劃項目等競賽或項目,體驗從數據采集到數據可視化的全過程。通過參加競賽或項目,既可以讓學生理解數據分析的流程,掌握數據分析方法,也可以提高學生處理數據和分析數據的能力。
信息管理類專業的學生掌握一定的模型算法,具有一定的數據處理能力和計算機應用能力,因此在大數據環境下,信息管理類專業在培養學生數據分析能力方面具有優勢。為了培養滿足市場需求的數據分析人才,本文探討了大數據環境下信息管理類專業提升學生數據分析能力的策略,通過完善課程體系、引入案例教學、校企合作、利用課程設計和畢業設計環節、鼓勵學生參加與數據分析相關的競賽或項目等方式,來培養學生的數據思維和數據意識,幫助學生掌握數據分析方面的技能,理解數據的價值和作用,全面提升學生的數據分析能力。