尹勤 黃寶鳳


[摘 要]人類社會已進入大數據時代。文章從大數據的概念和特點出發,探討新時代對統計從業者和應用統計專業人才的新需求,全面分析江蘇省高校應用統計專業學位研究生培養現狀,從培養目標、培養方案、教學設施、師資隊伍、制度保障等多方面總結開展應用統計專業學位研究生教學改革的實踐經驗,為各高校培養適應大數據時代發展需求的應用統計專業人才提供參考與借鑒。
[關鍵詞]大數據;應用統計;人才培養;教學改革
[中圖分類號] G642.0 [文獻標識碼] A [文章編號] 2095-3437(2019)06-0157-03
隨著科學技術的迅猛發展,人類社會已進入大數據時代。大數據正以前所未有的力度改變著人們探索世界的方法,引起社會經濟、學術科研、國防安全等領域的深刻變革和關注。2012年3月,美國政府公布了《大數據研究和發展計劃》,標志著大數據已經成為國家戰略,上升為國家意志。國家競爭力將部分體現為一國擁有數據的規模、活性以及解釋、運用數據的能力[1]。有媒體將2013年稱為“大數據元年”。幾乎所有世界級的互聯網企業都將業務的觸角延伸至大數據產業。大數據已由技術熱詞轉變為一股社會浪潮,影響社會經濟生活的方方面面。大數據時代對統計從業者和應用統計專業人才提出了新的要求,研究探索應用統計專業人才培養的改革路徑,明確適應大數據時代需求的應用統計專業學位研究生培養目標,優化人才培養方案,具有重要的現實意義。
一、大數據的概念、特點及對應用統計專業人才的培養要求
對于大數據的概念和特點,國內外學者眾說紛紜。根據維基百科的定義,大數據是指使用現有數據庫管理工具或傳統數據處理應用難以處理的大型而復雜的數據集。大數據科學家John Rauser認為大數據是指任何超過了一臺計算機處理能力的數據。Grobelink M認為大數據具有3個特點即多樣性、大量性、高速性,又稱3V 特點[2]。IBM提出了大數據的5V特點:規模性、多樣性、價值性、高速性和準確性。大數據的5V特點是目前被普遍接受的一種說法,但也有學者提出其他特點。我國朱建平教授認為大數據時代的基本特征主要體現在社會性、廣泛性、公開性、動態性這4個方面[3] 。貴州省大數據戰略重點實驗室在《大數據概念與發展》一文中更是從技術角度、應用價值出發,總結了國內外學者所提出的“大數據”的定義[4] 。
大數據時代的到來,是統計學發展史上的里程碑,其挑戰包括數據的采集、管理、存儲、搜索、共享、分析和可視化。首先是數據來源與數據類型的變化。大數據的來源一般為信息網絡系統,不具有很強的目的性,數據的來源也很難追溯。此外,數據的類型也發生了變化。傳統統計學的數據為結構化數據,即可以用常規統計指標或圖表表現出來的定量數據或專門設計的定性數據,有固定的結構和標準。大數據不僅包括結構化數據,還包含非結構化數據、半結構化數據或異構數據,即一切可以記錄和存儲的信號。其次是分析思維方式的改變。大數據時代更熱衷于追求相關關系[5] 。統計分析過程已轉變為直接從各種“定量的回應”中找出有價值的、為我們所需要的數據,并通過分析找到數據的特征和數量關系,進而據此做出判斷與決策[6]。而實證分析也從“假設—驗證”的傳統思路變為“發現—總結”的新思路。最后是與計算機的聯系更加緊密。在大數據的時代背景下,統計工作、統計研究與計算機緊密結合,大數據應用分析技術及軟件日益增多,以數據挖掘為契機,統計學家得以使用新的算法及分析技術解釋更為龐大的數據,使得統計學的應用范圍進一步擴大,統計學科體系進一步延伸和完善。
相關學者指出,大數據背景下,應從數據收集、數據整理、數據透視這3方面入手,加大教學力度,指導學生提高處理海量數據、挖掘數據價值的能力[7];數據挖掘與信息技術緊密結合的發展趨勢已經成為高校統計專業教育的新方向[8]。據此,本文認為大數據對應用統計專業學位研究生培養的新需求主要體現在: 一是在大數據搜集方面,熟練使用Python或R語言等搜集網絡數據,或通過傳感器自動采集數據。二是在數據的存儲管理方面,傳統的Excel所能處理的數據量是有限的,新的處理方法如SQL數據庫應運而生。三是在數據的可視化分析方面,數據圖像化可以讓抽象數據具體化,給用戶直觀的感受。四是在數據挖掘方面,使用數據挖掘與機器學習的算法來解決統計分析問題,提高數據處理速度和預測分析能力。五是大數據引擎,也稱百度大數據引擎,指的是對大數據進行收集、存儲、計算、挖掘和管理,并通過深度學習技術和數據建模技術,使數據具有“智能”。此外,大數據時代下的應用統計專業學位研究生的培養工作,不僅需要培養具有現代統計技術、數據挖掘技術與計算機技術的復合型人才,也需要培養掌握相關專業知識、熟悉統計實踐領域、具備實際操作能力的應用型人才。
二、江蘇省高校應用統計專業學位研究生培養現狀分析
目前江蘇省的52所本科高校中有統計學科碩士點的高校13所,其中,擁有應用統計專業學位碩士點的高校只有11所(含2017年江蘇省新增的應用統計碩士專業學位授權點3所)。在此重點對已實際開展應用統計專業學位研究生培養的8所高校即南京大學、東南大學、蘇州大學、河海大學、南京郵電大學、南京財經大學、中國藥科大學、南京師范大學進行分析。
在培養方向上,除南京大學門類比較齊全,設有7個方向外,其他高校普遍設有3~5個方向,8所高校總計開設20個培養方向。由圖1可見,江蘇省內開設金融統計方向的高校最多,分別是南京師范大學、河海大學、南京郵電大學、南京財經大學、蘇州大學;第二多的是數理統計方向與社會經濟統計方向;另有2所高校開設信息統計與大數據分析、工業統計和質量控制、生物統計等方向。本文作者所在的南京郵電大學設有信息統計與大數據分析、金融統計、人口與社會統計3個方向。
在課程設置上,應用統計專業學位研究生培養的課程體系主要由專業基礎課和專業方向課組成。專業基礎課主要包括時間序列分析、多元統計分析、統計調查、應用隨機過程、試驗設計、統計軟件、應用回歸分析和數理統計等。8所高校中有7所開設時間序列分析課程,該課程著重討論經典的ARMA模型,同時又對最新的時間序列模型加以介紹,例如ARCH模型族(自回歸條件異方差模型)、ECM模型(誤差修正模型)和處理高頻數據的ACD模型(自回歸條件持續期模型)等等,既保證了統計理論體系較為完整,又努力突出對實際案例的應用和統計思想的滲透,是應用統計專業碩士培養開設最多的基礎課程。
各高校應用統計專業學位研究生的專業方向選修課主要根據其設置的培養方向、學科特點及實際需要設置。比如金融統計與計量分析模塊的選修課,主要包括貨幣金融統計、金融計量經濟學、金融風險計量與管理、金融計算與建模、數理金融與金融工程、投資分析與組合管理等。數據分析方向的選修課則涵蓋了大數據的統計模型及分析方法,數據庫的管理以及數據挖掘等。人口與社會統計方向則主要包括了人口統計分析、社會統計、國民經濟統計。江蘇省應用統計專業學位碩士點部分培養方向的專業方向課設置情況如表1所示。
此外,應用統計專業學位研究生培養的最大的特點是突出實踐導向,教學更重視運用團隊學習、案例分析、現場研究、專業實習等方法。其具體的實施大都采取理論學習、案例教學、實驗教學或實訓實踐這4種培養模式,并通過雙導師制突出實際操作能力的訓練,注重培養統計分析能力和創造性解決實際問題的能力,培養年限為2年至3年不等。
三、應用統計專業學位研究生培養的教學改革實踐
南京郵電大學應用統計專業學位碩士點積極探索大數據時代應用統計專業學位研究生培養的改革路徑,立足南京郵電大學在通信信息、計算機技術、物聯網、大數據分析等方面的學科優勢,充分發揮信息統計與大數據分析、人口與社會統計這兩個方向在江蘇高校應用統計專業學位人才培養中的鮮明特色,以“科研驅動、實踐教學”為主線,實施“培養目標現代化、問題切入案例化、分析能力實戰化、師資隊伍專業化、評價考核多樣化”的全方位教改實踐。
第一,面向時代需求,明確培養目標。本學位點基于全國應用統計專業學位研究生教育指導委員會指定的《應用統計碩士專業學位基本要求》,目標定位為培養具有堅實的應用統計學理論基礎和較強的數據分析能力,特別是具有大數據統計分析、人口與社會統計、金融統計等相關領域工作的創新能力和實踐能力,能夠勝任郵電通信和金融等大中型企事業單位、統計局和其他黨政機關從事統計和數據分析工作的復合型、應用型統計專業人才。
第二,優化培養方案,重視案例教學。修訂了符合應用統計專業要求和學校信息學科特色優勢的培養方案,并據此設置了相應的專業化培養課程體系。開展應用數理統計、統計調查等專業基礎課的核心課程建設,編制完成內容豐富、結構嚴謹、實用性強的“應用統計教學案例庫”。將工具學習和案例教學貫穿到“理論課程—實驗實踐—競賽實踐”的整個教學系統中。
第三,完善教學設施,培養分析能力。本授權點建有“經濟金融實驗教學中心”,下屬 “大數據統計分析實驗室”和“金融工程實驗室”,擁有省級重點科研基地“江蘇省統計科學研究基地”,與上市公司我樂家居合作建立了省級研究生工作站。積極組織開展各類實踐競賽活動,僅2018屆畢業生獲“應用統計專業學位研究生案例大賽”“全國統計建模大賽”等相關學科競賽獎項一等獎1項、二等獎3項、三等獎3項,深受用人單位歡迎和好評。
第四,開展學術交流,提升師資水平。依托南京郵電大學“江蘇省統計科研”基地,組織開展科研項目孵化,提升應用統計專業碩士學位點師資數據分析能力和科研水平。組織學位點師資赴中國人民大學、廈門大學、南京財經大學等高校調研,邀請北京大學、首都經貿大學等統計學界的權威專家到校溝通交流,開拓學科發展視野。聘請江蘇省統計局、商米科技有限公司等政府機構和知名企業的企業導師12人,充分發揮雙基地—雙導師作用。
第五,完善制度保障,綜合考核評價。認真學習梳理江蘇省教育廳、學校研究生院關于專業學位研究生培養的制度規定,出臺院級層面關于研究生培養正副導師制、研究生組會制、教師績效考核以及研究生獎助學金評定等有關管理規定,激發師生參與應用統計研究生培養、統計建模、應用統計案例大賽等實踐競賽活動的積極性,使研究生自主學習能力和實踐創新能力顯著提升,2018屆畢業生深受實習單位和用人單位的好評。
四、結語
大數據時代的帷幕如今才剛剛被揭開。大數據是一種新的價值觀和方法論,人們面對的不再是隨機樣本而是全體數據,不是精確性而是混雜性,不是因果關系而是相關關系。大數據事關國計民生、產業興衰、公司存亡,大數據行業的發展,除了市場需求與驅動和技術水平的進步,還離不開資本與政策的幫助[9]。大數據作為一個新生領域,擁有巨大的應用價值,但同時也遭遇工程技術、管理政策、資金投入、人才培養等諸多方面的挑戰。雖然人們對大數據的分析理念、思維變革等展開了很多研究,但很多問題還需要反復討論和時間檢驗。同樣,對應用統計專業學位研究生培養的教學改革也需與時俱進,有待各高校統計學科教學人員和其他統計工作者不斷地深入研究和探索實踐。
[ 參 考 文 獻 ]
[1] 趙國棟,易歡歡,糜萬軍,等.大數據時代的歷史機遇:產業變革與數據科學[M].北京:清華大學出版社,2013:6.
[2] Randal E. Bryant, Randy H. Katz,Edward D. Lazowska. Big-data computing:creating revolutionary breakthroughs in commerce, science, and society[N/OL].2008-12-22(8).
[3] 朱建平,章貴軍,劉曉葳.大數據時代下數據分析理念的辨析[J].統計研究,2014(2):10-19.
[4] 國務院.促進大數據發展行動綱要[EB/OL].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.
[5] 維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數據時代:生活、工作與思維的大變革[M].周濤,等譯.杭州:浙江人民出版社,2013:94.
[6] 李金昌.大數據與統計新思維[J].統計研究,2014(1):10-17.
[7] 呂振華.淺談大數據時代政府統計的機遇與挑戰[J].商,2015(22):207+202.
[8] 潘莉.大數據背景下統計應用型人才高等教育教學改革研究[J].現代經濟信息,2016(22):413.
[9] 李軍.大數據:從海量到精確[M].北京:清華大學出版社,2014:18-19.
[責任編輯:龐丹丹]