陳竹兵 徐汪華
摘 要:在信息化、網絡化高度發達的今天,數據增長速度飛快,以至于難以使用現有的數據庫管理工具來駕馭,因此“大數據”這一概念應運而生。“大數據”在化學方面的影響鮮為人知,該文將討論大數據對化學的影響力是否可以深入到大學化學教育層面。
關鍵詞:化學信息學 在線學習 學生為中心 學習方式
中圖分類號:G434 文獻標識碼:A 文章編號:1672-3791(2016)03(b)-0014-02
近幾年來,“大數據”很時髦,作為一個計算機信息用語被炒得很火。任何公司學習利用“大數據”,更好地掌握客戶的需求,從而實現利益擴大化,因此在這種大環境下“大數據”已然成為一種趨勢。很多化學教育工作者認為“大數據”與化學沒有相關性,其實非也。很多學生在化學學習過程中,已經開始利用相關搜索引擎查詢化學數據、文獻以及相關信息?!按髷祿痹诨瘜W方面的影響鮮為人知,該文將討論大數據對化學的影響力是否可以深入到大學化學教育層面。
1 “大數據”的定義
人們生活在這樣大數據填充的世界里,“推特”每天產生超過7 TB的數據,“臉書”每天產生超過10 TB的數據,很多大企業已經存儲了PB級別的海量數據。David Weinberger指出,根據美國圣地亞哥研究所的數據,美國人在2008年全年使用了約3.6 ZB的數據。Weinberger解釋道,托爾斯泰的《戰爭與和平》有1 296頁,6英寸厚,電子版有2 MB。而1ZB等于5×1014本《戰爭與和平》。因此,人們開啟了“大數據”時代?!按髷祿辈⒉恢皇菙祿看?,其經典定義可以歸納為4個V:海量的數據規模(volume)、快速的數據流轉和動態的數據體系(velocity)、多樣的數據類型(variety)和巨大的數據價值(value)。其中,快速的數據流轉和動態的數據體系是大數據區分與傳統數據挖掘的最顯著特征[1]。
近些年來,分析文本和交易的大數據軟件引起了公眾的注意。即使他們沒刻意地關注大數據分析軟件,大多數化學工作者在工作過程中不經意間也已經接觸了大數據,例如Google等搜索引擎的使用。因為大多數搜索引擎結合了多核處理和Hadoop框架來分析海量數據并篩選出搜索結果。這一類型更高端的分析工具還能夠計算出關鍵詞的出現頻率,文檔中情感是否轉變,甚至在大文字信息中,能篩選出最有影響力的觀點。當這些分析工具運用到社會媒體中時,有助于社會學家們對社會輿論的研究產生新的視角。
2 “大數據”對化學教育的影響
雖然數據分析的化學應用尚未引起廣泛地關注,但是其他類型的大數據分析工具已經在化學各領域展開了應用,特別是化學教育領域。如分子模型,藥物、環境、毒理化學等。Lusher Scott指出,大數據分析方法在藥物化學研究領域的應用已有十余年[2]。他們指出數據驅動藥物化學的這種方法在提高藥物研發決策力方面具有很大的潛能,所有的研發人員都信賴大數據,在海量數據中發現有用信息從而發現有意義的相關性和形式[3]。
大數據分析工具在工業化學領域也已經開始應用了,對大數據的需求是很明顯的。一項研究數據顯示:由于低效的實驗設計及不充分的信息技術,研發實驗中有40%被重復。
迄今,大數據在化學教育上的應用似乎只局限在研究生水平[4]。化學分支學科,如環境化學、化學信息學、藥理學等,處理大量的數據集和復雜的數據交互,主要停留在研究生和研究水平。但是隨著商業軟件的使用越來越便利,大數據在化學教育方面的應用將會引申到大學本科層面。屆時,大數據對研究生化學教育的影響同樣體現在大學本科生的化學教育課程里。
大學化學專業的學生也會查詢、搜索網絡信息和數據,但是他們一般都是訪問大數據庫,而不是大數據,如CAS Scifinder數據庫、英國皇家化學協會ChemSpider數據庫。這些數據庫含有上百萬的化合物及其分析數據,但是這些數據并不是大數據,其大小最多只有TB量級。美國杜蘭大學Gibb團隊預測在不久的未來,化學工作者們將會有一個數據管理系統,這個系統將會自動分析化學文獻,并根據研究熱點進行分類??傊?,大數據已經對化學研究和化學工業產生了很大的影響,化學已經開始走進“大數據”時代[5]。因此,針對那些未來可能會成為研究學者的大學本科生,大數據化學教育應該引起關注。
3 “大數據”在化學教育領域中的應用前景
大學化學學院需要找到正確的方式為學生引入大數據及相關技術,以作用于化學教育。迄今為止,有一些報道已成功將大數據技術引入到大學本科化學課程中。Reisner等人描述了一種練習,可以提高學生命名、歸檔數據文件。另外,有一些學者成功運用云計算管理實驗數據。這些并沒有真正將大數據工具運用到大學化學學生的化學教學中。但可以預見,隨著大數據技術的普及,在化學教育領域,大數據會在資料查詢、網絡在線學習、視頻教學等教學實踐和教學活動中扮演信息保存庫的角色。
對于很多教育者而言,第一次接觸大數據可能并不是來自他們在專業學科中的應用,而是學院在提高學生成績時所作出的努力。學習管理系統、網絡課堂、網絡作業等搜集大量的學生行為方面的信息。越來越多的大學運用大數據分析工具將這些信息轉化為切實可行的建議,幫助提高學生的成績[6]。八年前,亞利桑那州立大學首創性的結合eAdvisor系統和數據分析學來幫助那些學習成績比較差的學生提高畢業率。結果,這所大學的差生畢業率由26%提高到了41%。其他大學也在運用大數據技術來管理學生的出勤率、作業完成率,并且幫助學生選擇合適的專業課。這些例子無疑表明大數據無論是在化學教育數據信息共享,還是化學課堂教學都有很好的應用前景。
4 結語
大數據工具在工業、醫藥、環境以及毒理研究等領域已有廣泛的應用,并且這種應用在未來會越來越廣泛。因此,將大數據引入到大學化學課程中將會大有裨益。最起碼,學生能根據相應的文件學到最佳的方法,并且他們可以根據合適的元數據可以知其然,知其所以然。在網絡信息日漸發達的現代教育時代,逐漸認識并應用大數據,也是教育與時俱進的表現形式。
參考文獻
[1] 孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013,50(1):146-169.
[2] 歐陽勤,王懿,李海波,等.藥物大數據時代下的藥物化學教育創新[J].現代醫藥衛生,2015(12):1905-1907.
[3] Edwards M,Aldea M,Belisle M.Big data is changing the environmental sciences[J].Environmental perspectives, 2015(1):1-13.
[4] Davenport TH,Patil DJ.Data scientist:the sexiest job of the 21st century [J].Harvard business review,2012,90(10):70-76,128.
[5] Liu Y,Cai WS,Shao XG.Big data and chemical data mining [J].Chinese Journal,2015,60(8):694.
[6] 黃明燕,蔡祖銳.云計算教育應用研究綜述[J].軟件導刊:教育技術,2014,13(1):6-11.