司莉 何依



摘 要:文章采用網絡調查法,逐一訪問了選定的34所iSchool院校網站,調查了各院校面向本科生和研究生開設的大數據課程數量、教學內容和課程類型,調查發現iSchool院校的課程特點是:內容注重實用性,面向職業需求;強調技術與應用,面向特定領域設置課程;課程學習需要先導知識;教學方法多樣,注重提升學生的應用能力。
關鍵詞:大數據;iSchool課程;圖書情報教育;人才培養
中圖分類號: G250;G642.3 ?文獻標識碼: A ? DOI: 10.11968/tsyqb.1003-6938.2015132
The Analysis of Big Data Related Courses and Its Characteristics Offered by iSchool
Abstract By visiting the website of 34 selected iSchools, the authors investigated the numbers, teaching content and types of big data related courses for undergraduate and graduate students. Analysis was made about the characteristics of these courses and the results indicate that the iSchools' big data related courses have four main features: the content of big data related courses is practical and oriented to professional needs; the iSchools emphasize technology and application of big data and sets up some curriculum for specific domain; the big data related courses need guide knowledge; the form of big data related courses of iSchools are varied and the iSchools focus on training students' practical ability.
Key words big data; iSchool courses; LIS education; personnel training
iSchool是由許多信息學院成立的一個國際組織,截至2015年,iSchool已有65所成員學院致力于信息領域,關注信息、人和技術的關系。為了了解iSchool院校的大數據課程開設情況,本研究主要通過網絡調查方式調查分析了iSchool院校對大數據相關課程的設置情況及特點,以期為大數據時代背景下的國內圖書情報學教育機構人才培養提供參考。
1 調查對象與研究方法
1.1 調查對象
iSchool學院目前有65所,其中,北美洲30所、歐洲21所、亞洲10所(中國3所)、大洋洲3所、非洲1所。排除語言障礙,本文的調查對象限定于歐洲、北美洲中以英語為母語或者官方語言的國家,調查了37所符合調查要求的iSchool學院。但由于格拉斯哥大學人文先進技術與信息學院、佛羅里達州立大學通信與信息學院、雪城大學信息研究學院的網站頁面、課程目錄頁無法打開或者沒有權限查看課程列表,最后篩選出34所iSchool院校(見表1),即北美洲29所(加拿大3所、美國26所)、歐洲5所(愛爾蘭1所、英國4所)。調查范圍是該學院所有專業的課程,調查時間為2015年9月。
1.2 研究方法
本文根據iSchool主頁提供的iSchool名錄逐一訪問選定的34所iSchool學院的網站,查找各學院面向本科生和研究生開設的大數據相關課程。具體研究方法和步驟如下:
(1) 采用網絡調查法瀏覽學院網站一級目錄“courses”,一級目錄“academic”下的二級目錄“courses”,一級目錄“academic”或“programs”下各專業的三級目錄“course description”,所屬學校網站的課程查找系統或者“course catalog”獲得各學院的課程列表。凡是課程名稱與內容中涉及到大數據基礎理論知識、大數據處理技術、大數據分析工具、不同領域的大數據處理的,均作為大數據相關課程的范圍。
(2) 從授課對象、課程數量、課程內容三個角度對調查結果進行統計分析,揭示iSchool院校大數據相關課程的設置特點。
2 iSchool院校的大數據相關課程設置與調查結果分析
2.1 課程數量及分析
經調查,北德克薩斯大學信息學院、德克薩斯大學奧斯汀分校信息學院等11所iSchool院校沒有開設大數據相關的課程,故實際調查的iSchool院校為23所(見表2)。
本研究以各學院開設的大數據相關課程的總量從高到低進行排序,相同數量的則按學校名稱中文首字母順序排列。“總課程數量”項中,括號內“本”、“碩”、“博”表示該院統計的課程數量包括了本科課程、碩士研究生課程和博士研究生課程。從每所學院大數據課程數量與開設總的課程數量的比重來看,比重最大的是加利福尼亞大學伯克利分校信息學院,比重最小的是華盛頓大學信息學院,分別占總課程數量的12.16%和0.66%。從大數據課程總量來看,卡內基梅隆大學信息系統與管理學院開設的大數據相關課程數量最多,對比各學院開設的大數據相關課程數量,可以看到最多的學院開設了18門,但也還有11所院校未曾開設此類課程,不同學院開設的大數據相關課程數量差距較大。從本科課程和研究生課程的設置數量來看,iSchool學院偏向于面向研究生開設大數據相關課程。總體上,iSchool學院開設的大數據相關課程數量較少,可見對大數據課程的重視程度存在較大差異,需要引起足夠的重視。
2.2 課程內容及分析
為了進一步了解iSchool院校大數據課程具體內容,本研究分別從開設面向本科生以及研究生(碩、博)的課程兩個層次進行調查與分析。
2.2.1 本科生課程內容分析
本研究將所有面向本科生開設的大數據課程名稱進行列表歸納(見表3),發現有12所iSchool院校面向本科生開設課程25門,課程內容主要涉及數據挖掘、數據分析、數據可視化等方面,目的是讓學生了解大數據、學會科學有效地生產數據以及對大量的數據進行組織、分析、管理,并利用大數據進行預測,加強對信息的溝通和傳達。如印第安納大學信息與計算機學院開設的大數據理論類課程“數據流暢性”,該課程介紹了在21世紀面向龐大數據必須掌握的一些基本技能,包括如何理解數據、如何從龐雜的數據中提取知識、如何通過大量數據進行預測并且向人們呈現這些數據。
2.2.2 研究生課程內容及分析
面向研究生開設了大數據課程的有21所iSchool院校,共98門課程,平均每所學校開設了4.67門大數據課程。在這98門課程中,理論類有14門,技術類有67門,應用類有17門,分別占14.29%、68.37%、17.35%。技術類課程中,數據挖掘課程(包括機器學習、可視化課程等)有34門,數據分析類課程(包括數據分析工具,如Python、MapReduce等)有19門,二者占技術課程的79.10%。這些課程以大數據技術課程為主,理論課程為輔,此外還注重培養學生對大數據的實際解決能力,將所學的理論知識運用到實際生活中,解決常見的大數據問題(見表4)。
在課程數量上,卡內基梅隆大學信息系統與管理學院面向研究生開設的大數據課程最多(18門),是加利福尼亞大學伯克利分校信息學院大數據課程(9門)的兩倍,分析這兩所學院開設的大數據課程,可以看到其面向研究生開設的課程更加深入細致、具體到某一個點,并且不同學院在課程類型設置上的側重點不同。卡內基梅隆大學信息系統與管理學院重視大數據技術和應用課程,對于技術類課程,它沒有籠統的去介紹大數據有哪些技術,而是分別開設R分析、NoSQL、Python、Hadoop和MapReduce等,逐一引導學生學習,對學生的要求較高。加利福尼亞大學伯克利分校信息學院則側重技術課程的學習,并且以數據挖掘和機器學習技術為主,如“大規模機器學習”課程講授為PB級規模的結構化和非結構化數據構建大規模機器學習流程的基本原則,學生將獲得使用Apache Hadoop、Apache Spark的實踐經驗。
2.2.3 大數據課程類別及分析
根據上述分析,我們可以將這些大數據課程大致分為三類,即理論類、技術類和應用類(見表5)。23所iSchool院校(不包括沒有開設大數據課程的院校)面向本科生和研究生共開設了123門大數據相關課程,其中理論類課程19門,技術類課程84門,應用類課程20門,各占總大數據課程數的15.45%、68.29%與16.26%。
(1)理論類課程。大數據理論類課程主要介紹大數據的基本概念、大數據處理流程、數據管理、數據科學等知識。如加利福尼亞大學伯克利分校信息學院的“數據科學家的法律、政策和倫理思考”課程結合了刑事司法、國家安全、衛生、營銷、政治、教育等實際案例,檢測數據科學整個生命周期包括收集、存儲、處理、分析和利用過程中出現的法律、政策和道德問題;匹茲堡大學信息科學學院的“數據基礎設施研究”課程主要是介紹數據存儲和保存的方法,選擇標準、架構、協議和格式用于描述數據集、數據記錄和目錄,以促進有效的數據管理。
(2)技術類課程。iSchool院校開設的大數據技術類課程最多,涉及的大數據處理技術十分廣泛,包括Hadoop、MapReduce、Python、NoSQL、云計算等。羅格斯新澤西州立大學通信與信息學院的“信息專業的數據分析”課程引導學生利用各種技術方法對大數據進行分析、存儲和檢索;希蒙斯學院(波士頓)圖書館與信息科學學院的“數據庫管理系統”課程在教授關系型數據庫SQL的基礎上,介紹了常用的大數據應用程序No_SQL;印第安納大學信息與計算機學院開設的“大數據軟件和項目”課程則是典型的大數據技術應用類課程,該課程主要是學習HPC-ABDS軟件在高性能計算機和開源商業大數據云計算中的應用,學生通過HPC-ABDS軟件在云端建立分析系統并將此系統應用在一些大數據項目中。
(3)應用類課程。大數據應用類課程是指大數據技術在移動終端、社交網絡、互聯網等特定領域中的應用,即針對某個特定領域的大數據進行分析,通過挖掘有效信息來解決問題。卡內基梅隆大學信息系統與管理學院開設的“商務智能和數據挖掘SAS”課程要求學生使用以SAS Enterprise Miner為主的商務智能工具分析500強企業單位的商務數據,以提高該企業的決策和營銷策略,其開設主要目的就是為了使學生具備人才市場中所需要的高級商業分析技術。
3 iSchool院校的大數據相關課程設置特點
3.1 課程內容注重實用性,面向職業需求
iSchool院校善于根據職業需求來設置圖書情報學的核心課程[39],以職業需求為導向,從職業所需的知識結構出發安排教學內容,使學生在未來更好地勝任工作。大數據相關課程的設置也是如此,強調所學知識與職業需求間的匹配。具體體現在兩個方面,一是iSchool院校注重培養學生對常用的、熱門的大數據技術和工具的應用能力;二是iSchool學院針對“人”這個主體開設了大數據科學家、大數據團隊管理者的課程,比如卡內基梅隆大學信息系統與管理學院開設的“管理分析項目”課程要求學生從咨詢的角度為客戶提供相關的分析業務,以增加領導、管理分析項目的經驗,包括領導團隊的不同技能、從不同角度與利益相關者進行溝通。
3.2 強調技術與應用,面向特定領域設置課程
iSchool院校重視培養學生對大數據處理技術的學習,且以數據挖掘、數據分析類技術為主,調查的23所iSchool院校共開設了84門技術類課程,其中數據挖掘和數據分析類課程有68門,占技術類課程的80.95%。針對具體的技術,各學院側重點有所不同。此外,iSchool院校還非常重視大數據技術在特定領域中的應用,對特定領域的大數據進行分析、處理,解決特定領域的大數據問題。如田納西大學諾克斯維爾分校信息科學學院的“環境信息學”課程通過調查人們在收集、交流、使用、存儲和分享環境信息的過程中所遇到的問題,探討數據的獲取和數據的質量如何影響環境政策的制定,使學生了解信息政策、環境建模與可視化及其與信息科學的關系。
3.3 課程學習需要先導知識
iSchool院校開設的大數據相關課程大多要求學生有本專業、相關專業或者相關知識基礎,如統計學、程序語言知識等。如德雷塞爾大學計算機與信息學院“機器學習”課程,明確指出該課程的先決條件是學生已經完成了“數據結構”和“人工智能”課程,并且成績等級達到D;卡內基梅隆大學信息系統與管理學院“Hadoop和MapReduce”課程要求學生能熟練運用Java和JavaScript測試運行工具chutzpah。
3.4 教學方法多樣,注重提升學生的應用能力
iSchool院校的大數據課程教學方法多樣,并且在授課過程中常常以一些實際項目為結合點,提高學生解決問題的能力,此外,部分課程還要求學生利用所學技術自行開發一個成品工具或系統,通過這種方式考察學生對知識的掌握情況,有效地提高學生的實際應用能力。如伊利諾伊大學圖書館和信息科學研究所開設的“數據清洗的理論與實踐”課程除了要求學生利用已經存在的數據清理工具動手來完成一些項目,通過編程練習熟悉這些工具,以此來自行開發一些簡單的工具。
4 結語
根據iSchool院校大數據相關課程設置的特點,可以得出以下啟示:(1)面向職業需求,有針對性的開設大數據相關課程,讓學生所學的知識與職業直接接軌;(2)重視培養學生對大數據技術的掌握能力,增加大數據管理與分析類課程,通過運用科學的大數據管理理論、方法和技術,提高社會系統運作效率,創造新的價值,為科學研究、公共管理、商業機構運作等各類社會活動提供決策支撐;(3)大數據課程應強調應用性,將數據的搜集、組織、檢索、分析和服務融入教學內容,提高學生在大數據技術運用、大數據加工處理、大數據分析、大數據管理等各方面的技能,培養能夠適應面向更廣泛的信息職業、符合社會需求的數據管理人才。
本研究也存在一些不足之處。首先,目前國內外對大數據相關課程的范疇沒有一個具體的界定標準,故在課程的篩選過程中帶有一定的主觀性;其次,本研究只是對iSchool院校開設的大數據相關課程進行了調查,沒有從國內、外其余高等院校的角度進行縱橫向的對比研究,在今后的研究中,還需選擇國外非iSchool院校、國內高校開設的大數據相關課程情況進行比較分析,從而全方位揭示與把握圖書情報學教育機構大數據相關課程設置的特點與發展動向。
參考文獻:
[1] Heinz College, Carnegie Mellon University. Course catalog[EB/OL].[2015-09-19].http://www.heinz.cmu.edu/academic-res
ources/course-results/index.aspx.
[2] School of Information and Computing, Indiana University. Undergraduate courses[EB/OL].[2015-09-19]. http://www.soic.indiana.edu/undergraduate/courses/index.html.
[3] School of Information and Computing, Indiana University. Graduate courses[EB/OL].[2015-09-19].http://www.soic.indiana.
edu/graduate/courses/index.html.
[4] College of Computing, Georgia Institute of Technology. Computer science three year course outline[EB/OL].[2015-09-19]. http://www.cc.gatech.edu/three-year-course-outline.
[5] School of Information, University of California Berkeley. Course catalog[EB/OL].[2015-09-22]. http://www.ischool.berkeley.edu/courses/catalog#info-001.
[6] School of Information, University of Michigan. Course catalog[EB/OL].[2015-09-23].https://www.si.umich.edu/programs/c
ourses/catalog.
[7] School of Information Sciences, University of Pittsburgh. Graduate program telecommunications and networking course descriptions[EB/OL].[2015-09-23]. http://www.ischool.pitt.edu/tele/courses/descriptions.php.
[8] School of Information Sciences, University of Pittsburgh. Graduate program information science and technology course description[EB/OL].[2015-09-23]. http://www.ischool.pitt.edu/ist/courses/descriptions.php.
[9] School of Information Sciences, University of Pittsburgh. Graduate program library and information science course descriptions[EB/OL].[2015-09-23]. http://www.ischool.pitt.edu/lis/courses/descriptions.php.
[10] School of Information Sciences,University of Pittsburgh. Undergraduate program course description[EB/OL].[2015-09-23].
http://www.ischool.pitt.edu/bsis/course-of-study/course-descriptions.php.
[11] Pennsylvania State University Bulletin. Information sciences and technology[EB/OL].[2015-09-20].http://bulletins.psu.e
du/undergrad/courses/I/IST/.
[12] Pennsylvania State University Bulletin. Security & risk analy[EB/OL].[2015-09-20].http://bulletins.psu.edu/undergrad/c
ourses/S/SRA/.
[13] Pennsylvania State University Bulletin. Information sciences and technology[EB/OL].[2015-09-20].http://bulletins.psu.e
du/graduate/courses/I/IST/.
[14] Drexel University. Graduate catalog 2015-2016[EB/OL].[2015-09-19].http://catalog.drexel.edu/coursedescriptions/quart
er/grad/.
[15] Drexel University. Undergraduate catalog 2015-2016[EB/OL].[2015-09-19].http://catalog.drexel.edu/coursedescriptions
/quarter/undergrad/.
[16] College of Information Studies. Course schedules[EB/OL].[2015-09-23].http://ischool.umd.edu/current-students/course-schedules.
[17] Information School, The University of Sheffield.PGT degrees course[EB/OL].[2015-09-24].https://www.shef.ac.uk/prospe
ctus/courses-az.do;jsessionid=AF69761D35AB61D23F009377C23BF4A8.tcs-live-node-01.
[18] School of Information and Library Science, University of North Carolina. Courses[EB/OL].[2015-09-23].http://sils.unc.
edu/courses.
[19] Faculty of Information, University of Toronto. Graduate courses[EB/OL].[2015-09-25]. http://www.ischool.utoronto.ca/graduate-courses.
[20] University of Toronto. Alphabetical listing of program areas and courses[EB/OL].[2015-09-25]. https://student.utm.utoro
nto.ca/calendar/depart_list.pl.
[21] Donald Bren School of Information and Computer Sciences, University of California Irvine. Course listing for 2015-16[EB/OL].[2015-09-23].http://www.ics.uci.edu/ugrad/courses/listing.php?year=2015&level=Graduate&department=ALL&
program=ALL.
[22] University of Maryland Baltimore County. Information systems[EB/OL].[2015-09-23].http://www.umbc.edu/gradschool/gr
adcatalog/programs/info_sys.php.
[23] Department of Information Systems, University of Maryland Baltimore County. Undergraduate course listing[EB/OL].[2015-09-25]. http://informationsystems.umbc.edu/home/undergraduate-programs/undergraduate-course-listing/.
[24] School of Information Sciences,University of Tennessee Knoxville. SIS courses descriptions [EB/OL].[2015-09-24]. http:
//www.sis.utk.edu/courses/listings.
[25] Graduate School of Library and Information Science, University of Illinois. Full catalog[EB/OL].[2015-09-23].http://www.
lis.illinois.edu/academics/courses/catalog.
[26] Rutgers, School of Communication and Information. Master of communication and information studies courses [EB/OL].[2015-09-20]. http://comminfo.rutgers.edu/component/cur,194/option,com_courses/sch,17/task,listing/.
[27] Rutgers, School of Communication and Information. Master of library and information science courses[EB/OL].[2015-09
-20]. http://comminfo.rutgers.edu/component/cur,610/option,com_courses/sch,17/task,listing/.
[28] Rutgers, School of Communication and Information. Ph.D. program[EB/OL].[2015-09-20].http://comminfo.rutgers.edu/co
mponent/cur,194/option,com_courses/sch,16/task,listing/.
[29] Rutgers, The State University of New Jersey. Undergraduate courses[EB/OL].[2015-09-20]. http://catalogs.rutgers.edu/generated/sci_current/pg182.html.
[30] Simmons, Boston. All courses[EB/OL].[2015-09-20].http://internal.simmons.edu/students/slis/current/courses/course-descriptions/all-courses.
[31] School of Information Studies, McGill University ?Montreal. Courses[EB/OL].[2015-09-25].http://www.mcgill.ca/sis/courses.
[32] University of Wisconsin, Madison. Course guide[EB/OL].[2015-09-25].http://public.my.wisc.edu/portal/f/u124l1s4/p/Course
Guide-Browse-Courses.u124l1n31/detached/render.uP?pCm=view&pP_action=advancedSearch&pP_form-submit=true.
[33] School of Library Archival and Information Studies, University of British Columbia. Courses overview[EB/OL].[2015-09-21].http://slais.ubc.ca/programs/courses/course-list/.
[34] University College Dublin. A-Z degree course list[EB/OL].[2015-09-21]. https://myucd.ucd.ie/courses/a-z-list.ezc.
[35] University of Washington. The information school library & information science[EB/OL].[2015-08-16].http://www.washington.edu/students/crscat/lis.html.
[36] University of Washington. The information school information management & technology[EB/OL].[2015-08-16].http://www.
washington.edu/students/crscat/imt.html.
[37] University of Washington. The information school information science[EB/OL].[2015-08-16]. http://www.washington.edu/students/crscat/insc.html.
[38] University of Washington. The information school informatics[EB/OL].[2015-08-16].http://www.washington.edu/students/crscat/info.html.
[39] 司莉,賈歡.美國iSchool圖書情報學人才培養模式的特點與啟示[J].圖書情報工作,2015(2):38-43.
[40] Manyika J, Chui M, Brown B, et al. Big data: The next frontier for innovation, competition, and productivity[EB/OL].[2015-07-20]. http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation.