羊 晚成 邵 慧
(1.浙江萬里學院物流與電子商務學院,浙江 寧波 315000;2.寧波大學人文與傳媒學院,浙江 寧波 315000)
在智媒時代,快速發展的互聯網、大數據、云計算、人工智能等技術使得媒體格局正在重構。數據新聞作為一種基于數據驅動的新型新聞報道方式,在業界得到快速發展與應用。
在此環境下,對數據新聞相關人才的培養教育也提出了新要求,學生除需要掌握傳統的基本業務之外,還需要用于數據處理和數字敘事等新技能。目前,我國數據新聞教育開始時間較短,在實施過程中也多存在技術恐懼、師資缺乏、實踐平臺缺乏以及技術支持不足等困惑與問題。數據新聞作為一種基于數據的抓取、清洗、分析和可視化呈現的新型報道方式,其生產過程以及涉及的專業知識可通過模塊化的思想解構為相互關聯的知識模塊。據此,本文依托于寧波大學人文與傳媒學院所開設的本科生數據新聞與可視化課程,將模塊化任務教學方法應用于本科階段數據新聞課程教學之中并對此進行總結分析,有助于新聞傳播專業學生培養一定的數據新聞作業能力。
進入智媒時代,互聯網技術日新月異,新聞生產、算法分發、輿情分析等新興技術層出不窮,融媒體記者、數據研究員、數據編輯等新興崗位的出現,拓寬了記者、編輯等傳統職業的邊界,為了應對業界的變化,各大院校積極調整新聞傳播專業及其課程設置,數據新聞類課程的興起,便是這種調整過程中的代表之一。目前,各大院校新聞傳播專業已普遍開設數據新聞課程,例如,中國人民大學、清華大學、北京大學、復旦大學、武漢大學等。筆者通過問卷調查后發現,這些高校多以設置系列課程的方式開展數據新聞教育,并且從概念到實操、從基礎到進階設置課程體系,教學內容則包括網頁數據抓取、數據處理及數據可視化等多個方面。在教學模式方面,則逐漸摸索出跨學科融合教學模式、獨立專業教學模式和數據新聞工作坊教學模式等。隨著這些教學模式的改進,雖然能夠在一定程度上解決師資缺乏、實訓平臺缺乏、技術支持不足等問題,但是大多數高校數據新聞課程所面對的學生多以文科學生為主,生源較為單一,容易因專業基礎限制而在協調掌握網頁抓取、計算機編程、數據分析等方面存在困難。
因此,需要從基本的教學方法入手,改善數據新聞的教學效果。從數據新聞課程教學的發展來看,數據新聞課程至今尚未形成標準的教學內容,但普遍認為一個完整的數據新聞實踐項目應該包含數據采集、數據清洗、數據分析和數據可視化四個基本的教學環節,這就為實施模塊化項目式教學提供了良好的課程體系基礎。
模塊化項目教學就是將課程內容按照知識體系模塊化,按照實踐步驟項目化,是模塊化教學和項目式驅動教學相融合的一種教學方法,特點在于每個模塊和項目具有獨立性,將理論知識與實踐項目緊密結合。該教學方法以課程知識體系為中心,將相關理論、基本原理、相關技能劃分為內容獨立而又相互依賴的教學模塊,同時以項目為載體,從解決對應模塊在實踐中的實際問題出發,以逆序的方式幫助學生構建相關知識體系,其本質是以學生為中心,強調學生對知識的主動探索、主動發現和對所學知識結構的主動建構。在模塊化項目教學中,每個模塊劃分需參照學生的實際情況及能力需求進行劃分,突出模塊的目的性和實用性。學生完成每個項目之后,都能獲得對應模塊的新知識與新技能。
將模塊化項目教學法應用與數據新聞課程的教學之中,通過項目驅動的方式,以啟發式、研討式等教學手段開展課程教學,依據項目成果對該教學模式的實踐成果進行評價。具體教學設計圖如圖1所示。從中可見,從實際生活中尋找熱點事件作為數據新聞教學的資源,例如,熱點新聞、熱點影視、熱門圖書等,將這些教學資源與教學內容建立聯系,并且通過問卷調查了解學生的基礎知識及興趣點,根據調查結果整合優化教學內容,制定適合于學生教學內容并整合知識模塊,根據項目任務設計主導問題和單元問題。在課堂上講解知識模塊并演示需要使用的工具軟件,理清項目任務中需解決的問題;在課下學生以主導問題為驅動,查閱資料、操作工具軟件、解決問題,學生在自主學習過程中的疑惑則由教師全程指導。在項目任務完成后,則由學生在課上匯報交流項目任務完全情況,其中若存在不正確或不完全的內容則由教師進行糾正與補充。這種以模塊化項目任務為驅動、以學生為主的教學方式,將知識模塊劃分為實際項目,并且將項目劃分為一個個微小而具體的主導問題,可避免文科學生在學習數據新聞課程中產生“技術恐懼”,同時讓學生有充足的時間自己動手解決問題,避免了學生出現“課間似懂非懂、課后無從下手”的情況。

圖1 數據新聞模塊化項目教學課程設計流程圖
根據數據新聞的制作基本可分為數據抓取、數據清洗、數據分析和數據可視化四個步驟,需要學生具有良好的數據處理和數字敘事技能。在本次數據新聞與可視化實踐過程中,通過問卷調查發現學生在數字敘事方面已具備較好的能力,在數據處理中對于結構化數據具有一定的處理能力,但對非結構化數據的處理能力較弱;對于第三方工具的使用能力較好,但對計算機編程分析數據的能力較弱。據此,根據數據新聞課程的培育目標,結合學生的實際情況對教學內容進行模塊化,基本分為網頁數據抓取、數據集清洗、非結構化數據分析、可視化呈現四個知識模塊,同時設置“熱門電視劇(或圖書)傳播效果分析”作為實操項目,將四個知識模塊進行串聯。
在網頁數據抓取模塊中,因學生并不擅長編寫程序實現數據抓取,故重點引入第三方數據抓取工具“八爪魚”作為該模塊中的主要技術工具。將網頁數據抓取模塊,按照“八爪魚”抓取方式分為使用模板采集和自定義采集兩大子模塊。在每個子模塊中,根據網頁數據類型設置采集單個數據、采集列表數據、采集表格數據、從列表進入詳細頁采集數據、翻頁采集數據等多個項目任務。同時,利用“八爪魚”的數據清洗功能,將數據清洗模塊設置為網頁數據抓取的子模塊,并設置字段合并、字段格式化、正則表達式、空字段處理等項目任務。經過該模塊項目所獲得的數據即成為下一個模塊項目的輸入數據。
在數據分析模塊中,依據對學生的問卷調查結果,發現學生對結構化數據具有一定的處理能力,但在非結構化處理方面能力較弱。據此,本模塊則以非結構化數據分析為重點劃分知識模塊,同時將結構化數據處理放置于該模塊的項目之中,讓學生能同時實操兩種類型的數據分析。在本次課程中,選擇數據新聞中最常處理的自然語言文本為非結構化類型數據,按照自然語言處理框架將該模塊劃分為詞法分析和信息抽取兩個子模塊。在詞法分析中設置中文分詞、停用詞過濾、詞性標注、命名實體識別等項目任務,在信息抽取中設置關鍵詞抽取、關鍵短語抽取和文本摘要抽取等項目任務。選用Python語言及自然語言處理插件HanLP,作為各項目任務的實現技術工具,能夠讓學生在低代碼量的情況下完成數據分析任務,降低數據新聞教學中的技術接受難度。同樣,在該模塊項目中得到的數據分析結果,將成為下一模塊項目的輸入數據。
在可視化呈現模塊中,根據數據可視化特征將該模塊劃分為趨勢型數據可視化、對比型數據可視化、比例型數據可視化、分布型數據可視化等子模塊。依據數據分析模塊所得結果在各子模塊中設置分詞結果可視化、詞性標注可視化、關鍵詞可視化等任務。讓學生使用不同的可視化方案對數據結果進行展示,感受每種可視化方案的優劣。最后,將以上四個模塊所得結果進行綜合,可得到完整的數據新聞作品,即完成了課程之處所設置的熱門電視劇(或圖書)傳播效果數據新聞。
對寧波大學人文與傳媒學院所開設數據新聞與可視化課程進行模塊化項目教學實踐,共18名新聞傳播專業學生參與此課程的學習。在介紹數據新聞基礎知識后,由學習自主選擇熱點電視劇或熱門圖書為實操項目中的分析對象。根據知識模塊安排課程進度,課上講解為相關知識點并代領學生實際操作后,介紹主導問題,讓學生在課后以該問題為驅動,借助參考書、網絡資料等來解決問題。在下次課上,學生匯報數據處理實際情況,如抓取數據樣本量、數據描述性統計、自然語言處理結果、可視化展示等,同時交流解決問題過程中所遇到的困難及解決辦法。教師及時評價學生匯報結果,糾正錯誤內容,補充不足之處。對于共性問題所對應的知識子模塊,則及時調整至課程內容之中,進行重復性講解。
經過一學期的教學實踐之后,在此通過問卷調查對數據新聞模塊化任務教學的效果進行評價。如圖2所示其中,有94%的學生表示在經過該教學模式之后對數據新聞的制作興趣有顯著提升,大部分學生已消除對于數據新聞的“技術恐慌”。因引入簡單易操作的第三方抓取工具,所有學生的數據抓取能力均得到有效提高。同時,有接近90%的學生提高了數據清洗的能力。在數據新聞制作中,難度最大的數據分析部分,通過引入第三方Python插件并減少代碼編寫量的方式,使得83%的學生認為自身數據分析能力得到有效提高。最后,結合學生熟悉的Excel及簡單的Python繪圖語句,使得94%的學生在數據可視化方面得到能力提升。經過模塊化項目教學模式之后,所有學生認為其自主學習能力得到有效提高。由此可知,在數據新聞與可視化課程中應用模塊化項目教學后,能夠更好地消除學生對數據新聞的“技術恐慌”心理,提升學生對于數據新聞相關知識與技能的接收掌握能力。同時,該教學方法也提高了學生自主學習的能力,讓課程學習更有目的性,這也是數據新聞人才培養的基礎與核心。

圖2 數據新聞模塊化任務教學效果評價
對于學生數據新聞制作能力、信息素養的培育需要貫穿于整個數據新聞課程之中,需要選擇合適的教學方法,以學生為本,制定合適的教學目標,組織教學活動。在數據新聞課程中應用模塊化項目教學方法能夠以具體目標為出發點,將成體系的知識結構劃分為知識模塊,并通過項目驅動的方式,讓學生具有明確的學習目標,引導學生自主開展學習。在應用模塊化項目教學方法的過程中,需要以學生的實際情況為基礎,組織優化教學知識模塊,并通過選擇貼近學生實際生活的素材構建項目任務,以此來激發學生對于數據新聞的學習興趣。同時,在模塊劃分及項目任務設置的過程中需要緊緊圍繞課程之處所設立的項目目標,以此幫助學生將模塊化的知識進行整合,形成完整的數據新聞知識體系。