張梅(浙江杭州蕭山高教園區,浙江同濟科技職業學院基礎部,浙江 蕭山 310000)
可視化技術在近10年國內水利水電類英語期刊論文中的研究與發現
張梅
(浙江杭州蕭山高教園區,浙江同濟科技職業學院基礎部,浙江 蕭山 310000)
大數據時代,可視化技術讓我們快速有效地從數據中觀察到人類社會的復雜行為模式,如何獲取、分析并應用數據來解決社會和商業問題,已成為學術界和實業界面臨的新機遇與挑戰。本文試圖通過大數據可視化技術,力圖清楚呈現近10年國內水利水電類英語特別是農業英語研究的現狀、熱點和發展趨勢,這些發現對指導今后水利水電類英語學術研究方向具有重要借鑒意義和啟示。
可視化技術;國內;水利水電英語;期刊論文;近10年
隨著國際農業科技交流和互聯網技術的快速發展,水利水電類英語的教學與研究日益重要,熟練地掌握及應用水利水電英語已經成為當前水利水電院校學生必備的專業素質。然而,國內有關水利水電英語的研究或者停留在宏觀層的課程體系管理及教學改革,或者注重水利水電英語的語言特點及翻譯策略,利用大數據可視化技術對水利水電英語進行分析研究的卻不多。大數據時代,數據科學讓我們越來越多地從數據中觀察到人類社會的復雜行為模式,針對信息時代的社會化媒體發展和變革,如何獲取、分析并應用數據來解決社會和商業問題,已成為學術界和實業界面臨的新機遇與挑戰。本文以近10年國內期刊的水利水電英語類論文為語料,特別是農業英語方面,采用標簽云等可視化技術,力圖清楚呈現國內農業英語研究的現狀、熱點和發展趨勢,對指導我國水利水電類英語學術研究具有重要借鑒意義和啟示。
可視化(Visualization)又稱為“可視思考、視覺化思考”,本意是使得某物圖像化、圖形化,從而能清晰、直觀地呈現[1]。作為學科術語,“可視化”出現于20世紀80年代,事實上,將任何抽象的事物、過程轉化為可視的圖形或文字的展現方法都可以稱為可視化。隨著大數據的劇增,由于對數據缺乏直觀的印象,人們無法快速了解各個學科甚至同一學科的主要研究領域和主要研究人員以及他們之間的相互關系,更不能快速發現有價值、權威性的文章。因此有必要利用可視化技術對科技文獻開展進一步的分析挖掘,以便更清楚有效地把握科學的發展規律。一幅圖勝過千言萬語,人類從外界獲得的信息約有80%以上來自于視覺系統,當大數據以直觀的可視化的圖形形式展示在分析者面前時,分析者往往能夠一眼洞悉數據背后隱藏的信息并轉化知識以及智慧[7]。通過對相關領域的調研發現,數據挖掘、知識發現和信息可視化技術等信息前沿技術可以有效輔助學術論文的管理,尤其是可視化技術可以使海量數據的展示變得簡潔化、條理化、多維化,可以從不同層面、細節、角度表達傳遞信息,通過對比和比較,快速有效地揭示數據之間的聯系和深層數據的規律,因此將可視化技術與科技論文管理的結合是一種有效的手段。
隨著計算機技術的發展,可視化技術也隨之有了突飛猛進的發展,不僅僅只有科學計算可視化,還包括了數據可視化(data visualization)、信息可視化(information visualization)、知識可視化(knowledge visualization)等一系列的分支。同時新型的數據可視化工具必須滿足互聯網爆發的大數據需求,必須快速的收集、篩選、分析、歸納、展現決策者所需要的信息,并進行實時更新。互聯網+時代,大數據領域已經吸引了計算機圖形學、人工智能、信息檢索、數字圖書館、教育、藝術等多個學科科研人員的關注并取得了一些研究成果,如分析文獻的可視化工具HistCite和CiteSpace[2];分析文本內容間語義關聯的可視化工具NLPWin[3];發現閱讀線索的可視化工具TextArc[4]等均是具有廣泛應用的信息可視化工具。通過文獻分析不難看出,可視化技術實質上是針對不同領域和不同類型的文本信息,實現最大程度的抽象和概括。它不僅僅是圖形圖表的簡單呈現,更大的意義在于幫助使用者發現文本信息間潛在的結構性關聯。目前可視化工具較多,但有些專業性太強,對于一線教師來說,Wordle、Word clouds、Tagxedo等可視化工具比較簡單易操作,且具有友好的用戶交互界面、強大的文字處理能力和絢麗多樣的呈現效果。本文采用了標簽云(Word Clouds)技術,這是一種基于詞頻的可視化形式。借助文字云圖生成工具能快速分析一段文本中詞語的出現頻率并以頗具美感的圖形化方式呈現給用戶,使用戶可以不用通讀全文,就能迅速了解文本概貌和不同文本間關聯程度。
本文重點關注近10年來國內水利水電英語特別是農業英語研究發展的總體趨勢、熱點領域、重要理論及研究方法。論文數據來自于中國知網數據庫中的期刊數據,通過對主題詞進行檢索,檢索年限范圍是2005至2015年,共獲得農業英語33篇,有效地處理篩選數據后,共獲得農業英語30篇,來源文獻包括作者、標題、來源出版物、摘要和參考文獻等。
統計結果顯示,近10年來農業英語領域的研究總體呈逐年階梯式上升趨勢,尤其是2014年論文發表數量劇增(見圖1),研究勢頭的增長或許與2014年中央政府提出的轉變水利水電發展方式,利用互聯網+時代科技技術推動水利水電現代化,大力支持水利水電發展政策有密切關系。在對期刊的分類統計中發現,國內水利水電英語研究論文主要發表在大學校報里比較多,如《西安外國語學院學報》、《北京第二外國語學院學報》、《華中水利水電大學學報》、《湖北科技學院學報》等等,其次是水利水電類期刊,如《湖南水利水電科學》、《安徽農業科學》、《湖南農機》、《農業網絡信息》等,最后是其他類別期刊,如《今日科苑》、《中國科教創新導刊》、《科技視界》等。

圖1 10年來國內水利水電英語研究的發展趨勢(2005-2015)

圖2 農業英語學術論文研究領域分布
從圖2中可以看出,近10年來以“農業英語”為關鍵詞進行研究探討的期刊論文相對集中在水利水電英語語言特點及翻譯方面,比如“淺談農業專業術語的翻譯”、“農業英語的語言特點與翻譯方法”、“淺析農業專業英語的特征和翻譯技巧”等等,不同的學者圍繞農業英語語言特點進行了不同層次和角度的研究論述,不約而同發現了農業英語不同于基礎英語或者其他專業英語的特點,即專業性強、合成詞和派生詞多等。同時基于語料庫的水利水電英語研究領域也引起了同樣高的關注度,2014年就有5位學者從不同角度研究了語料庫在水利農業英語中的應用,如“FAO水利英語被動語態的語料庫研究”、“基于語料庫的農業英語高頻動詞的語義韻研究”、“基于語料庫的FAO農業英語中的動詞名詞化分析”等等,說明語料庫研究對農業英語語言現象研究有著很大的輔助和促進作用;其次是農業英語教學模式方面的研究,也有少數學者專注于對農業詞匯記憶策略的研究和農業英語論文文獻分析。
標簽云的可視化分析清楚明顯地展示了以“農業英語”為關鍵詞研究的重點領域多數集中在農業語言特點分析與翻譯,以及基于語料庫的語言研究方面。標簽云或文字云是關鍵詞的視覺化描述,用于匯總用戶生成的標簽或一個網站的文字內容(見圖3)。標簽一般是獨立的詞匯,常常按字母順序排列,其重要程度又能通過改變字體大小或顏色來表現,所以標簽云可以靈活地依照字序或熱門程度來檢索一個標簽。大多數標簽本身就是超級鏈接,直接指向與標簽相聯的一系列條目[4]。基于標簽云的詞云技術有利于圖形化展示文獻的統計信息,挖掘文獻研究的主題概貌,是一種新型有效的文獻綜述展示工具。

圖3 基于標簽云Words Cloud軟件的農業英語期刊論文研究可視化結果
縱觀2005至2015近10年國內水利水電英語的研究熱點和研究進展,通過可視化技術的應用與分析展現,呈現出以下幾大特點:(1)理論研究數量占絕對比例,實證研究數量非常少。在近30篇期刊論文中大部分是個人觀點陳述,還有部分文獻評述,教學模式探索、人才培養方式改革以及水利水電課程設置可行性分析,這與國外ESP專業英語研究方法的主流趨勢不太相符。(2)同一主題的研究較多,且研究內容和發現具有很大類似性,比如在對水利水電英語詞匯特點的研究上,2014年楊健的研究結論是專業性強、派生法、合成法、縮略詞,這與汪慶偉(2009)總結的三大特點“專業性強、合成詞多和派生詞多”非常類似,無獨有偶,彭俊(2016)在研究水利水電英語詞匯特點的時候也提到“綴合法、復合法、縮合法、首字母縮略法”等;同樣在對翻譯策略方面的闡述時也出現內容極其驚人的類似,說明不同時期不同學者的觀察發現總結具有相似性,但也缺少了點創新性和獨創性。(3)國內水利水電英語領域的研究總體呈上升趨勢,尤其是2013、2014年出現了井噴現象,2013年有7篇論文,而2014年則達到了12篇論文發表,這種高關注度或許與中央政府對水利水電發展的重視度以及相關新政策的發布推動有關。在2014年的12篇中有5篇是基于語料庫的研究,說明計算機科學的飛速發展以及計算機技術在語言研究領域中的迅速普及和應用,國內語料庫建設越來越呈現出普遍性的特點。
綜上所述,將可視化技術作為科學研究分析一個重要部分,通過標簽云tag cloud、知識圖譜分析、Piktochart、Tagxedo、Word Clouds等可視化技術可以清楚有效得出學科研究熱點領域和研究趨勢等結論,這些將對今后研究主體決策活動有很高參考價值。作為定性分析的輔助和補充手段,可視化技術可以為科技文獻的分析和整理做好支持協助作用。但是可視化技術作為一種前沿的信息技術,在應用過程中也遇到許多困難和問題,比如技術的普及化程度有待大力推廣,許多非技術出生的文科類教師在應用該技術的同時會遇到很多的頭疼問題。另外可視化技術的部分應用和算法以及可視化分析過程中與人的交互性研究都需要深入探討。
[1]可視化定義[EB/OL].http://baike.baidu.com/link?url =BQDlHNlmEM9Fa2Huj3AtCJBVAVkKQXUF5YZ_XWyye 2TjGXUA6MGSCiApOg8ApmRZoWJ__rBMkycQeE4m 5ywY0K.
[2]CHAOMEI CHEN.CiteSpace II:Detecting and visualizing emerging trends and transient patterns in scientific literature[J]. Journal of the American Society for Information Science and Technology,2006,57(3):359-377.
[3]JURELWSKOVES,M.G.,NATASAMILIC-FRAYLING. Learning Sub-structures of Document Semantic Graphs for Document Summarization[C].LinkKDD,2004.
[4]PALEY WB.TextArc:Showing Word Frequency and Distribution in Text[R].IEEE Symposium on Information Visualization,2002.
[5]標簽云定義[EB/OL].http://www.uisdc.com/onlinewordcloud-generators.
[6]彭 俊.農業英語的特征與翻譯[J].教育在線,2016:86-87.
[7]任 磊,杜 一,馬 帥,等.大數據可視分析綜述[J].軟件學報,2014,25(9):1909-1936.
[8]汪慶偉.農業英語的語言特點與翻譯方法[J].華中農業大學學報(社會科學版),2009(4):124-128.
[9]楊 健.農業英語的語言特點與翻譯策略[J].吉林廣播電視大學學報,2014(5):136-137.
[10]趙 琦,孫 坦.文本可視化及其主要技術方法研究[J].現代圖書情報技術,2008,24(8):24-30.
TP391.41
A
1672-5387(2016)05-0070-03
10.13599/j.cnki.11-5130.2016.05.025
2016-03-30
張梅(1977-),女,講師,碩士,研究方向:英語教學法和二語習得。