999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

疫情背景下圖書館輿情感知與監(jiān)控策略探析

2022-02-08 10:24:33王海川
內(nèi)蒙古科技與經(jīng)濟 2022年1期
關鍵詞:圖書館文本疫情

王海川

(河北工程大學,河北 邯鄲 056038)

在信息化的時代,社交網(wǎng)絡的飛速發(fā)展給人們的生活與學習帶來了深刻影響,人們在身處現(xiàn)實世界的同時,普遍熱衷于在虛擬世界尋求“身體在場”與“精神在場”的空間秩序的體驗,虛擬的社交網(wǎng)絡是對現(xiàn)實世界的投射,又不可避免地對現(xiàn)實世界產(chǎn)生影響。因此,各行業(yè)特別是服務行業(yè)非常重視用戶在社交網(wǎng)絡中的相關評價。圖書館從本質(zhì)上來說也是一類服務行業(yè),其服務品質(zhì)的優(yōu)劣直接影響到讀者對于知識的獲取、內(nèi)化的水平。2020年,一場席卷全世界范圍的新型冠狀病毒肺炎疫情至今沒有停息,該種病毒極具傳染性,這一特性甚至重塑了人們在線下公共場所活動的規(guī)則與秩序,產(chǎn)生了深遠的現(xiàn)實影響。在這一背景下,圖書館應當給予線上用戶評價同樣的重視,即應當對網(wǎng)絡用戶相關評價進行監(jiān)測。

1 概念及研究現(xiàn)狀

圖書館的網(wǎng)絡監(jiān)測分為兩個部分,即公眾形象感知和突發(fā)事件監(jiān)測。前者代表用戶的日常評價所形成的圖書館認知體系,后者代表了圖書館在突發(fā)事件時在網(wǎng)絡中的檢測、預警和化解的能力。這是圖書館輿情監(jiān)控系統(tǒng)的兩個重要組成部分。

對于前者,陽玉堃在社交文本海量采集的基礎上,從基礎設施、館員服務、機構(gòu)管理、館藏文獻等方面對文本進行剖析,并結(jié)合了關鍵詞、高頻詞、語義網(wǎng)絡等技術,將對于圖書館不同方面的印象進行了可視化的展示,這為讀者感知研究提供了新的途徑[1]。

對于圖書館的突發(fā)事件,張偉認為應當建立輿情信息預警平臺,要主動收集,分析涉及圖書館公共安全方面的信息,對于危機事件要能夠及時了解,分析和預警,以保證館舍的安全[2]。但是該文對于系統(tǒng)架構(gòu)技術論述較少。馬益勇則認為應當設立圖書館輿情崗位,建立圖書館館外合作機制,并且做好輿情監(jiān)測的統(tǒng)籌角色,集思廣益,提高圖書館在各個領域的角色價值。

總體來看,對于圖書館輿情監(jiān)測方面的研究還較少,且未結(jié)合疫情這一新的背景形勢。因此,筆者的選題具有一定的現(xiàn)實與研究價值。

2 疫情給圖書館輿情監(jiān)測工作帶來的挑戰(zhàn)

首先是圖書館在決策層面上需要給予足夠的重視,要充分認識到疫情情況下,任何公共事件的發(fā)生都具有更大的危險性,不僅會影響到正常的工作秩序,更會在網(wǎng)絡上引發(fā)較大的事件漲落,因此如何處理、如何防范、如何善后,這是新問題帶來的新挑戰(zhàn)。

疫情的流行改變了人們在圖書館等公共場所的活動規(guī)則,即在正常情況下可以開展的閱讀推廣、講座、會議等必須改為在線上進行,這意味著會后更多的圖書館用戶也會傾向于在網(wǎng)絡中針對圖書館的服務、管理、館藏文獻水平以及館舍硬件好壞發(fā)表感想,進行討論,同時對圖書館在線服務水平進行評價,這會使得相關的關鍵詞大幅增加。

在疫情期間,由于人們的心理狀態(tài)處于相對敏感時期,各項線下防疫措施較為嚴格,各項活動安排會受防疫工作影響,因此相應的,在圖書館這類公共區(qū)域,突發(fā)事件的發(fā)生概率也會較高。那么就意味著,在社交網(wǎng)絡中,相關事件漲落發(fā)生的概率也較大。事實上,即使在平時,圖書館相關的網(wǎng)絡熱點事件也是存在的。例如在2018年12月份,安徽某學院的一位學生在圖書館大廳背書,因為聲音較大而與管理員發(fā)生口角,并進而發(fā)展為摔杯子事件。這一事件在社交網(wǎng)絡上被持續(xù)關注,評論數(shù)為6 193,轉(zhuǎn)發(fā)數(shù)為2 300,點贊數(shù)為7 600。這在圖書館的相關事件中的關注度是較高的。又如2019年山東某大學的兩名同學在圖書館因爭搶座位而打架,最終被學校處以警告處分,并被圖書館列入讀者黑名單。這一事件在微博上引起軒然大波,至今閱讀量已達206萬,評論及轉(zhuǎn)發(fā)也達5 000余次。這是圖書館輿情分析的重要資源。那么在疫情期間,可以推知的是,在社交網(wǎng)絡中,這類圖書館公共事件勢必會與疫情因素相互疊加,產(chǎn)生更大的影響力和傳播力。這是圖書館工作需要特別關注的。

在技術的應用上,疫情背景下的輿情監(jiān)測,需要圖書館加強對包含特定關鍵詞數(shù)據(jù)的探測,及時掌握用戶情緒動向,特別是要警惕謠言的產(chǎn)生與辨別,平臺要具有發(fā)現(xiàn),分析研判,上報甚至報警功能,這也是疫情背景下對輿情工作提出的挑戰(zhàn)。

在疫情背景下,社交網(wǎng)絡中的相關數(shù)據(jù)量激增,而且在相當長的一段時間內(nèi)必將持續(xù)產(chǎn)生大量相關文本,這對系統(tǒng)可靠度提出了更高的要求。事實上,在疫情常態(tài)化的實際情況下,如何增強冗余性,保證疫情監(jiān)控平臺的長期,不間斷的運行,這是對圖書館輿情監(jiān)測提出的又一項挑戰(zhàn)。

3 輿情監(jiān)測平臺的技術架構(gòu)

輿情平臺的基本架構(gòu)涉及數(shù)據(jù)采集、模型訓練、數(shù)據(jù)處理、結(jié)果輸出等多個環(huán)節(jié),需要利用爬蟲、分類器、模型訓練等多種技術。

3.1 數(shù)據(jù)爬蟲

爬蟲是輿情檢測系統(tǒng)的前端模塊,它的主要作用是模擬瀏覽器向特定的網(wǎng)站HTTP發(fā)送網(wǎng)絡請求Request,接受請求響應,按照一定的規(guī)則,自動的抓去網(wǎng)站信息上并獲取數(shù)據(jù)到本地。這是一種代替人工的自動化模塊。按照不同的類型,爬蟲可以分為通用爬蟲、聚焦爬蟲、功能性爬蟲、數(shù)據(jù)增量爬蟲等。一個完善的爬蟲模塊應當是框架結(jié)構(gòu)合理,獲取技術優(yōu)良,高度優(yōu)化的代碼,容易管理和維護。在通常的輿情檢測系統(tǒng)中,爬蟲的運行是以周、月來計算的,數(shù)據(jù)量非常大,優(yōu)秀的爬蟲設計能夠保證系統(tǒng)在這一過程中少犯錯誤。同時,爬蟲在實現(xiàn)數(shù)據(jù)采全的基礎上,要做到較少的占用資源。對于爬蟲來說,主要的判斷標準有:獲取時間、請求解析時間、腳本支持、CPU占用等。此外,長時間運行的爬蟲還應當保證不會出現(xiàn)內(nèi)存泄漏。目前一些網(wǎng)站安裝有反扒策略,例如,網(wǎng)站后臺會監(jiān)控來自同一IP地址的大量訪問,或者要求必須要有訪問賬號,或者是不定時彈出驗證碼識別等。而爬蟲要能夠模仿人類操作,采取聯(lián)合爬取,自動注冊賬號,模擬User-Agent,訪問時帶cookie等。

3.2 數(shù)據(jù)預處理模塊

數(shù)據(jù)分析模塊集中了一系列數(shù)據(jù)預處理、數(shù)據(jù)分類、主題抽取等技術。在預處理功能中,包括分詞,移除微博文本中的網(wǎng)絡符號、超鏈接、亂碼、停用詞、重復數(shù)據(jù)清除、非漢語清除、大小寫轉(zhuǎn)化等,總之就是清除所有的不規(guī)范數(shù)據(jù),將主要文本的微博數(shù)據(jù)轉(zhuǎn)換為規(guī)范數(shù)據(jù),減少數(shù)據(jù)噪聲,得到質(zhì)量更好的數(shù)據(jù)。目前Python語言的一些庫,如Jieba、Numpy等被用來實現(xiàn)上述功能。

接下來是文本特征提取,這是監(jiān)測系統(tǒng)中對文本重點詞匯進行分析的環(huán)節(jié),是用來區(qū)分。最常用的有TF-IDF,其基本思想是在一段文本中出現(xiàn)多次的單詞,再另一個同類文本中也會出現(xiàn)多次,反之,一個單詞很少在一個文本中出現(xiàn),那么其在同類文本中也很少會出現(xiàn),這就能夠衡量出該詞的特征區(qū)別度,即字詞的重要性隨著它在文本中出現(xiàn)的次數(shù)呈正比增加,但隨著該詞在語料庫中出現(xiàn)的頻率成反比下降。這一算法被廣泛地應用在了各類檢索模型。

另一個常用算法是信息增益(IG),其基本思想是衡量該詞能夠為系統(tǒng)帶來多少信息,帶來的信息越多,該特征就越重要。即信息熵的改變程度。此外,還有獨熱編碼,互信息等算法可供選擇。

3.3 分類模型構(gòu)建

分類模型的構(gòu)建是輿情監(jiān)測系統(tǒng)的核心。也是學者研究較多的方面,在機器學習的時代,貝葉斯、向量積、決策樹、集成學習、邏輯回歸等都能完成這一任務,其中,貝葉斯算法較為簡單和經(jīng)典。它認為,在文本中,兩個詞之間的關系是相互的,一個對象的特征向量中每個維度都是相互獨立的。在訓練階段,貝葉斯程序能夠從詞袋中收集信息,學習每一種兩兩詞組合的后驗概率,通過比較概率的大小來得到文本所屬的類別。一般來說,對于社交文本的文本分類來說,上述算法是能夠完成任務的,但是目前,神經(jīng)網(wǎng)絡算法正被得到廣泛的應用,這類算法模擬人腦工作的原理,構(gòu)建出很多個神經(jīng)元,其本身具有輸入層、隱藏層和輸出層,之間的計算辦法就是加權求和激活,即Sigmoid函數(shù)。以TextCNN為例,這些算法能夠?qū)⑽谋窘馕鰹榫仃嚕褪菍⒂柧毤奈谋咎卣飨蛄炕斎耄诮?jīng)過連接點權重傳入下一層,這一層的輸出是下一層的輸入。自然語言是一維數(shù)據(jù),向量化進入卷積層后與卷積核做一個point wise的乘法后求和,然后是卷積。接下來,算法掃描向下滑動,持續(xù)輸入,持續(xù)做point wise乘法后求和,然后是池化層,以降低參數(shù)的數(shù)目。最后由softmax函數(shù)做分類。這是一個基本的流程。神經(jīng)網(wǎng)絡算法的優(yōu)點在于是具有較強的非線性映射能力,實現(xiàn)了從輸入到輸出的映射功能。此外,神經(jīng)網(wǎng)絡還具有一定的泛化能力,對于新的或者帶有噪聲的數(shù)據(jù)也能有較好的分類能力。

目前,神經(jīng)網(wǎng)絡算法發(fā)展出了遞歸神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡等,并且自注意力機制等也逐漸被加入進來,算法機制逐步成熟。因此,神經(jīng)網(wǎng)絡算法模塊是數(shù)據(jù)解析模塊的首選算法。

3.4 分析結(jié)果管理模塊

在一個成熟的監(jiān)控系統(tǒng)中,目標文本應當能夠被按照各種口徑進行劃分,比如某個事件段的情感比例、情感數(shù)量、高頻詞匯、關鍵詞語義網(wǎng)絡、文本主題分類、用戶行為分析等,并且能夠可視化的輸出時序圖、分類圖等,以供使用者參考和決策輔助之用。

3.5 數(shù)據(jù)庫

數(shù)據(jù)庫的作用是用來存儲爬蟲所收集的數(shù)據(jù)字段內(nèi)容,對于社交網(wǎng)絡文本,往往包括了發(fā)布者、文本內(nèi)容、發(fā)布時間、點贊數(shù)、轉(zhuǎn)發(fā)數(shù),評論數(shù)和評論文本、發(fā)布用戶等字段,以被調(diào)用和存儲分類結(jié)果。

4 疫情背景下輿情系統(tǒng)的改進策略

新冠肺炎疫情是圖書館在發(fā)展中面臨的新課題,綜合以上所述,圖書館輿情監(jiān)測工作應當從管理和技術兩個方面進行改進。

4.1 管理方面的改進

圖書館是社會、學校中理所當然的公共場所,并且閱讀活動具有一定的私人性質(zhì),小規(guī)模聚集,討論是應有之義。那么在此時的輿情監(jiān)測方面,①應當成立專門的管理小組,專人負責,集中利用系統(tǒng)定制收集讀者對于圖書館文獻服務、館舍布局、疫情防控措施等方面的意見建議。②要注意疫情期間輿情信息的公開透明,對內(nèi)部應當充分共享,以利于合作防控,對于外部要及時生成輿情期間的輿情監(jiān)測報告,下情上達。要特別關注開學、學期末期、學生畢業(yè)等關鍵節(jié)點的輿情監(jiān)測工作,發(fā)揮系統(tǒng)的技術優(yōu)勢。同時要做好基于疫情報告的引導工作,及時發(fā)現(xiàn)問題,制定措施,解決問題。注意信息的對外及時公布,避免引起恐慌。

4.2 技術方面的改進

目前,基于神經(jīng)網(wǎng)絡算法的分類器技術發(fā)展迅速,BERT,Transformer,self-attention等技術的加入使得分類的準確度更高,運行速度更快,系統(tǒng)學習率更高,因此應當采用最新技術來提高系統(tǒng)性能。

在疫情背景下,輿情分析系統(tǒng)應當能夠有重點的實施日常和突發(fā)事件中的監(jiān)控行為。①語義分析,即需要分析“疫情”“新冠”等特定關鍵詞所聯(lián)系較多的詞匯有哪些,這些詞匯那些與圖書館由關聯(lián),那些直接指向圖書館的服務,應當被明確。②情感分析。文本的情感分析是輿情分析中重要的一個方面,如前所述,疫情期間用戶的情緒與平時相比較為敏感,因此輿情系統(tǒng)應當感知到日常閱讀活動中讀者的情緒有哪些是消極的,那些是積極的,而這些積極與消極的情緒所指向的圖書館服務的那些方面也應當明確。③目前,國內(nèi)的疫情已經(jīng)持續(xù)一段時間了,在這期間,關于疫情的關鍵詞在不斷地變化,死亡率、感染率、無癥狀、環(huán)境等詞匯,系統(tǒng)應當增加基于這些關鍵詞的疫情態(tài)勢圖,同時應當注意與圖書館、閱讀等詞匯共線的文本都是哪些,并展開深入研究。

猜你喜歡
圖書館文本疫情
戰(zhàn)疫情
抗疫情 顯擔當
人大建設(2020年5期)2020-09-25 08:56:22
疫情中的我
37°女人(2020年5期)2020-05-11 05:58:52
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
飛躍圖書館
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
圖書館里的是是非非
主站蜘蛛池模板: 日韩精品成人在线| 欧美一级夜夜爽www| 国产在线专区| 小蝌蚪亚洲精品国产| 波多野结衣一区二区三区AV| 91亚洲视频下载| 草逼视频国产| 国产传媒一区二区三区四区五区| 好吊色妇女免费视频免费| 九九九精品成人免费视频7| 亚洲国产成人无码AV在线影院L | 六月婷婷精品视频在线观看| 欧美黄色a| 亚洲免费人成影院| 欧美精品不卡| 国产尹人香蕉综合在线电影| 亚洲第一福利视频导航| 成人韩免费网站| 色妞永久免费视频| 欧美一级高清片久久99| 日韩一级二级三级| 毛片基地视频| 婷婷久久综合九色综合88| 久久永久精品免费视频| 国产成人无码综合亚洲日韩不卡| 国产性爱网站| 欧美色香蕉| 青青操视频免费观看| 久久这里只有精品国产99| 99视频免费观看| 国产激情无码一区二区免费| 亚洲AV无码久久天堂| 久久香蕉国产线看观看亚洲片| 成人午夜视频网站| 日韩毛片在线播放| 国产精品成人一区二区不卡 | a亚洲视频| 国产夜色视频| 爱色欧美亚洲综合图区| 无码一区18禁| 91午夜福利在线观看| 欧美日本激情| 综合久久久久久久综合网| 性欧美久久| 免费人成网站在线高清| 美女被操91视频| 亚洲AV无码精品无码久久蜜桃| 亚洲性影院| 九色综合伊人久久富二代| 中国国产A一级毛片| 国产精品美女自慰喷水| 亚洲小视频网站| 精品国产免费人成在线观看| 亚洲国产成人精品青青草原| 久久福利网| 777国产精品永久免费观看| 亚洲一级毛片在线播放| 无码有码中文字幕| 在线观看热码亚洲av每日更新| 国产欧美精品专区一区二区| 黄色网页在线播放| 亚洲一道AV无码午夜福利| 狠狠v日韩v欧美v| 久久久久夜色精品波多野结衣| 国产精品观看视频免费完整版| 在线精品视频成人网| 有专无码视频| 久久婷婷国产综合尤物精品| 日韩欧美高清视频| 国产色偷丝袜婷婷无码麻豆制服| 任我操在线视频| 国产精品免费久久久久影院无码| 亚洲va在线观看| 亚洲无码在线午夜电影| 国产91九色在线播放| 99视频在线看| 新SSS无码手机在线观看| 播五月综合| 亚洲视频影院| 国产打屁股免费区网站| 欧美另类视频一区二区三区| 一区二区午夜|