999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

“互聯網+查收查引服務”自動化平臺的構建與優化策略研究*

2019-12-05 05:47:48馬云輝周文云
圖書館研究與工作 2019年12期
關鍵詞:數據庫微信服務

馬云輝 周文云

(蘇州大學圖書館 江蘇蘇州 215006)

1 引言

近年來,我國高校、科研院所、企事業單位資源日益豐富,政府高度重視創新,查收查引業務越來越錯綜復雜。諸如蘇州[1]等地區,其查引服務體量在幾年內增加了數十倍,服務對象涵蓋了“國家自然科學基金”“國家杰出青年科學基金”及其團隊等千余個,業務量平均年增長30%以上。傳統的查收查引服務模式已不能適應社會發展需要,現階段存在的發展局限主要有:用戶需求量大且多變,依靠手工檢索已不能滿足;沒有特定的受理業務渠道;缺少統計分析,不能緊密跟蹤科研評價動態;多由查新站承擔查收查引服務職能,兩項服務同時處于高峰委托時段,科研需求繁復多樣與人力資源有限之間的矛盾凸顯;用戶、館員情感體驗均較差。因此,圖書館必須依靠其專業的館藏和人才資源開拓創新。本文將從查收查引現狀及存在的問題出發,結合科研需求的實際情況,研究“互聯網+”業態下查收查引服務的平臺開發及優化途徑,旨在更好地為區域科研發展提供支撐,并為創新聚力地區圖書館在科研服務方面提供借鑒經驗。

2 研究現狀

我國有關查收查引方面的文獻,主要集中在:①自主開發或購買查收查引系統,如北京大學馬芳珍等人評價CALIS查收查引系統[2];山東大學師曉青等人設計在線查收、查引和查新檢索系統[3];華北電力大學陳月從等人公開基于互聯網+技術(云平臺和移動終端)的自動查收查引方法[4]。②利用數據分析、文獻管理等比較成熟的計算機軟件,機構庫自主開發查收查引軟件,如中國醫學科學院蔣君等人運用Excel和VBA實現論文查收查引工具[5];上海交通大學關智遠等人利用Java的Word文檔編輯庫docx4j結合自編程序分析數據、實現報告[6];中國科學技術大學張雪娟等人將Note Express應用于查收查引[7];蘭州大學劉艷民等開發基于機構知識庫CSpace的查收查引功能[8]。③對查收查引服務流程或其中部分環節進行研究,如:北京郵電大學侯瑞芳等人對查收查引服務進行優化[9];西安交通大學陳偉等人基于批量處理構建查收查引報告工作流程[10]。

116所教育部認定的大學圖書館查新站中,使用Web系統處理業務的僅15所,如浙江大學、南京大學等,大部分圖書館仍采用郵件或當面受理委托單,利用手工檢索完成查收查引服務。

綜上所述,現有研究主要側重于查收查引的瓶頸問題分析、提高服務質效的半自動或自動化途徑研究,系統在去自引計算、調用歷史等過程中多需人工干預,軟件輔助不適合批量處理業務,將機構知識庫與查收查引相結合的又對校外讀者并不適用。因此,在探討服務質效提升的同時,“互聯網+”業態下,面向查收查引自動化服務平臺開發及建立全方位優化策略體系顯得尤為迫切。

3 “互聯網+查收查引服務”自動化平臺的構建

3.1 平臺設計思路

當前,手機等智能設備給人們的生活帶來了翻天覆地的變化。如果將查收查引服務以易于接受的智能終端和個人電腦都能使用的Web形式呈現給讀者,僅用手機驗證碼或微信掃碼進入,不再區分校內外讀者、作者本人還是代辦者,并進行更新狀態的微信或短信實時提醒,將更好地滿足時下人們手機不離手的社交習慣。

Web of Science等平臺數據庫目前都是采用IP限制用戶在校園訪問,使用云平臺后可以不受地域限制,將讀者歷次提交的文獻匯總建立機構庫,方便檢索人員、用戶隨時隨地調用歷史數據,需要增加的新文獻部分在進入校園網數據庫檢索后補充入庫,減少了每次提交、檢索等大量重復工作。雖然有高校開通API接口建立本校作者成果庫[11],但是該服務費用昂貴,且定期審核數據庫自動推送的文獻也只能覆蓋校內讀者,不確定的文獻又需交由讀者認領,這些讀者是否都需要檢索服務無法預知。因此,該平臺開發著重于讀者真實需求,建立一邊高效完成服務、一邊建立機構成果庫的完善系統。

在查引過程中,檢索人員的精力主要集中在引用部分,特別是他引的判斷上,往往需要對照發表和施引文獻中的作者姓名、地址字段,將自引的文獻排除,一一手動甄別計算得出他引次數。當文獻較多時,利用數據庫分析工具,部分疑似自引的施引文獻則無法關聯顯示,仍然需要人工計算。因此,考慮采用基于作者姓名和地址片詞,將引文和發表論文中的信息進行模糊匹配計算,實現自動去除自引,提高結果的精確率。

3.2 平臺體系架構

平臺以用戶為中心,面向兩大層面:校內外讀者。廣泛意義上的高校圖書館員,既包括從事查收查引工作的檢索員,又包含管理員以及一些需要統計分析數據的校內人員(如人事、科研等部門)。平臺體系架構如圖1所示。

3.3 主要功能模塊設計

3.3.1 云通訊實現手機號驗證碼或微信登錄、狀態更新自動提醒

圖1 平臺體系架構圖

現有查引平臺主要采用輸入用戶名、一卡通、郵件和密碼登錄的方式[11-13],這些名稱密碼較為復雜,容易被遺忘。采用手機短信發送驗證碼、微信登錄等方式,并設置狀態更新提醒,能更好契合讀者的使用習慣。

短信服務(Short Message Service)由阿里云提供,支持快速發送短信驗證碼、短信通知等,短信驗證碼3秒可達并采用三網合一專屬通道[14],后端服務處理完成可回調通知用戶,進而減少用戶、Web前端和后端服務之間大量不必要的輪詢請求。

微信OAuth2.0授權登錄[15]目前支持authorization_code模式,適用于server端的應用。微信登錄獲取狀態更新提醒,需將web平臺嵌入微信公眾號,公眾號同時需被關注,或微信登錄同時綁定手機。

3.3.2 利用數據庫個性化功能和云平臺建立作者論文、查引報告庫

由于作者在Web of Science等平臺數據庫中收錄的論文和引文信息是不斷更新的,因此,系統必須根據數據變化更新作者論文庫。以Web of Science為例,其提供Web of Service Lite、AMR、Web Service Premium等幾種API接口[16],局限性主要在于批量查詢、大規模檢索、獲取多個字段信息均為收費項目,查新站需定期審核論文,如不成功,還需提供Web頁面交由用戶認領完論文再入庫。這些無疑都不能按讀者真正所需定向服務。

鑒于上述考慮,系統采用Web of Science等平臺自帶的個性化功能和論文標準導出格式,在完成查引工作的同時,租用云平臺來完成論文庫、報告庫的搭建。在作者下一次請求查引、更新論文時,在原有論文庫的基礎上,只需手動進入數據庫網站,將新發表需要補充的論文、引文,按規范格式下載并導入系統,同時完成查引服務和論文、報告庫的更新。

進入Web of Science等網站時,查新站可免費注冊若干公共的賬號密碼,在校園網內,檢索員仍登錄該賬戶使用其定制功能,可將每位作者不同檢索日期的論文保存在數據庫的云端,再次登錄時,隨時調用獲取標記結果,亦能在線增減、新建論文,引文也隨著數據庫定時更新,可任意下載。以SCIE為例,其個性化調用云端結果、論文及引文的標準輸出格式如圖2和圖3所示。

圖2 SCIE個性化定制調用云端歷史

圖3 SCIE論文和引文的標準輸出格式

檢索完成后,將論文集、查引報告集按作者信息布置在云平臺上,用戶在任何有網絡的地方都可以調用歷史論文和檢索報告,之后再決定是否進行新的查引申請。系統搭建使用阿里云負載均衡服務SLB、內容分發網絡CDN、云服務器ECS、對象存儲OSS、云數據庫RDS、云盾和云監控等[17],如圖4所示。ECS、SLB負責對外http服務,CDN承擔靜態請求,云數據庫RDS存儲作者、論文及引文信息,OSS存儲報告文件等數據,在云盾、云監控的安全防護之下,可自動防御異常網絡攻擊。對數據庫網站獲取到的論文和引文,經與SCIE、EI等不同數據庫、作者匹配分類,存放于論文庫中,當讀者、檢索員請求數據時,匹配其作者和數據庫信息,返回結果。對系統自動生成的查引報告也是相同方法處理。

圖4 云平臺建立作者論文、查引報告庫

3.3.3 基于片詞的模糊匹配算法自動去自引

傳統的查收查引過程中最費時費力的當屬去自引計算,需要一一比對每篇論文和施引文獻中的作者,部分文章的作者多達數十人。而Web of Science的分析工具,最大作者顯示數僅500條。施引文獻及其作者較多時,為達到精確去除自引的目的,只能靠肉眼逐個作者甄別,結果準確性很大程度上依賴于人工。

去自引的焦點問題還在于作者名在中英文表達方式上的差異。中文作者名的英文表述方式存在多種形式,如:張三,拼音表達可能存在ZhangSan、ZhangS、Sanzhang、San Zhang等,而字數在兩個以上的姓名的拼音表達可能性要增加更多。因為時間節點的不同,作者地址存在變動,同一作者名有可能存在多個單位的情況,同一單位也可能存在多個表達方式。只有將作者名和地址一同判斷,才有可能保證其結果的正確。

針對以上問題,平臺采用基于片詞的模糊匹配算法,將論文和引文標準文檔內的作者、地址字段分割對比,自動去除自引。

以模糊數學為基礎的模式識別方法稱為模糊模式識別。模糊理論最早是由美國自動控制學家拉特飛·扎特于1965年提出[18-19]。模糊模式識別主要包括三步[20]:提取特征,首先從識別對象中提取與識別有關的特征,并度量這些特征。設X1,X2,……,Xn分別為每個特征的度量值,于是每個識別對象X就對應一個向量(X1,X2,……,Xn);建立標準類型的隸屬函數,標準類型通常是論域U={(X1,X2,……,Xn)}的模糊集,Xi是識別對象的第i個特征;建立識別判決準則,確定某些歸屬原則,以判別識別對象屬于哪一個標準類型。

基于片詞的模糊匹配算法具體是將姓名和地址分別做片詞分割,然后計算各自與標準姓名和地址片詞之間的距離dn和da,通過加權求和每個片詞的距離得到匹配度mn和ma,分別和兩個閾值作比較,最終得出是否匹配成功的結論,以確定是否為自引。其中,是每個片詞的權值,權值大小的調整則取決于每個片詞在整個姓名或地址中的重要程度,具體如圖5所示。

圖5 基于片詞的模糊匹配算法自動去自引

以單篇文章引用數量較大(超過500條)為例,平臺自動上傳作者被收錄和引用的論文,輸入需要排除的第一作者英文姓名后開始解析。如圖6所示,基于片詞的模糊匹配解析實現了PDF文本的提取,分詞器將作者姓名、地址信息切分為英文語義的詞,存入索引。輸入篩選條件“Huang ZhaoHui”,對索引進行檢索,得到與該作者片詞相匹配的結果集。解析結果共包括3種:姓名相同,地址完全相同;姓名相同,地址部分相同;姓名相同,地址不同。該篇論文的第一作者單位并未變動過,所以只呈現姓名相同(地址完全相同)的自引解析結果。根據該結果,系統可統計該單獨作者的自引數,再經提取到的總引頻次數值減除后得到他引次數,即排除掉論文作者本身的引用——自引。

系統在識別自引和他引問題上,除作者姓名外,將作者地址變動也考慮進去,必要時可進行人工干預,核查疑似匹配結果,提高去除自引的準確率(99.99%)。作者和論文數量越多,該方法優勢越明顯,耗時(秒/分計)遠低于人工檢索方式(時計),且準確性能得到有效保證。

圖6 自引解析實例

4 “互聯網+查收查引服務”自動化平臺的優化策略

在互聯網+技術高速發展、區域查收查引服務體量增長迅速、科研需求繁復多樣的大背景下,“互聯網+查收查引服務”自動化平臺的開發勢在必行,經過業務實踐、讀者反饋、數據分析的反復論證、評估,基于以上平臺,制定了互聯網+環境下的優化服務策略,即構建平臺技術、平臺訪問、用戶、區域合作、資源等層面優化的有機整體(如圖7所示)。

圖7 互聯網+環境下的優化服務策略圖

由圖7可見,與以往系統相比,基于該平臺真正實現了查收查引服務優化的良性循環:①在平臺使用上,其可用性增強。PC和移動終端都能訪問,改變了只能在PC訪問的方式;無需注冊,只需手機、微信驗證登錄即可;平臺界面實時浮動語音、微場景、微視頻、客服機器人、人工客服等多種形式的使用指導,狀態更新又可自動跟蹤推送到讀者登錄使用的手機或微信,減少了檢索員重復解答、讀者多次咨詢的環節;②在技術實現上,關鍵環節的人工干預顯著減少,論文和報告可重復利用,不再受IP限制??稍诙虝r間內將海量電子論文的作者、地址字段同時進行配比自動去自引,結果準確,替代了大量繁復的手動計算,減輕了量大多變的業務壓力;租用云平臺建立了對應作者姓名、地址信息的論文、查引報告庫,讀者和工作人員均可隨時隨地調用歷史論文和報告,減少讀者反復提交、工作人員多次重復核實檢索論文的過程;在利用好歷史論文、報告的基礎上,如需增加新論文和引文,才涉及到人工從校園網進入數據庫檢索的部分,且平臺中的新文獻提交具有選項提示,避免出現讀者提供的論文清單常常與數據庫標準格式存在差異、需要手動糾正等問題;③在功能上,更加完善。平臺結合后臺數據的可視化分析工具,能緊密跟蹤科研和讀者動態,為制定真正契合用戶需要的服務優化策略提供量化依據;業務受理高峰期,系統實時顯示接待狀態,可自動為讀者推送分流建議,通過區域合作、資源共享等層面的優化減輕接待壓力。但仍存在一定的發展空間。讀者發表論文、引文等更新數據需要在完成查引檢索后,批量對應上傳至系統進行去自引分析,結果的準確性主要依賴于初始數據。原始數據的獲取主要有在線導出和讀者提供等形式,讀者提供需要數據庫標準導出格式的文件,這一工作目前在選項提示、使用指導、微傳播中推廣,推廣效果受到讀者認知能力的影響,格式如不準確仍需檢索員手動操作,但實際也已經減少了大部分歷史論文查詢的工作。

5 結語

“互聯網+查收查引服務”自動化平臺的構建與優化策略較為科學。高校圖書館可立足科技查新站,依托自動化平臺,提高服務質效,實現動態調整服務方案的科學化和智能化,并能兼顧地區科研創新聚力的發展需求。將來還可嘗試通過其獲得的數據建立模型,分別進行打分,再根據得分進行參考決策,實現服務方案的自我優化管理。

猜你喜歡
數據庫微信服務
服務在身邊 健康每一天
今日農業(2019年12期)2019-08-15 00:56:32
服務在身邊 健康每一天
今日農業(2019年10期)2019-01-04 04:28:15
服務在身邊 健康每一天
今日農業(2019年16期)2019-01-03 11:39:20
招行30年:從“滿意服務”到“感動服務”
商周刊(2017年9期)2017-08-22 02:57:56
微信
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
微信
主站蜘蛛池模板: 在线免费看片a| 精品人妻无码中字系列| 国产91色在线| 色综合中文| 欧美精品不卡| 亚洲日韩Av中文字幕无码 | 亚洲精品麻豆| 99热亚洲精品6码| 色综合激情网| 91小视频在线观看| 日本国产精品| 国产h视频在线观看视频| 国产一级一级毛片永久| 999国内精品久久免费视频| 婷婷午夜天| 四虎永久免费地址| 国产成人一级| 欧美97色| 欧美一区二区啪啪| 人妻丰满熟妇啪啪| 亚洲国产欧美自拍| 日韩人妻精品一区| 精品视频第一页| 亚洲精品在线影院| 久久a毛片| 亚洲六月丁香六月婷婷蜜芽| 亚洲综合片| 欧美高清三区| 国产精品亚洲а∨天堂免下载| 日韩福利在线观看| 欧美日本激情| 国产swag在线观看| 欧美成人h精品网站| 国产精品嫩草影院av| 亚瑟天堂久久一区二区影院| 无码视频国产精品一区二区| 欧美人与牲动交a欧美精品| 国产欧美高清| 成年人视频一区二区| 国产91丝袜在线播放动漫 | 日本不卡视频在线| 伊人天堂网| a国产精品| 在线观看精品国产入口| 国产日韩欧美中文| 狠狠v日韩v欧美v| 国产高清精品在线91| 国产一级毛片高清完整视频版| 亚洲国产精品日韩专区AV| 99久久国产综合精品女同| 久久人体视频| 久久婷婷五月综合97色| 久久国产免费观看| 2021国产精品自产拍在线| 丁香五月婷婷激情基地| 91视频99| 日韩精品毛片人妻AV不卡| 一区二区自拍| 国产女人18毛片水真多1| 亚洲精品无码AV电影在线播放| 亚洲人成网站在线播放2019| 中文字幕乱码中文乱码51精品| 亚洲国产中文综合专区在| 成年人福利视频| 亚洲第一视频网| 欧美中文字幕在线二区| 国产美女一级毛片| 日韩人妻无码制服丝袜视频| 真实国产精品vr专区| 国产美女无遮挡免费视频网站| 2020精品极品国产色在线观看 | 国产原创演绎剧情有字幕的| 广东一级毛片| 青青草国产免费国产| AV天堂资源福利在线观看| 久久免费视频播放| 中文字幕无码电影| 国产精品无码翘臀在线看纯欲| 婷婷色狠狠干| 久久久久无码精品| 亚洲午夜福利精品无码| 制服丝袜国产精品|