孫發 吳強



〔摘 要〕為提高圖書館論文查收業務的自動化服務水平,以SCI論文查收為例,提出對用戶查收委托和查收報告出具進行業務流程集成設計與自動化實現,通過ASP.NET編程技術和多種數據處理技術,開發具有多種用戶自助委托方式和查收報告自動出具功能的查收報告出具系統,最終實現了用戶查收委托的高效便捷和查收報告的即時自動出具。
〔關鍵詞〕論文查收;自動出具;SCI;系統設計
DOI:10.3969/j.issn.1008-0821.2016.04.019
〔中圖分類號〕G250.74 〔文獻標識碼〕A 〔文章編號〕1008-0821(2016)04-0105-05
〔Abstract〕To improve the level of automation for reference retrieve services,in the case of SCI reference retrieves,integrated design and process reengineering apply in reference retrieves of commission and report generation,and reference retrieve report generation system is developed by the ASP.NET programming and some data process technologies,which has functions with self service commission and automatic generation of reference retrieve report.The system finally realized reference retrieves commission in efficient ways,and reference retrieved report automatic generation in immediate.
〔Key words〕paper reference retrieve;automatic generation;SCI;system design
在職稱評定、獎項申報、成果鑒定和學位申請等活動中,相關人員所發表論文被SCI、EI等權威數據庫收錄情況,已成為一項重要的論文質量評價指標。論文查收報告出具工作一般由圖書館來承擔,已成為它的一項重要信息服務工作[1]。近年國內科研論文產出數量質量都有大的提升,查收業務量也隨之大增,以人工處理為主的傳統模式已無法保質保量地完成該項任務[2]。
目前,國內圖書館在查收報告出具自動化服務方面進行了大量研究實踐,出現了基于辦公軟件和文獻管理軟件的查收報告出具輔助系統和面向業務環節自動化實現的查收自動化出具系統[2-3],但在用戶查收委托效率、過程數據獲取的實時準確性和查收報告出具速度等方面存在不足[4-7],需要進一步加以解決。
對此,筆者以SCI論文查收為例,研究總結分析現有業務服務系統所存在的不足,提出將查收委托和查收報告出具實施業務流程集成設計及自動化實現的解決方案,通過ASP.NET編程技術和網頁分析、RSS、XML、API等數據處理技術,開發具有多種用戶自主查收委托方式、過程數據在線實時獲取和查收報告即時自動出具等功能的查收報告出具系統,最終實現查收委托高效便捷和查收報告即時自動出具。
1 現狀分析
當前查收業務處理流程如圖1所示,主要存在以下問題:
(1)查收委托單是通過用戶鍵盤輸入或數據的復制粘貼操作生成的,委托單生成方式效率低,而且容易發生委托數據漏填或錯填,其數據完整性和準確性難以保證;
(2)沒有考慮對用戶歷史委托數據的重用,對于已委托過的查收論文,用戶仍要重新提交[8];
(3)對待查論文進行數據庫檢索驗證過程中,仍需要對查收委托單中存在的錯誤或遺漏數據進行人工校正;
(4)在對待查論文完成數據庫檢索驗證后,仍需要對相關檢索輸出數據做進一步的數據整合和格式規范等人工操作,容易發生誤操作;
(5)少數查收報告出具系統實現了查收報告的數據在線實時獲取、數據自動整合和格式自動規范,但由于過程中間受“數據校正”操作影響,仍不能實現查收委托報告的即時自動出具。
2 系統設計
本系統設計目標是在確保查收報告數據準確和格式規范的前提下,實現用戶查收委托的高效便捷和查收報告的即時自動出具;其系統設計切入點是通過查收委托與查收報告出具模塊間的數據耦合,實現查收委托和查收報告出具的業務流程集成與自動化。
系統設計思路如如圖2所示。
系統主要設計要點:
2.1 建立以數據庫檢索輸出的查收委托方式取代手工模式下的查收委托方式 用戶通過系統構建的數據庫檢索平臺對委托論文進行檢索,對檢索結果進行二次選擇和委托提交,取代手工模式下的查收委托方式,由此確保用戶委托提交數據的完整性和準確性,同時避免了查收出具過程中“數據校正”操作所帶來的中斷影響。
2.2 建立多種用戶自助委托方式,實現用戶查收委托的高效與便捷 根據查收業務統計分析,系統提供“在線檢索”、“機構庫檢索”、“歷史委托單”和“歷史委托論文”等四種用戶自助委托方式。其中,“在線檢索”集成數據庫的在線檢索接口,確保用戶查收委托的論文查全率;“機構庫檢索”是根據查收業務服務對象以機構用戶為主的業務特點,在構建機構發表論文數據庫的基礎上,為機構用戶提供了一種高效的查收委托提交方式;“歷史委托單”和“歷史委托論文”則為用戶提供了對歷史委托數據的重用,支持用戶在歷史委托數據的基礎上,結合其他用戶自助委托方式,快速生成新的查收委托單。
2.3 實現查收委托到查收報告出具的數據集成和業務自動化 通過用戶自助委托方式生成的委托單數據直接來源于數據庫,能確保論文的數據完整和準確,利用網頁分析、RSS、XML和API等數據獲取與處理技術,對查收報告所需數據庫其他相關數據實現在線實時自動獲取,并通過軟件技術實現查收報告數據整合和格式規范的自動處理,最終實現查收報告自動即時出具與打印。
3 系統實現
系統實現主要將包括用戶端的用戶自助委托模塊和管理端的“檢索更新”與“出具打印”模塊;系統開發采用ASP.NET編程技術,并采用了RSS、網頁分析、Web Services、XML和API等數據處理技術。
3.1 數據庫表設計
數據庫主要由“委托提交”、“機構庫”和“委托單”等表組成。其中“委托提交”表用于存儲用戶自助委托的查收論文數據,為后續查收報告出具提供檢索數據源;“機構庫”表用于存儲本機構所發表的論文數據,為“機構庫檢索”提供檢索數據源;“委托單”表存儲了用戶提交的委托單數據,為用戶端“歷史委托單”和“歷史委托論文”等提交方式提供相關數據。
“委托提交”、“機構庫”表設計如表1所示,“委托單”表設計如表2所示。
3.2 用戶自助委托模塊
為了讓系統保存用戶查收委托提交數據,實現“歷史委托單”和“歷史委托論文”等用戶查收委托提交方式,需要對用戶進行注冊認證,以存儲用戶的個人基本信息、當前查收委托和歷史查收委托等數據。
用戶自助委托模塊主要包括“機構庫檢索”、“在線檢索”、“歷史委托論文”和“歷史委托單”等4種委托提交方式。
模塊業務處理流程如圖3所示。
3.2.1 機構庫檢索
機構庫存儲了以本機構為論文發表單位的論文,是機構用戶快速提交論文查收委托的主要方式,其委托提交效率高于“在線檢索”。
機構庫構建由“初始數據導入”和“后續數據新增”兩部分組成。以SCI論文查收為例,“初始數據導入”是通過Web of Science網站檢索輸出方式手動獲取,輸出字段包括標題、作者、WOS、DOI和ISSN等字段,通過基本的數據處理后導入到機構庫;“后續數據新增”是通過RSS訂閱獲取新增論文的URL,再通過網頁分析技術獲取標題、WOS、作者、DOI和ISSN等字段數據,以實現對新增論文的發現,并將其數據保存到機構庫。
“后續數據新增”關鍵實現代碼如下:
∥定制機構新增論文RSS訂閱地址
string strurlrssupdate=
″http:∥feed2js.org∥feed2js.php?src=http%3A%2F%2Frss.webofknowledge.com%2Frss%3Fe%3D0994f16f571ded63%26c%3D6cd90d20826401ca1d56ace491124097&chan=y&desc=1&utf=y″;
∥ /網頁分析
∥創建網頁請求
HttpWebRequest oWebRqst=(HttpWebRequest)WebRequest.Create(strurlrssupdate);
∥獲取服務器響應數據流
HttpWebResponse oWebRps=(HttpWebResponse)oWebRqst.GetResponse();
StreamReader oStreamRd=new StreamReader(oWebRps.GetResponseStream(),
Encoding.GetEncoding(″utf-8″));
∥讀取響應數據轉化成字符串;
String sRslt=oStreamRd.ReadToEnd();
∥通過對返回字符串的檢索(IndexOf)、替換(Replace)、分割(Split)等方法解析返回數據,獲取字段信息
“機構庫檢索”提供了標題、DOS、WOS和作者姓名等字段檢索,前3個字段檢索用于單篇論文的快速檢索匹配,檢索效率相對低;而作者姓名字段檢索能返回多條記錄,為了提高查全率,處理好姓名拼寫順序和縮寫問題時,系統先將姓與名作字符分離處理,再依次作二次查詢輸出。
3.2.2 在線檢索
以SCI論文查收為例,“在線檢索”提供了WOS、DOI、標題和作者等字段檢索,用戶選擇標題或作者字段檢索時,除了輸入標題或作者等字段內容外,還需要論文對應期刊ISSN和卷號數據,且每次檢索最多只能返回一條命中記錄,適用于外機構用戶初次查收委托提交。
實現“在線檢索”,首先需申請開通Web of Science API查詢服務權限,其開放對象限于已報備IP的服務器;然后根據Web of Science提供的XML接口規范文件,編寫具有Web of Science接口查詢功能的Web Services服務程序,為“在線檢索”和管理端“檢索更新”功能模塊提供Web Services查詢服務。
以WOS字段檢索為例,Web Services服務函數實現如下:
public XmlDocument wossearch(string wos)∥
{
xmlSCIDoc.Load(Server.MapPath(″XMLSCI.xml″));∥加載XML規范文檔
strAddElement(wos); ∥自定義方法,創建添加XML節點,生成XML查詢文檔
string strxml=xmlJCRDoc.InnerXml;
∥發送并接收Web of Science API查詢數據
Encoding encoding=Encoding.UTF8;
string strUrl=″https:∥ws.isiknowledge.com/cps/xrpc″;∥定義SCI API網址
byte[] data=encoding.GetBytes(strxml);∥生成請求數據
HttpWebRequest myRequest=(HttpWebRequest)WebRequest.Create(strUrl);∥定義請求對象
myRequest.Method =″POST″;
myRequest.ContentType=″text/xml;charset=utf-8″;
Stream newStream=myRequest.GetRequestStream();∥發送請求數據
newStream.Write(data,0,data.Length);
newStream.Close();
WebResponse response=myRequest.GetResponse();∥接受返回數據
Stream resStream=response.GetResponseStream();
System.Xml.XmlDocument doc=new System.Xml.XmlDocument();
doc.Load(resStream);∥轉化成xml數據
return doc;
}
3.2.3 歷史委托單與歷史委托論文提交
用戶登錄系統后,系統通過查詢委托單和提交委托等數據庫,將該用戶已提交的委托單、歷史委托單和歷史委托論文以列表形式進行顯示,當用戶點擊委托單列表下的委托單后,系統將自動查詢委托數據庫,并顯示該委托單包含的論文記錄。
委托單有“待審核”、“待繳費”和“已完成”3種處理狀態。其中,“待審核”委托單允許用戶對當前委托單進行論文的新增、刪除和委托單刪除等操作;“待繳費”和“已完成”委托單不允許用戶對委托單進行編輯操作,用戶只能根據系統顯示歷史委托論文記錄,進行委托論文的選擇與提交,并生成新的“待審核”委托單。
3.2.4 用戶自助委托方式的選擇
用戶應根據查收委托需求和用戶身份,選擇適合的用戶自助委托方式;用戶身份是指機構用戶或機構外用戶,根據用戶論文發表機構是否屬于本機構來劃分。
(1)對于機構外新用戶,選擇“在線檢索”方式;
(2)對于機構老用戶,可視情況先選擇“歷史委托單”或“歷史委托論文檢索”進行提交,新增委托論文則選擇“在線檢索”進行補充提交;
(3)對于機構新用戶,可先選擇“機構庫檢索”進行委托論文的檢索、選擇與提交,再通過“在線檢索”補充提交剩余委托論文;
(4)對于機構老用戶,可視情況先選擇“歷史委托單”和“歷史委托論文”進行提交,新增委托論文則通過“機構庫檢索”、“在線檢索”進行補充提交。
3.3 管理端模塊
管理端模塊業務處理流程如圖4所示。
3.3.1 查收委托單的列表分類顯示
工作人員認證登錄管理端平臺后,系統查詢“委托單”數據庫,將 “待審核”、“待繳費”和“已完成”3種處理狀態的查收委托單以列表形式分類顯示。當工作人員點擊“待審核”列表下的委托單,系統將顯示委托單對應的用戶信息和查收委托論文記錄。
3.3.2 “檢索更新”操作與實現
工作人員點擊“檢索更新”按鈕,對應“檢索更新”模塊功能將在線實時獲取查收報告所需的相關數據,并將數據保存到“委托提交”數據庫中。
以SCI論文查收為例,用戶提交到“委托提交”數據庫中的委托論文記錄只包含“標題”、“WOS”和“ISSN”等字段數據,通過“檢索更新”功能模塊以多線程在線實時獲取查收報告所需的SCI論文其他字段數據、期刊影響因子(當年和5年平均期刊影響因子)和中科院期刊分區信息等數據,并將其保存到“委托提交”數據庫中。
其中,SCI論文基本字段數據通過對論文“SCI URL”數據的網頁分析來獲??;期刊影響因子數據的獲取分兩步,首先利用Web of Science API查詢服務,以ISSN數據為查詢內容,獲取期刊在JCR數據庫中的URL,再通過網頁分析方法獲取當年和5年平均期刊影響因。上述涉及的網頁分析技術和API查詢服務實現方法見本文3.2節。中科院期刊分區信息則通過中科院在線分區平臺提供的API查詢服務獲取,API查詢服務權限通過數據商申請獲得。
其實現關鍵代碼如下:
∥以論文對應的期刊ISSN為查詢數據
string strurl=
@″http:∥www.fenqubiao.com/getjournal.ashx?Username=wzykdx&Password=wzykdxfqb&Year=″+zkyfqtime+″&HostIP=授權服務器IP&ISSN=″+dt1.Rows[j][″issn″].ToString()+″″;
∥讀取html網頁數據返回字符串,并根據html網頁特定的數據分隔格式,利用Replace、Split、Substring等字符串處理方法對字符串數據處理,提取期刊分區數據。
sRslt=GetHttpData(strurl);
經實例測試,“檢索更新”在數據獲取處理性能達到5秒/篇,滿足查收報告即時自動出具打印的性能要求。
3.3.3 “繳費”操作與實現
“檢索更新”完成后,工作人員點擊“繳費”功能按鈕,“繳費”功能模塊根據查收收費標準自動生成委托單繳費單,并以系統自動發送短信方式提醒用戶下載打印繳費單及繳費操作,同時系統將委托單的“待處理”狀態變更為“待繳費”狀態。
3.3.4 “出具打印”操作與實現
當用戶完成委托單繳費后,工作人員在“待繳費”列表下點擊該用戶委托單,并點擊“出具打印”功能按鈕。“出具打印”功能模塊根據用戶查收委托單查詢“委托提交”數據庫,并將返回的查收報告數據以查收報告格式規范的形式在線自動生成查收報告,并調用操作系統打印功能完成查收報告的打印。查收報告出具打印后,“代繳費”狀態變更為“已完成”狀態。
4 結 語
通過查收委托和查收出具的業務流程一體化設計,實現了用戶自助委托、查收數據自動更新和報告自動出具等功能的查收報告自動化出具平臺,在保證查收報告數據準確的前提下,完成了查收委托和查收出具的業務流程集成與自動化,最終達成了用戶查收委托的高效便捷和查收報告的即時自動出具。目前系統已在溫州醫科大學進行了試運行,取得了預期應用效果。
系統以SCI論文查收為例,給出了論文查收報告自動化出具系統的設計與實現方案,在下一步工作中,將系統查收論文數據庫范圍擴展到其他常用數據庫,并在系統并發處理性能、系統業務管理分析和系統易用性方面進行進一步的優化,以提高系統的應用效果。
參考文獻
[1]周美華.網絡環境下的查收查引服務調研[J].圖書館工作與研究,2011,190(12):106-109.
[2]李曉東,盧振波.論文查收查引工具軟件的設計與實現[J].大學圖書館學報,2005,23(1):49-50,62.
[3]樊亞芳,陳鍇.利用Excel和EndNote Web提高論文查收查引工作效率[J].圖書館雜志,2013,(1):32-34,60.
[4]孔云,資蕓,楊婷,等.論文收錄證明輔助系統的設計與應用[J].數字圖書館論壇,2013,(9):56-61.
[5]王學勤,郝丹,鄭菲,等.“查收查引報告自動生成系統”應用實踐研究[J].圖書情報工作,2014,58(16):131-137.
[6]梁紅妮,袁芳.查收查引服務的規范化與質量控制——基于網絡環境的調查與分析[J].新世紀圖書館,2015,(9):34-37.
[7]侯瑞芳,陳嘉勇,周婕.查收查引服務優化體系的構建與思考[J].圖書館建設,2015,(4):75-79.
[8]馬芳珍.查收查引系統需求分析和設計要點探討[J].大學圖書館學報,2015,(4):80-84,121.
(本文責任編輯:郭沫含)