于俊麗
摘 要: 對(duì)云計(jì)算網(wǎng)絡(luò)圖書(shū)館的信息進(jìn)行快速定位,在提高其訂閱量、縮短訂閱時(shí)間方面具有重要意義。傳統(tǒng)定位方法主要通過(guò)對(duì)云計(jì)算網(wǎng)路圖書(shū)館的信息進(jìn)行預(yù)先采集,存儲(chǔ)為一個(gè)圖書(shū)信息庫(kù),再對(duì)其中信息進(jìn)行定位,信息庫(kù)更新不及時(shí)存在信息定位誤差大、耗時(shí)長(zhǎng)的問(wèn)題,提出基于ZigBee技術(shù)與SVM分類結(jié)合的圖書(shū)館信息快速定位方法。通過(guò)閱讀用戶信息對(duì)圖書(shū)館信息進(jìn)行協(xié)同過(guò)濾處理,采用SVM分類器對(duì)濾波后的信息進(jìn)行分析,為圖書(shū)館海量信息定位提供基礎(chǔ)依據(jù),采用ZigBee技術(shù)實(shí)現(xiàn)對(duì)圖書(shū)館信息的快讀定位。實(shí)驗(yàn)結(jié)果表明,采用改進(jìn)定位方法其定位準(zhǔn)確率及平均定位準(zhǔn)確率均要優(yōu)于傳統(tǒng)定位方法,具有一定的優(yōu)勢(shì)。
關(guān)鍵詞: 云計(jì)算網(wǎng)絡(luò)圖書(shū)館; 海量信息; 信息定位; ZigBee; SVM; 協(xié)同過(guò)濾
中圖分類號(hào): TN711?34; G250.73 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)12?0099?03
Abstract: The rapid positioning of the information of the cloud computing network library is of great significance in improving subscription quantities and shortening the subscription time. In the traditional positioning method, the information of the cloud computing network library is collected in advance and stored as a book information database for information positioning, and the information database is not updated in time, resulting in big information positioning errors and long time?consumption. Therefore, a library information rapid positioning method is proposed based on the combination of ZigBee technology and SVM classification. The collaborative filtering of library information is performed by reading user information. The SVM classifier is used to analyze the filtered information, so as to provide the basic basis for the positioning of massive library information. ZigBee technology is adopted to achieve fast reading and positioning of library information. The experimental results show that the improved positioning method has superior positioning accuracy rate and average positioning accuracy rate than the traditional positioning method, and has certain advantages.
Keywords: cloud computing network library; massive information; information positioning; ZigBee; SVM; collaborative filtering
云計(jì)算作為一種網(wǎng)絡(luò)應(yīng)用模式可提供從基礎(chǔ)資源、軟件平臺(tái)到系統(tǒng)管理的全方位解決方案。將云計(jì)算網(wǎng)絡(luò)使用在圖書(shū)館中,使用戶、圖書(shū)館、家庭、端到端安全性和移動(dòng)寬帶等能在同一環(huán)境、不同地點(diǎn)實(shí)現(xiàn)圖書(shū)信息的共享[1]。圖書(shū)用戶的增加,圖書(shū)館需要引進(jìn)更先進(jìn)的技術(shù),提升讀著的借閱效率及圖書(shū)管理人員工作效率。但現(xiàn)常用的圖書(shū)館條形碼及磁條會(huì)讓圖書(shū)館信息受到限制,無(wú)法直接從網(wǎng)上查詢或者查閱圖書(shū)館信息及現(xiàn)有圖書(shū)狀態(tài)。對(duì)此圖書(shū)館中各書(shū)庫(kù)如何分布和書(shū)庫(kù)中書(shū)架的分區(qū)情況,構(gòu)建直觀向?qū)D,系統(tǒng)的查詢圖書(shū)館信息[2],并把結(jié)果經(jīng)過(guò)此導(dǎo)向圖展示給讀者,讀者還可根據(jù)此向?qū)D與自己在圖書(shū)館中的位置進(jìn)行對(duì)比,迅速地找到想要的圖書(shū)館信息。雖然有工作人員對(duì)圖書(shū)進(jìn)行及時(shí)整理,但也會(huì)出現(xiàn)圖書(shū)錯(cuò)架、亂架問(wèn)題[3]。因此,需要對(duì)圖書(shū)館的信息進(jìn)行快速定位,及時(shí)進(jìn)行處理。
1 圖書(shū)館海量信息協(xié)同過(guò)濾分析
圖書(shū)館信息主要包括用戶信息、圖書(shū)信息、管理員信息等,信息量很大,就需要對(duì)圖書(shū)館信息進(jìn)行協(xié)同濾波處理[4]。基于用戶的協(xié)同過(guò)濾是目前被廣泛使用的個(gè)性化處理技術(shù),其根本思路是依據(jù)用戶對(duì)圖書(shū)管理信息的偏好搜尋鄰居用戶,把鄰居用戶的偏好圖書(shū)信息,以至今未查詢的圖書(shū)館信息的形式傳輸給當(dāng)前用戶[5]。其最基礎(chǔ)原理為,當(dāng)用戶[u1]偏好為[item1],而用戶[u2]還沒(méi)有查詢到此圖書(shū)館信息[item1],用戶[u2]和用戶[u1]是相似類型的用戶,那么用戶[u2]對(duì)圖書(shū)館信息[item1]也存在一定喜歡的概率,從而把圖書(shū)館信息[item1]傳輸給用戶[u2]。以用戶對(duì)圖書(shū)館信息的獲取為例,示意圖如圖1所示。
由圖1可知,假設(shè)查詢圖書(shū)館信息的用戶為[u1],用戶[u1]所需的圖書(shū)館信息為[b1],[b3],[b4],用戶[u2]所需的圖書(shū)館信息為[b2],[b5],用戶[u3]所需的圖書(shū)館信息為[b1],[b3],[b4],[b5]。根據(jù)用戶相似度計(jì)算,可得到用戶[u1]的最近鄰用戶是[u3]。由于基于用戶的協(xié)同過(guò)濾分析是采用用戶與其最近鄰的用戶所具備的圖書(shū)館信息[6],把用戶[u3]所需的圖書(shū)館信息輸送到還未曾使用的圖書(shū)館信息[b5]的用戶[u1],認(rèn)為用戶[u1]也會(huì)需要圖書(shū)館信息[b5]。基于用戶的協(xié)同過(guò)濾分析很好地使用了集體分析的思想,經(jīng)過(guò)采用用戶集體的力量,獲取不同用戶之間的相似度,使得同一個(gè)群體里的用戶具備一樣的圖書(shū)館信息[7]。基于用戶的協(xié)同濾波無(wú)需考慮圖書(shū)館信息的詳細(xì)內(nèi)容表示的意思,會(huì)加大那些很難理解或者表示的圖書(shū)館信息濾波效果。
2 圖書(shū)館海量信息分類處理
在對(duì)圖書(shū)館海量信息進(jìn)行濾波處理的基礎(chǔ)上,采用SVM對(duì)其進(jìn)行分類處理。SVM是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)法,是檢測(cè)、識(shí)別、定位分析過(guò)程中總用的非線性分類器[8],其結(jié)構(gòu)如圖2所示。圖2中兩類訓(xùn)練樣本分別用圓圈及方塊表示,H是將兩類點(diǎn)集準(zhǔn)確分開(kāi)的分類線,[H1],[H2]分別是各類樣本里間隔分類線最近的點(diǎn)且平行于分類線,[H1],[H2]間的間隔叫作分類空隙、分類間隔(Margin)。最優(yōu)分類線可增加分類空隙,實(shí)際上就是讓推廣性界中的置信范圍最小化,降低真實(shí)風(fēng)險(xiǎn)[9]。
對(duì)于圖書(shū)館信息線性可分問(wèn)題,首先設(shè)定樣本集是[xi,yi,i=1,2,…,n,x∈Rd,y∈1,-1]為類別標(biāo)號(hào),則圖書(shū)館海量信息分類中最優(yōu)超平面方程表達(dá)式為:
3 圖書(shū)館信息定位方法整體設(shè)計(jì)
云計(jì)算網(wǎng)絡(luò)圖書(shū)館信息快速定位是將云計(jì)算網(wǎng)絡(luò)與ZigBee技術(shù)融合在圖書(shū)館內(nèi)部,實(shí)現(xiàn)對(duì)圖書(shū)館信息快速定位。此定位方法是一對(duì)多的定位系統(tǒng),各閱讀器以矩陣的形式排列在書(shū)架上[11],當(dāng)一個(gè)閱讀器同時(shí)獲取多個(gè)目標(biāo)標(biāo)簽信息時(shí),產(chǎn)生圖書(shū)館信息向量,然后把信息傳輸給閱讀器內(nèi)部的無(wú)線通信模塊,經(jīng)過(guò)ZigBee技術(shù)把圖書(shū)館信息傳輸?shù)奖O(jiān)控中心,實(shí)現(xiàn)圖書(shū)館信息的快速定位,具體步驟如下:
1) 信息采集是快速定位方法最基本的功能,通過(guò)閱讀器讀取圖書(shū)標(biāo)簽信息,產(chǎn)生圖書(shū)信息向量,并對(duì)圖書(shū)信息進(jìn)行采集,將其傳輸?shù)娇刂浦行摹?/p>
2) 控制中心將接收的圖書(shū)信息通過(guò)協(xié)同過(guò)濾,采用SVM分類器分類后,傳輸?shù)较鄳?yīng)數(shù)據(jù)存儲(chǔ)模塊。
3) 當(dāng)進(jìn)行信息定位時(shí),控制模塊在接收到通信模塊發(fā)布的定位信息后,通過(guò)云計(jì)算網(wǎng)絡(luò)迅速控制圖書(shū)館信息,第一時(shí)間采用ZigBee技術(shù),對(duì)圖書(shū)館信息進(jìn)行定位。
4) 云計(jì)算網(wǎng)絡(luò)作為主要的傳遞介質(zhì),需要第一時(shí)間接收到控制中心發(fā)出的定位信息,當(dāng)緩存圖書(shū)館信息內(nèi)存已滿時(shí),過(guò)剩的信息就會(huì)被丟棄,引發(fā)緩沖區(qū)溢出,造成網(wǎng)絡(luò)擁塞,需要對(duì)圖書(shū)館信息進(jìn)行壓縮,降低出現(xiàn)緩沖區(qū)溢出的問(wèn)題。云計(jì)算網(wǎng)絡(luò)圖書(shū)館海量信息快速定位流程圖如圖3所示。
4 實(shí)驗(yàn)結(jié)果分析
4.1 評(píng)價(jià)指標(biāo)
在對(duì)有效性進(jìn)行評(píng)估時(shí),采用對(duì)評(píng)估結(jié)果有影響的評(píng)價(jià)指標(biāo),可很大程度上增加定位方法的有效性評(píng)估準(zhǔn)確度。目前常用的評(píng)價(jià)指標(biāo)不能完全對(duì)圖書(shū)館信息定位結(jié)果準(zhǔn)確度進(jìn)行反應(yīng),因此采用準(zhǔn)確度(Precision)及平均定位準(zhǔn)確度(Average Sorting Precision,ASP)來(lái)描述該定位方法的有效性,如下:
4.2 實(shí)驗(yàn)結(jié)果分析
為了驗(yàn)證改進(jìn)定位方法在海量圖書(shū)館信息定位方面的有效性、可行性,以某校圖書(shū)館信息庫(kù)為例,進(jìn)行實(shí)驗(yàn)對(duì)比分析。準(zhǔn)確度及平均定位準(zhǔn)確度分析結(jié)果如圖4和圖5所示。由圖4可知,采用傳統(tǒng)定位方法時(shí),隨著圖書(shū)館信息量的增加,其定位信息量也逐漸增加,在信息量過(guò)大時(shí),提高定位準(zhǔn)確率的同時(shí)出現(xiàn)傳輸擁塞問(wèn)題,導(dǎo)致定位時(shí)長(zhǎng)增加,準(zhǔn)確率約為42.5%;采用改進(jìn)定位方法時(shí),隨著圖書(shū)館信息量的增加,定位準(zhǔn)確率逐漸增加,同時(shí)定位信息量未出現(xiàn)過(guò)多的傳輸擁塞問(wèn)題,定位準(zhǔn)確率約為83.3%,相比傳統(tǒng)定位方法提高了約為40.8%,具有一定的使用優(yōu)勢(shì)。由圖5可知,采用傳統(tǒng)定位方法時(shí),其定位的平均準(zhǔn)確率雖有提高的現(xiàn)象,但最終出現(xiàn)了定位信息傳輸擁塞問(wèn)題,準(zhǔn)確率約為31.8%;采用改進(jìn)定位方法時(shí),隨著圖書(shū)信息量的增加,其需要定位的量增加,在傳輸過(guò)程中,出現(xiàn)擁塞現(xiàn)在的概率較低,平均準(zhǔn)確率約為71.8%,相比傳統(tǒng)方法,其平均準(zhǔn)確率約為40%,且隨著圖書(shū)館信息量的增加而逐漸增加,具有一定的優(yōu)勢(shì)。
5 結(jié) 論
針對(duì)傳統(tǒng)定位方法一直存在定位耗時(shí)長(zhǎng),且易出現(xiàn)定位信息傳輸擁塞的問(wèn)題,提出基于ZigBee技術(shù)與SVM分類結(jié)合的云計(jì)算網(wǎng)絡(luò)圖書(shū)館海量信息定位方法。實(shí)驗(yàn)結(jié)果表明,采用改進(jìn)定位方法,其定位準(zhǔn)確率及平均定位準(zhǔn)確率,相比傳統(tǒng)定位方法,分別提高了40.8%,40%,具有一定的優(yōu)勢(shì)。
參考文獻(xiàn)
[1] 杜海寧.基于云計(jì)算的圖書(shū)館海量數(shù)據(jù)存儲(chǔ)研究[J].圖書(shū)與情報(bào),2010(3):99?101.
DU Haining. Research on the library mass data storage based on cloud computing [J]. Library & information, 2010(3): 99?101.
[2] 王志強(qiáng).基于云計(jì)算的數(shù)字圖書(shū)館核心數(shù)據(jù)管理與保護(hù)研究[J].現(xiàn)代情報(bào),2014,34(5):88?90.
WANG Zhiqiang. Study of core data management and protection strategy for digital library based on cloud computing [J]. Modern information, 2014, 34(5): 88?90.
[3] 王平.云計(jì)算關(guān)鍵技術(shù)在數(shù)字圖書(shū)館中的應(yīng)用研究[J].情報(bào)資料工作,2010,31(5):52?56.
WANG Ping. On the application of key technology of cloud computing to digital libraries [J]. Information and documentation services, 2010, 31(5): 52?56.
[4] 陳臣,高軍.云計(jì)算環(huán)境下面向用戶體驗(yàn)的數(shù)字圖書(shū)館數(shù)據(jù)管理策略研究[J].圖書(shū)館理論與實(shí)踐,2014(5):79?81.
CHEN Chen, GAO Jun. Research on the data management strategy of digital library to user experience under the cloud computing environment [J]. Library theory and practice, 2014(5): 79?81.
[5] 陳臣.基于云計(jì)算的圖書(shū)館大數(shù)據(jù)分析和決策支持平臺(tái)構(gòu)建[J].圖書(shū)館理論與實(shí)踐,2016(5):101?104.
CHEN Chen. Construction of big data analysis and decision support platform for library based on cloud computing [J]. Library theory and practice, 2016(5): 101?104.
[6] 王彥明,薛云,饒洪,等.圖書(shū)館云計(jì)算可行性研究[J].現(xiàn)代情報(bào),2014,34(7):3?9.
WANG Yanming, X?E Yun, RAO Hong, et al. Feasibility study of cloud computing in library [J]. Journal of modern information, 2014, 34(7): 3?9.
[7] 陳晨.基于云計(jì)算的圖書(shū)館信息資源共享系統(tǒng)研究[J].現(xiàn)代情報(bào),2011,31(10):169?172.
CHEN Chen. Library information resource sharing system based on cloud computing [J]. Journal of modern information, 2011, 31(10): 169?172.
[8] 王倩.云計(jì)算環(huán)境下海量音樂(lè)資源的高精度定位挖掘方法研究[J].現(xiàn)代電子技術(shù),2017,40(12):19?21.
WANG Qian. Research on high?precision location mining method of massive music resources in cloud computing environment [J]. Modern electronics technique, 2017, 40(12): 19?21.
[9] 陳牮華.基于云計(jì)算的網(wǎng)絡(luò)安全數(shù)據(jù)傳遞方法研究[J].計(jì)算機(jī)仿真,2012,29(8):139?141.
CHEN Jianhua. Network security data transfer method research based on cloud computing [J]. Computer simulation, 2012, 29(8): 139?141.
[10] 吉宇寬.云計(jì)算環(huán)境中信息交易對(duì)圖書(shū)館的影響及對(duì)策研究[J].圖書(shū)館建設(shè),2015(11):72?76.
JI Yukuan. Research on the effects of information trading on library and corresponding countermeasures under the cloud computing environment [J]. Library development, 2015(11): 72?76.