999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據與圖書館信息服務新構想

2015-02-13 07:41:17吳敏慧廣東省立中山圖書館廣州510110
圖書館理論與實踐 2015年2期
關鍵詞:大數據圖書館

●吳敏慧(廣東省立中山圖書館,廣州 510110)

大數據與圖書館信息服務新構想

●吳敏慧(廣東省立中山圖書館,廣州510110)

[關鍵詞]大數據;信息服務;信息產品;圖書館

[摘要]運用大數據的相關關系和核心價值提出圖書館信息服務新構想,針對大數據的特征提出應將大數據變小,及對大數據進行價值提煉,并闡述了圖書館信息服務的新機遇。

1 大數據核心價值及其應用

(1)大數據的核心價值。舍恩伯格認為,大數據的核心價值是預測,大數據不是要教會機器像人一樣思考,而是把數學算法運用到海量的數據上來預期事情發生的可能性。[1]大數據時代是人工智能、機器學習和數據挖掘等技術迅速發展所驅動的一個歷史進程,這個進程要求我們將信號轉化為數據,將數據分析為信息,將信息提煉為知識,以知識促成決策和行動。正是基于大數據的核心價值,2013年3月22日,奧巴馬政府宣布投資2億美元拉動大數據相關產業發展,將大數據戰略上升為國家意志,奧巴馬政府將數據定義為“未來的新石油”,積極發展起如蘋果、谷歌、亞馬遜等一批世界級互聯網企業。2013年9月底,百度公司董事長李彥宏在中關村為習近平總書記、李克強總理等中共中央政治局常委講解大數據,李彥宏認為大數據有兩個重要價值,一是促進信息消費,加快經濟轉型升級;二是關注社會民生,帶動社會管理創新。

(2)大數據的應用案例。案例一,2012年11月的美國總統大選,眾多政治分析師和專家直到11月6日選舉日仍認為今年美國總統選舉難分勝負,稱民主黨候選人貝拉克·奧巴馬和共和黨候選人米特·羅姆尼旗鼓相當。美國天才統計學家納特·西爾弗(Nate Silver)則在當天稱,奧巴馬將贏得大多數人的選舉票,可能性90.9%。結果證明西爾弗的英明,奧巴馬所獲選舉人票數遠超羅姆尼。這次預測中,西爾弗根據多個數據點和大量的計算機建模,對每次民意調查及美國各大電視網給出的選舉預測結果等進行深度統計分析,非常準確地預測了美國50個州的投票勝負,2008年他也猜中了50個州中的49個。他稱,現在有那么多的民意調查數據,我就是從這堆大數據當中挖出自己所要的東西的。[2]

案例二,熱播美劇《紙牌屋》的高收視率,緣于制作方Netflix(北美最大的付費訂閱視頻網站)通過其網站上的用戶每天超過3000萬條的播放記錄,包括用戶在何時、何地、何種設備上觀看什么內容,用戶給節目添加的恐怖、必看等個性標簽,并在記錄暫停、倒退、快進、評分、搜索的同時,進行大量截圖,分析用戶在音量、畫面色彩甚至場景選取上的喜好等,然后進行精準運算,預測出美國演員凱文·史派西、美國導演大衛·芬奇和BBC出品(英國廣播公司拍攝的電視劇或戲劇)三種元素結合在一起的電視劇產品將會大火特火,由此大獲成功。開創了大數據影響電視劇制作的先河,也將大數據的概念從技術層面下沉到生活層面。[3]

2 圖書館信息服務新構想

利用大數據的相關關系,能進一步提高受眾信息反饋的價值,拓展圖書館對受眾分析的廣度和深度,推動圖書館信息服務出現一些方向性調整,如從單向性的專題報告或輿情監測向趨勢性預測報告和數據驅動型信息專題轉變,規劃“內容+關系”的圖書館信息服務新構想。

2.1運用大數據的相關關系

隨著科技的迅猛發展,人們在數據搜集、數據傳輸、數據存儲及數據處理能力等方面都取得了極大的進步,使人們除了可以通過因果關系的方式來認識世界外,還可以根據海量的數據依靠相關性理論來進一步認識世界。所謂“相關性”是指兩個或者兩個以上變量的取值之間存在某種規律性。例如,如果A和B

經常一起發生,我們只需要注意到如果B發生了,就可以預測A也發生了。這樣即使我們不能直接測量或觀察A,也有助于預測A可能會發生什么。例如,經濟學家巴曙松就曾提出用“榨菜指數”觀察農民工回流和中國城鎮化發展的觀點,即從關注榨菜銷量(B)的變化來觀察農民工(A)的流向變化。這就是說,如果找到某個現象的良好關聯物,相關關系就可以幫助我們捕捉現在和預測未來。這種通過洞察細微數據之間相關性的分析方法,為我們認知世界打開了一扇新的窗戶。按照這樣的思路,未來圖書館信息服務可以在利用常規數據之外,再結合大數據之間的相關關系,從原有的靜態收集數據向動態跟蹤數據拓展,提供更加精準的信息服務。大數據中的相關關系可成為今后圖書館信息服務新思維、新領域及重點關注的方向,幫助我們走出對直覺、經驗、常規邏輯推斷、因果關系分析等傳統的路徑依賴,拓寬思路飛躍到由大量的、非傳統的數據匯集而成的海量數據之中,不斷發現新的關聯模式。

2.2關注大數據的核心價值

全球大數據權威專家、美國物理學會院士艾伯特—拉斯洛·巴拉巴西認為,建立在相關關系分析法基礎上的預測是大數據的核心,有充分的證據證明,人類行為的93%是可以預測的,人類大部分行為都受制于規律、模型以及原理法則。他認為,通過找出一個關聯物并監控它,就能預測未來,進而尋找到通往未來的鑰匙。[4]現時網絡的普及和網上強大的功能搜索,造成了人們有問題的第一個想法就是“自己上網查一查”,而不是馬上采取實質性的行動,所以,網上的搜索記錄完全可以成為預測某些事件發生的有力憑證。

2014年4月24日第四屆技術開放日上,百度公司正式宣布推出“大數據引擎”(該引擎包括開放云、數據工廠、百度大腦),將打造一個開放平臺,采取邀請制和免費模式,吸引通信、金融、物流、制造、農業等行業擁有海量數據卻不知如何處理的傳統企業進駐,為這些公司提供存儲、關聯、分析大數據的能力。據悉,百度“大數據引擎”的開放是漸進式的,目前主要與政府、非政府組織、制造、醫療、金融、零售和教育等傳統領域率先展開合作。百度公司董事長李彥宏表示,未來會有更多行業被卷入,而且被卷入的速度越來越快,是一個加速發展的過程,將產生一場新的工業革命。

未來的圖書館信息服務應順應大數據的發展潮流,著重于關注大數據的核心價值,從目前描述事件過去狀態的信息產品、專題報告和輿情研究,向能預測事件未來發展方向的信息產品延伸轉變。例如,利用大數據對疾病爆發、失業率、社會情緒、智能交通等進行預測,幫助政府部門提高應急處理能力和安全防范能力。[5]

3 大數據帶來的問題思考

3.1大數據的收集和價值提煉

大數據具有體量大、模式多、速度快、價值總量高但價值密度低的特征,使得傳統的數據分析、數據挖掘、數據處理方式都不再適用。大數據從各種源頭通過不同渠道產生,常包含圖像、視頻、音頻、數據流、文本、網頁等不同的數據格式,因此其模態是多種多樣的。面對如此龐雜的數據,圖書館大數據采集必須解決三個問題,一是如何收集大數據,二是如何將大數據變小,三是如何對大數據進行價值提煉。

(1)大數據的收集。圖書館大數據的數據源很廣泛,主要有:圖書館現有內部網各應用系統產生的數據(如圖書期刊外借數據、數據庫檢索動態數據、網站瀏覽量、網頁點擊率、人均瀏覽量、平均訪問時長、受訪域名和頁面、訪客屬性等),也有來自圖書館外互聯網的數據(如社交網絡數據及互聯網上資料)和物聯網等。但在數據源廣泛、數據量巨大的背景下,大數據決策者必須清楚地確定數據采集原則,即能夠采集到的數據,并不意味著值得或需要去采集它,需要采集的數據和能夠采集到的數據的“交集”,才是我們確定要去采集的數據。

(2)將大數據變小是在不改變數據基本屬性的前提下對數據進行清洗,在盡量不損失價值的條件下減小數據規模。為此,需要研究大數據的抽樣、去重、過濾、篩選、壓縮、索引、提取元數據等數據變換方法,直接將大數據變小,這可看作是大數據的物理變化。這時,數據分析及信息檢索策略顯得尤為重要。可采用分析主題、找出核心概念、選取規范化詞組、批量刪除重復無用數據、先選用上位詞普選再用下位詞來縮小數據范圍的方法。

(3)對大數據進行價值提煉可看作是大數據的化學反應,由于大數據中包含大量的非結構化數據,需要進行結構化的解讀和梳理,這時人機的交互分析中人的智慧顯得尤為重要,必須通過群體智慧對數據的價值進行發酵和提煉。信息人員首先要評價數據的質量與意義,需要認真考察諸如數據來源是否可靠,時效性如何,包含了怎樣的主題,應選擇哪些相關數據,出于何種目的、采用什么方法收集而來等一系列

思考與選擇。其次再對數據進行處理,去除不必要干擾性的數據,清理其中的各種誤差,并將來源紛雜、格式各異的數據轉換為統一格式,最終確定需要呈現的數據信息。[6]

3.2大數據的安全和隱私問題

現實中,大數據已經在我們的身邊。當你在互聯網上檢索閱讀時,搜索引擎公司會記錄你的閱讀檢索習慣,并根據這些信息自動向你推薦相關廣告;當你在社交網絡上進行言論交流時,這些網站會記錄你的言論;當你駕車上路時,電子導航系統會自動定位并記錄你所到位置的所有數據。這些信息安全和隱私問題在大數據時代已經防不勝防。所以圖書館需要設立一個隱私保護模式,如區分數據用途、規范數據使用者、如何評估潛在風險、如何規避或減輕潛在的傷害等。因而,圖書館要在充分評估大數據風險的基礎上,認真研究從數據生成、數據收集到數據分析應用的數據保密問題,確保信息安全。特別是圖書館信息開發針對的高端讀者群,更要把保護高端讀者隱私問題放在首要位置。

同時,對已開發的信息產品,圖書館要建立良好的信息產品保密管理制度,如設置專人專職處理信息和文獻傳遞工作、文檔加密、身份驗證等,以防范無關人員對電子文件非法訪問和隨意改動。對大數據的開發,圖書館則應通過制定相關法律法規來規范大數據開發利用行為,建立大數據使用規范和安全標準,促使數據使用者以負責任的態度使用數據,履行保護用戶隱私的責任,加大對信息竊取及篡改的懲罰力度,優化大數據發展環境,以確保數據在內部流轉、系統流轉乃至外部流轉的過程中是安全可控的。

4 大數據時代圖書館信息服務新機遇

4.1大數據催生圖書館新職業

由于大數據的典型特征,圖書館學界在大數據時代將催生一批新的專業技術崗位,如信息數據分析師、圖書數據分析師等。正如復旦大學計算機研究所所長施伯樂所說,無論是個人、企業還是國家,誰能更好地抓住數據、理解數據、分析數據,誰就能在下一波的社會競爭中脫穎而出,數據的知識將成為個人知識結構中的必備要素和基礎。圖書館信息數據分析師的數據分析能力也必須要從基礎性分析、推測性分析提高到更加成熟的預測性分析上。推測性分析是根據數據的連貫性、概率性、相關類推原則等對事物發展進行定性推測,目前圖書館大多采用這種定性推測,也就是以信息人員的經驗為主觀判斷,對事物的未來發展作出描述性推測;預測性分析則要善于分析大型的數據集以識別其趨勢,并通過建立模型進行預測,發現數據與事物之間的相關關系,從而準確預測事物發展方向,及時提供解決方案。

4.2未來信息服務的對策

未來信息服務的對策,一是加強用戶研究與交互數據的利用,對用戶數據進行深度分析并建立用戶模型,開展精準服務、知識關聯服務,提供預測性信息服務產品;二是通過數據了解現有的知識服務過程發生了什么、用戶需要什么服務,利用數據對圖書館與用戶的交互關系進行數據挖掘、分析和預測可能發生的信息行為;三是加強數字資源的整合、分析和挖掘,識別定位高質量信息,為客戶提供解決問題的信息服務;四是將現有成熟的信息采集工作模式與先進的數學模型結合,實現工作效率的提升;五是關注和融入社交網站,擴大圖書館的受眾面,實時了解讀者的需求,提升圖書館在讀者個人文化生活中的作用和影響。

總而言之,大數據應用技術將是未來圖書館服務創新的重要領域,圖書館界應關注和研究與之相關的技術應用和發展,建立和完善新型的知識服務模式,提高圖書館在日新月異的科學技術和社會環境下的競爭力。

[參考文獻]

[1](英)維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數據時代[M].盛楊燕,周濤譯.杭州:浙江人民出版社,2013.

[2]王鵬.大數據成功預測美國大選[EB/OL].[2012-11-07].http://www.csdn.net/article.

[3]成雅.大數據如何捧紅《紙牌屋》[N].南京日報,2013-09-09(A091).

[4](美)艾伯特—拉斯洛·巴拉巴西.爆發:大數據時代預見未來的新思維[M].馬慧譯.北京:中國人民大學出版社,2012:8.

[5]陳超.圖書館如何迎接大數據時代?[J].圖書館雜志,2014(1):4-7.

[6]吳敏慧.圖書館政府決策信息采集分析[J].大學圖書情報學刊,2013(3):31-34.

[收稿日期]2014-04-21 [責任編輯]菊秋芳

[作者簡介]吳敏慧(1969-),女,館員,廣東省立中山圖書館信息部《文化內參》責任編輯,研究方向:文獻信息開發。

[文章編號]1005-8214(2015)02-0014-03

[文獻標志碼]A

[中圖分類號]G252;G250.73

猜你喜歡
大數據圖書館
圖書館
文苑(2019年20期)2019-11-16 08:52:12
時間重疊的圖書館
文苑(2018年17期)2018-11-09 01:29:40
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
飛躍圖書館
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
圖書館里的是是非非
去圖書館
主站蜘蛛池模板: 91在线精品麻豆欧美在线| 久久成人国产精品免费软件| 久久综合九色综合97婷婷| 亚洲国产日韩欧美在线| 亚洲欧美h| 久久久久国产一区二区| 国产无码精品在线| 精品一区二区无码av| 国产在线91在线电影| 99在线观看视频免费| 在线观看无码a∨| 国产亚洲欧美在线专区| 久久这里只有精品8| 日韩精品无码免费专网站| 综合色在线| 国产视频只有无码精品| 国产欧美在线观看一区 | 天天综合色网| 99久久无色码中文字幕| 九色综合伊人久久富二代| 97精品久久久大香线焦| 国产视频一区二区在线观看| 久久黄色小视频| 色婷婷综合激情视频免费看| 91无码人妻精品一区二区蜜桃| 91破解版在线亚洲| 无码丝袜人妻| 一级高清毛片免费a级高清毛片| 91精品专区| a级毛片毛片免费观看久潮| 在线精品自拍| 麻豆AV网站免费进入| 成人福利一区二区视频在线| 亚洲精品无码抽插日韩| 中文字幕丝袜一区二区| 亚洲天堂日韩av电影| 日本爱爱精品一区二区| 自慰网址在线观看| 日韩精品成人网页视频在线| 一级毛片免费不卡在线| 久久精品女人天堂aaa| 国产激情在线视频| 亚洲v日韩v欧美在线观看| 亚洲性色永久网址| 国产内射一区亚洲| 久爱午夜精品免费视频| 欧美日韩国产在线观看一区二区三区 | 免费无码AV片在线观看中文| 精品第一国产综合精品Aⅴ| 国产精品自拍合集| 国产精品自在在线午夜| 美女内射视频WWW网站午夜| 国产又粗又猛又爽视频| 97超碰精品成人国产| 成年免费在线观看| 国产精品播放| 国产精品护士| 99热免费在线| 91精品综合| av在线手机播放| 综1合AV在线播放| 中文字幕在线永久在线视频2020| 日本妇乱子伦视频| 亚洲人成人伊人成综合网无码| 免费人成在线观看成人片| 欧美日韩福利| 香蕉久久国产精品免| 欧美成人一级| 国产美女91呻吟求| 亚洲—日韩aV在线| 人妻精品久久久无码区色视| 老司机精品一区在线视频| 国产精品女熟高潮视频| 亚洲美女操| 国产三级成人| 熟女视频91| 亚洲精品在线影院| 国产喷水视频| 在线观看av永久| 一区二区三区毛片无码| 亚洲成人精品在线| 亚洲伊人久久精品影院|