廣西壯族自治區(qū)科學(xué)技術(shù)情報(bào)研究 廣西 南寧 530022
隨著通信技術(shù)的快速更迭,社會已經(jīng)全面進(jìn)入到5G時代,大數(shù)據(jù)技術(shù)的應(yīng)用越來越廣泛和普遍,為各行各業(yè)賦予發(fā)展的新動能。對科技情報(bào)研究單位來說,充分借助新技術(shù)并發(fā)揮好科技信息大數(shù)據(jù)的優(yōu)勢是新時期內(nèi)科技情報(bào)研究服務(wù)工作的重點(diǎn)內(nèi)容。為此,針對科技信息大數(shù)據(jù)在情報(bào)研究服務(wù)中的應(yīng)用問題進(jìn)行分析和研究是十分必要的。
科技信息大數(shù)據(jù)主要是圍繞科研著作、專利、研究報(bào)告等科技信息而產(chǎn)生的數(shù)據(jù)。隨著網(wǎng)絡(luò)通訊技術(shù)和數(shù)據(jù)技術(shù)的發(fā)展,科技信息也不再局限于紙質(zhì)的方式,而是越來越多地以電子信息的方式產(chǎn)生、傳輸、呈現(xiàn)。經(jīng)過一段時間的累計(jì)后,這些電子式科技信息會形成一定規(guī)模的數(shù)據(jù)平臺或數(shù)據(jù)庫。工作人員可以通過對這些科技信息數(shù)據(jù)進(jìn)行分析研究來獲取所需要的科技情報(bào)。由于越來越多的科研人員傾向于以電子信息的方式來進(jìn)行科學(xué)技術(shù)研究工作,因此應(yīng)用科技信息大數(shù)據(jù)的方式來獲取科技情報(bào)信息更容易獲取到核心的數(shù)據(jù),并且這些數(shù)據(jù)比紙質(zhì)數(shù)據(jù)更新鮮更全面,更容易從中發(fā)現(xiàn)科技發(fā)展的趨勢。從具體的特征來看,科技信息大數(shù)據(jù)相對于傳統(tǒng)的數(shù)據(jù)具有以下特征:一是信息量大,數(shù)據(jù)平臺或數(shù)據(jù)庫規(guī)模大;二是數(shù)據(jù)增加更快,呈指數(shù)增長模式;三是數(shù)據(jù)維度更全面多元,不僅包括本專業(yè)的數(shù)據(jù),還涵蓋了相關(guān)專業(yè)的數(shù)據(jù);四是數(shù)據(jù)具有多源異構(gòu)性,同一個信息有不同的來源;五是數(shù)據(jù)新鮮度高,隨著時間的推進(jìn)和科技的發(fā)展,能夠及時獲取到新鮮數(shù)據(jù),使科技情報(bào)數(shù)據(jù)具有更強(qiáng)的時效性。
以往科技情報(bào)服務(wù)工作主要通過科技論文、圖書報(bào)刊等紙質(zhì)文獻(xiàn)的方式來獲取科技信息,從中梳理出具有價(jià)值的科技情報(bào)。隨著信息技術(shù)和數(shù)據(jù)技術(shù)的應(yīng)用,科技情報(bào)工作模式發(fā)生了很大的改變。情報(bào)研究服務(wù)工作應(yīng)保持與時俱進(jìn),結(jié)合大數(shù)據(jù)技術(shù)特征積極調(diào)整工作模式,使大數(shù)據(jù)技術(shù)能夠在情報(bào)研究服務(wù)工作中發(fā)揮出積極的效用。
首先,利用大數(shù)據(jù)技術(shù)對科技信息進(jìn)行采集、處理、儲存和應(yīng)用。對已經(jīng)建成的科技專業(yè)平臺數(shù)據(jù)庫以及機(jī)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行采集,動態(tài)監(jiān)測科技數(shù)據(jù)流并采集相關(guān)信息,對采集的信息進(jìn)行清洗、格式轉(zhuǎn)換以及關(guān)聯(lián)度和有效性分析。借助云計(jì)算技術(shù)建立科技大數(shù)據(jù)云存儲系統(tǒng),為海量增長的科技數(shù)據(jù)資源提供儲存或擴(kuò)展的空間,隨著科技數(shù)據(jù)的不斷積累,逐步形成清洗的大數(shù)據(jù)存儲結(jié)構(gòu)。利用大數(shù)據(jù)技術(shù)、機(jī)器學(xué)習(xí)技術(shù)以及各種數(shù)學(xué)模型,對多種來源不同結(jié)構(gòu)的數(shù)據(jù)進(jìn)行計(jì)算、分析、比較,從而實(shí)現(xiàn)對科技數(shù)據(jù)的深度挖掘,為科技情報(bào)研究服務(wù)工作提供技術(shù)支持。
其次,利用大數(shù)據(jù)技術(shù)完善科技情報(bào)服務(wù)體系。根據(jù)不同的用戶需求建立起各自的科技情報(bào)服務(wù)需求模型,提高科技情報(bào)服務(wù)產(chǎn)品及情報(bào)服務(wù)的精細(xì)化水平。利用大數(shù)據(jù)技術(shù)建立科技情報(bào)研究服務(wù)云平臺,基于服務(wù)云平臺建立完善的科技數(shù)據(jù)和情報(bào)成果管理共享機(jī)制。通過對用戶提供科技情報(bào)研究服務(wù)產(chǎn)品,提升科技情報(bào)研究服務(wù)的便利性、規(guī)范性和權(quán)威性。為用戶提供數(shù)據(jù)的應(yīng)用程序接口,依托學(xué)生期刊、報(bào)紙報(bào)刊、網(wǎng)絡(luò)科技新媒體平臺,做好科技情報(bào)數(shù)據(jù)和情報(bào)研究成果的傳播。利用大數(shù)據(jù)技術(shù)探索更多的產(chǎn)品服務(wù)模式,提高科技情報(bào)服務(wù)覆蓋的光度。
第三,利用大數(shù)據(jù)技術(shù)為科技情報(bào)服務(wù)工作提供可靠的保障支持體系。建立統(tǒng)一的數(shù)據(jù)采集、儲存、共享和利用標(biāo)準(zhǔn),及時針對數(shù)據(jù)問題給出反饋和響應(yīng),合理解決數(shù)據(jù)問題。通過大數(shù)據(jù)技術(shù)的支持,逐漸形成穩(wěn)定的科技情報(bào)研究服務(wù)可持續(xù)工作機(jī)制,形成日益完善的科技數(shù)據(jù)資源基礎(chǔ)服務(wù)環(huán)境,保證科技研究情報(bào)服務(wù)平臺穩(wěn)定運(yùn)行。
數(shù)據(jù)抽取技術(shù):隨著互聯(lián)網(wǎng)技術(shù)的普及應(yīng)用,網(wǎng)絡(luò)上的信息數(shù)據(jù)也越來越多,信息數(shù)據(jù)量的增多一方面使數(shù)據(jù)來源更多,另一方面也存在很多的偽信息或?qū)δ繕?biāo)無效的信息。通過數(shù)據(jù)抽取技術(shù)可以幫助情報(bào)研究人員在海量的信息中快速篩選出符合自己需要的信息,節(jié)省時間和精力,提高情報(bào)研究服務(wù)工作效率。
多源異構(gòu)數(shù)據(jù)融合技術(shù):數(shù)據(jù)的開發(fā)和共享必須打破傳統(tǒng)數(shù)據(jù)孤島的瓶頸,將工業(yè)業(yè)務(wù)數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)之間的壁壘打通。通過多源異構(gòu)數(shù)據(jù)的融合,將格式不同、開發(fā)框架不同、語義不同、關(guān)聯(lián)關(guān)系不同的數(shù)據(jù)在統(tǒng)一的框架內(nèi)進(jìn)行集成和整合。傳統(tǒng)的技術(shù)方法是通過自定義或定義標(biāo)準(zhǔn)來協(xié)同數(shù)據(jù),但在整合過程中需要開放源代碼或者數(shù)據(jù)庫支持。隨著大數(shù)據(jù)技術(shù)的發(fā)展,如今已經(jīng)出現(xiàn)了數(shù)據(jù)接口和計(jì)算分析平臺,不需要底層數(shù)據(jù)庫和源代碼開放就能夠?qū)崿F(xiàn)數(shù)據(jù)接口自動生成,并通過多種內(nèi)置算法對數(shù)據(jù)源進(jìn)行獲取和分析。
用戶畫像和用戶需求分析技術(shù):通過用戶數(shù)據(jù)來構(gòu)建用戶畫像,利用大數(shù)據(jù)技術(shù)還原用戶的旅程思維,挖掘用戶決策歷程,從中分析用戶的潛在需求,實(shí)現(xiàn)針對某種標(biāo)簽項(xiàng)下的用戶進(jìn)行精準(zhǔn)信息推送,為用戶提供更符合自身需求的服務(wù),使科研情報(bào)研究服務(wù)信息實(shí)現(xiàn)更有效的觸達(dá),提高科研情報(bào)工作的精準(zhǔn)性和用戶體驗(yàn)度。
新的時代和技術(shù)背景下,科技情報(bào)研究服務(wù)工作也面臨新的挑戰(zhàn)。積極轉(zhuǎn)變工作思路,調(diào)整和優(yōu)化工作模式,將大數(shù)據(jù)技術(shù)的優(yōu)勢充分發(fā)揮到科技情報(bào)研究服務(wù)工作中,更好地發(fā)揮出科技情報(bào)單位在科技研究和發(fā)展過程中的積極作用,釋放出科技的引擎動力,推動行業(yè)、國家和社會蓬勃發(fā)展。