葉健
摘要:隨著互聯網絡信息與計算機技術的深入發展,網絡信息資源具有多元化、隨機性、碎片化、模糊化、個性化等特征,為了更加精準和有針對性的利用網絡信息資源,需要采取科學合理行之有效的開發與挖掘方法,使得數據信息能夠得到有效應用。
關鍵詞:網絡;組織;開發;信息資源;數據挖掘
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9416(2017)01-0105-01
1 價值概述:網絡信息資源開發與挖掘的意義
網絡信息資源較之于傳統的一般的信息資源而言,具有其獨特的特征,信息內容豐富,信息變化頻繁,信息結構復雜,信息格式多樣。誠然,這些信息的本身的價值大小也不一樣。我們所處的信息環境是在不斷變化的,而且信息技術條件對信息環境的變化是革命性的,信息環境影響、催化或在一定程度上決定了人們的信息需求。
網絡信息資源的開發與挖掘就在于從紛繁復雜的“大數據”里通過合理的成本支出和科學的手段獲取有效信息。一般而言,針對于用戶行為層面的“大數據”(big data),乃是基于用戶行為信息的海量數據源,亦是用戶行為信息爆炸的產物。在自媒體及移動終端技術不斷發展的深刻變革前提下,用戶行為大數據具有幾個基本特點,亦稱之為“4V”特點:其一是Volume(指的是用戶行為信息的海量數據資料),其二是Velocity(指的是用戶行為信息的產生更新迭代速度快),其三是Variety(用戶行為信息類型繁復多樣),其四是Veracity(基于自媒體等智能挖掘的用戶信息真實)。
基于大數據的數據挖掘概言之就是從多元的、大量的、不完全的、模糊的、隨機的、碎片化的、零散分布的數據中挖掘出我們所需要的潛在有效信息。這些信息能夠被充分應用于電子商務、生活服務、經濟貿易、學術研究、科技提升等諸多領域。
2 模式分析:網絡信息資源開發與挖掘的基本模式
針對較為專業的諸如學術信息資源的開發與挖掘主要利用網絡搜索引擎及開放式存取的模式進行開發與挖掘。其一是綜合型搜索引擎,如百度、搜狐、新浪、Google、Yahoo、AlltheWeb、dmoz、MSN Search、。其二是專用搜索引擎,包括查找學術資源、查詢圖像信息、查找電子郵件、電話號碼、人物、新聞組、FTP服務器方面的引擎,如- WWW Virtual Library、 Intute、SCIRUS(科技文獻)、Google scholar。各種網絡搜索引擎的使用方法大體相同,根據用戶需要,可以輸入檢索詞進行主題查詢,也可以從分類目錄逐級查詢。其三是開放存取資源,如開放存取(Open Access,簡稱OA)是國際科技界、學術界、出版界、信息傳播界為推動科研成果利用網絡自由傳播而發起的運動。通過蓋技術,任何人可以免費的獲得各類文獻。開放存取不是一個技術問題,而是一個觀念和文化問題。
針對分散多元的信息需要通過數據挖掘工具手段加以實現。數據挖掘(Mining for Data)工具,其所用的網絡信息數據都存儲在已經有了明確字段定義的數據庫或文本文件里,我們稱之為結構化的網絡信息數據挖掘工具。它主要是用來進行預測、聚類分析、關聯分析、時間序列分析以及統計分析等。此外,需要指出的是對于一些數據信息還需要充分利用文本挖掘手段和技術來加以實現。
3 未來路徑:網絡信息資源開發與挖掘的發展趨勢
隨著大數據以及云計算技術的不斷深入發展以及人們對網絡信息資源的需求日漸精細化和精準化,網絡信息資源開發與挖掘未來在技術創新、渠道多元、成本收益比率等方面都會進行相應的提高。
對于網絡信息資源開發與挖掘的共享未來亦會成為一個全新的趨勢。網絡本身具有開放性,為了能夠更好的服務網絡信息資源使用者,充分發揮其價值,網絡資源的共享具有十分重要的意義與價值。今后應更加了解信息技術和網絡技術的使用,并積極尋求通過技術手段提高網絡信息資源和服務的覆蓋率。但是這也不可避免的存在諸多風險,需要指出的是,系統的實現還需要充分加強對系統的風險管理。然而,有許多風險需要指出,需要加強系統的風險管理來實現系統功能。構建基于安全前提下的網絡安全實現的大數據管理體系,實現相關信息的共享至關重要。隨著網絡技術的進一步發展,尤其是“大數據”、“云計算”時代的來臨,可以充分利用相關技術構建基于網絡安全實現的大數據管理體系,實現數據源及信息流的流動的信任機制和協商機制建設。
參考文獻
[1]王娜.網絡信息資源挖掘研究概述[J].圖書館學刊,2007(1):123-124.
[2]黃南霞,謝輝,王學東等.大數據環境下的網絡協同創新平臺及其應用研究[J].現代情報,2013,33(10):75-79.
[3]趙曉菲.動態關聯規則在網絡數據挖掘中的應用[J].數字技術與應用,2015(3):71-71.