王穎 李建敏
[摘 要] 本文從非結(jié)構(gòu)化數(shù)據(jù)庫技術(shù)出發(fā),分析了網(wǎng)絡(luò)環(huán)境下數(shù)據(jù)庫應(yīng)用現(xiàn)狀,探討了網(wǎng)絡(luò)數(shù)據(jù)庫的建設(shè)、非結(jié)構(gòu)化數(shù)據(jù)的分析,并以一個(gè)具體應(yīng)用實(shí)例進(jìn)行了說明。
[關(guān)鍵詞] 網(wǎng)絡(luò);非結(jié)構(gòu)化數(shù)據(jù)庫;應(yīng)用
[中圖分類號(hào)] G434 ? ? [文獻(xiàn)標(biāo)識(shí)碼] A ? 文章編號(hào):1671-0037(2015)06-68-3
Application Research on Unstructured Database in the Network
Wang Ying1 ?Li Jianmin2
(1. Management Service Center of Henan Research and Production and Test Base, Zhengzhou 450008; 2. Changyuan Science &Technology and Industrial Informatization Bureau in Henan Province, Changyuan ?Henan 453400)
Abstract:Based on unstructured database technology, this paper analyzes the current situation of database application in the network environment, discusses the construction of network databases, analysis of unstructured data, and an application example is used for explanation.
Keywords:network;unstructured database;application
1 引言
非結(jié)構(gòu)化數(shù)據(jù)庫和傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)庫相比,其字段長度可變,字段記錄又可以包含重復(fù)或不可重復(fù)的子字段。非結(jié)構(gòu)化數(shù)據(jù)庫不僅可以處理諸如數(shù)字、符號(hào)等信息,而且更適合處理全文本、圖像、聲音、影視、超媒體等信息。它突破了關(guān)系數(shù)據(jù)庫結(jié)構(gòu)定義相對固定、字段長度受限等缺陷,具有字段重復(fù)、變長字段的特點(diǎn),對變長數(shù)據(jù)可以進(jìn)行有效管理,在處理連續(xù)信息和非結(jié)構(gòu)信息中有著傳統(tǒng)關(guān)系型數(shù)據(jù)庫所無法比擬的優(yōu)勢。
同時(shí),網(wǎng)絡(luò)技術(shù)的快速發(fā)展與應(yīng)用,使得網(wǎng)絡(luò)環(huán)境中的數(shù)據(jù)量飛速增長,這些數(shù)據(jù)有兩個(gè)特點(diǎn),一是類型復(fù)雜多變、除傳統(tǒng)的文本信息外,還包含各種超文本文檔以及多媒體信息;二是數(shù)據(jù)量極大,從存儲(chǔ)空間看,已從TB級向PB級發(fā)展。對這些信息資源的處理問題,已成為網(wǎng)絡(luò)環(huán)境下數(shù)據(jù)庫技術(shù)新的應(yīng)用點(diǎn)。
2 網(wǎng)絡(luò)環(huán)境數(shù)據(jù)庫應(yīng)用分析
2.1 結(jié)構(gòu)化數(shù)據(jù)庫的局限性
隨著網(wǎng)絡(luò)的發(fā)展,各種新的應(yīng)用模式,如網(wǎng)絡(luò)搜索、云服務(wù)等不斷涌現(xiàn),對網(wǎng)絡(luò)數(shù)據(jù)處理提出了更多的需求,如對海量數(shù)據(jù)的高效存儲(chǔ)與訪問、高可用性和高擴(kuò)展性、非結(jié)構(gòu)化數(shù)據(jù)以及高并發(fā)的數(shù)據(jù)處理等,基于結(jié)構(gòu)化數(shù)據(jù)的傳統(tǒng)關(guān)系,數(shù)據(jù)庫呈現(xiàn)出越來越大的局限性和不足?!?br>