李紅育 李紹偉
(云南愛因森軟件職業學院 昆明 650000)
探討數據庫的歷史及發展趨勢
李紅育 李紹偉
(云南愛因森軟件職業學院 昆明 650000)
數據庫技術的發展,已經成為信息技術的重要組成部分,是現代計算機信息系統和應用系統的基礎和核心。但是,隨著時代的發展,以前的很多數據庫技術已經越來越不能滿足市場的需要,各大數據庫巨頭公司都紛紛開始了新數據庫技術的研發。
數據庫 歷史 發展
數據庫(Databases,簡稱DB)是指長期保存在計算機的存儲設備上、并按照某種模型組織起來的、可以被各種用戶或應用共享的數據的集合。數據庫管理系統(DatabaseManagementSystems,簡稱DBMS)是指提供各種數據管理服務的計算機軟件系統,這種服務包括數據對象定義、數據存儲與備份、數據訪問與更新、數據統計與分析、數據安全保護、數據庫運行管理以及數據庫建立和維護等。由于企業信息化的目的就是要以現代信息技術為手段,對伴隨著企業生產和經營過程而產生的數據進行收集、加工、管理和利用,以改善企業生產經營的整體效率,增強企業的競爭力。所以,數據庫是企業信息化不可缺少的工具,是絕大部分企業信息系統的核心。
數據庫技術的發展,已經成為信息技術的重要組成部分,是現代計算機信息系統和計算機應用系統的基礎和核心。數據庫技術最初產生于20世紀60年代中期,根據數據模型的發展,可以劃分為三個階段:第一代的網狀、層次數據庫系統;第二代的關系數據庫系統;第三代的以面向對象模型為主要特征的數據庫系統。
代表是1969年IBM公司研制的層次模型的數據庫管理系統IMS和70年代美國數據庫系統語言協商CODASYL下屬數據庫任務組DBTG提議的網狀模型。層次數據庫的數據模型是有根的定向有序樹,網狀模型對應的是有向圖。這兩種數據庫奠定了現代數據庫發展的基礎。
主要特征是支持關系數據模型。關系模型具有以下特點:(1)關系模型的概念單一,實體和實體之間的聯系用關系來表示;(2)以關系數學為基礎;(3)數據的物理存儲和存取路徑對用戶不透明;(4)關系數據庫語言是非過程化的。
產生于80年代,隨著科學技術的不斷進步,各個行業領域對數據庫技術提出了更多的需求,關系型數據庫已經不能完全滿足需求,于是產生了第三代數據庫。主要有以下特征:
(1)支持數據管理、對象管理和知識管理;(2).保持和繼承了第二代數據庫系統的技術;(3)對其它系統開放,支持數據庫語言標準,支持標準網絡協議,有良好的可移植性、可連接性、可擴展性和互操作性等。第三代數據庫支持多種數據模型(比如關系模型和面向對象的模型),并和諸多新技術相結合(比如分布處理技術、并行計算技術、人工智能技術、多媒體技術、模糊技術),廣泛應用于多個領域(商業管理、GIS、計劃統計等),由此也衍生出多種新的數據庫技術。
為了能夠繼續在市場中立于不敗之地,各大數據庫巨頭公司紛紛推出其最新產品,數據庫市場競爭日益加劇。從最新的IDC報告顯示,在關系數據庫管理系統(RDBMS)軟件市場上,Oracle繼續領先對手IBM和微軟,但是微軟在2006年取得了更快的銷售增長率。根據對數據庫發展的技術趨勢不難看出,整個數據庫發展呈現出了六個主要特征:
IBM公司在它新推出的DB2 9版本中,直接把對XML的支持作為其新產品的最大賣點,號稱是業內第一個同時支持關系型數據和XML數據的混合數據庫,無需重新定義XML數據的格式,或將其置于數據庫大型對象的前提下,IBM DB2 9允許用戶無縫管理普通關系數據和純XML數據。
對于傳統關系型數據與層次型數據的混合應用已經成為了新一代數據庫產品所不可或缺的特點。除了IBM,Oracle和微軟也同時宣傳了它們的產品也可以實現高性能XML存儲與查詢,使現有應用更好的與XML共存。
為應對日益加劇的商業競爭,企業不斷增加內部IT及信息系統,使企業的商業數據成幾何數量級不斷遞增,如何能夠從這些海量數據中獲取更多的信息,以便分析決策將數據轉化為商業價值,就成為目前數據庫廠商關注的焦點。各數據庫廠商在新推出的產品中,紛紛表示自己的產品在商業智能方面有很大提高。如:微軟最新版SQLServer2005就集成了完整的商業智能套件,包括數據倉庫數據分析、ETL工具、報表及數據挖掘等,并有針對性的做了一些優化。如何更好的支持商業智能將是未來數據庫產品發展的主要趨勢之一。
SOA已經成為目前IT業內的一個大的發展趨勢,最初IBM和BEA是該理念的主要推動者,后來有越來越多的企業加入,開始宣稱支持SOA,其中包括Oracle,而微軟開始并不是非常贊同SOA的,但是,隨著時間的發展,目前國內主流的數據庫廠商都開始宣稱他們的產品是完全支持SOA架構的,包括微軟的SQLServer 2005,從微軟態度的轉變可以看出,未來IT業的發展與融合,SOA正在成長為一個主流的趨勢。
是行存儲還是列存儲,主要看如何應用數據信息。以前數據庫都是以行的形式來存儲。理由很簡單,用戶需要的是對單條數據的讀取和存儲。而現在,單純的數據記錄已經不足以支撐企業發展了,企業更需要的是數據分析和決策支持。那么,單純看一條記錄也就沒有了意義,而是要把所有數據的某一項都統計出來進行分析,這就是“列”的概念。列存儲的出現,實際上就是對數據分析需求的增多,而分析需求則一定是對某一個列的訪問。
所謂大的,主要是指企業級數據庫的規模。10年前,數據庫存儲的數據大都以GB為基準衡量。而現在,僅僅廣東移動一個公司每個月新增的數據量就已經用TB來衡量,相信不出3年,很多企業要存儲的數據就要達到PB級。數據量越來越大,需要更大的數據庫來做支撐,這就是數據庫的發展方向之一;
另一方面,數據庫又會越來越小。目前在國外的一款卡西歐手表中就帶有Sybase的數據庫。手表可以隨時記錄天氣情況、氣壓以及佩帶者的血壓、心跳、步頻等數據,佩戴者還可以把這些數據下載到計算機上做簡單的分析,這種數據庫雖然并不要求數據存儲量大,但是要求在低計算量的情況下反應快,而且能夠適應外界環境的變化。小數據庫主要集中在移動數據庫領域,現有技術已經能夠提供很好的支持。
數據倉庫就是面向主題的、集成的、不可更新的(穩定性)、隨時間不斷變化(不同時間)的數據集合,用以支持經營管理中的決策制定過程、數據倉庫中的數據面向主題,與傳統數據庫面向應用相對應。由于數據倉庫技術能夠在海量數據中快速提供科學的方法去整理數據,從而從不同視角對企業的經營管理提供精確分析與判斷,所以數據倉庫技術越來越受到企業的青睞和重視。
數據庫技術發展幾十年來,有些技術風光一時,但終究被淘汰;有些技術則猶如“常青樹”一般,一直沿用至今。不管怎樣,所有的預測都只能是方向性的,有風險的,各數據庫廠商彼此的理解也有著相當的差異。未來的數據庫會如何發展,我們將拭目以待,但可以肯定的是它一定是最大地滿足用戶各種需求的。
[1]王 珊,陳 紅.數據庫系統原理教程[M].北京:清華大學出版社,2005.
[2]寧 洪,趙文濤,賈麗麗.數據庫系統原理[M].北京:北京郵電大學出版社,2005.
[3]http://dev.csdn.net/[EB/OL].
[4]http://bbs.study365.cn[EB/OL].
[5]http://www.javaeye.com[EB/OL].
Discussion on the History and DevelopmentTrendsof Database
LiHongyu LiShaowei
(Yunnan Einsun Software College Kunming 650000)
Database technology hasbecomean importantpartofmodern computer information systems.However,w ith the development of the times,many database technology has become increasingly unable to meet the needs of the market,the major database giant companies have started to the research and development on a new database technology.
Database History Development
TP311.13
B
100617-5432
李紅育,男,1983年生,云南昆明市,助教,研究方向:軟件工程。
李紹偉,男,1984年生,云南文山,助教,研究方向:網絡技術及軟件工程。