999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)下主題數(shù)據(jù)庫的研究現(xiàn)狀與展望*

2014-12-18 03:08:21于兆吉
關(guān)鍵詞:數(shù)據(jù)庫規(guī)劃資源

于兆吉, 魏 闖

(沈陽工業(yè)大學(xué) 管理學(xué)院, 沈陽 110870)

大數(shù)據(jù)下主題數(shù)據(jù)庫的研究現(xiàn)狀與展望*

于兆吉, 魏 闖

(沈陽工業(yè)大學(xué) 管理學(xué)院, 沈陽 110870)

在對數(shù)據(jù)庫和數(shù)據(jù)管理發(fā)展歷程進(jìn)行梳理的基礎(chǔ)上,提出主題數(shù)據(jù)庫應(yīng)結(jié)合大數(shù)據(jù)時(shí)代背景下的數(shù)據(jù)特點(diǎn)進(jìn)行重新定位和改變的觀點(diǎn)。通過對大數(shù)據(jù)和主題數(shù)據(jù)庫相關(guān)文獻(xiàn)的篩選、分類和分析,對大數(shù)據(jù)和主題數(shù)據(jù)庫的概念進(jìn)行認(rèn)知和界定,對與主題數(shù)據(jù)庫緊密相連的相關(guān)研究,包括主題劃分、信息資源規(guī)劃和大數(shù)據(jù)背景下管理和決策的研究現(xiàn)狀進(jìn)行評述,最后提出大數(shù)據(jù)時(shí)代主題數(shù)據(jù)庫進(jìn)一步研究的方向。

大數(shù)據(jù); 數(shù)據(jù)管理; 數(shù)據(jù)分析; 主題數(shù)據(jù)庫; 主題劃分; 信息資源規(guī)劃; 研究綜述

隨著互聯(lián)網(wǎng)突飛猛進(jìn)的發(fā)展,數(shù)據(jù)總量呈爆炸式增長,數(shù)據(jù)量從TB級別升到ZB級別,IDC報(bào)告稱,未來10年數(shù)據(jù)總量將會增加50倍,應(yīng)對如此的數(shù)據(jù)總量,相應(yīng)管理數(shù)據(jù)倉庫的服務(wù)器將增加10倍[1]。目前主流的軟件已經(jīng)無法在合理的時(shí)間內(nèi)針對如此數(shù)量級別的數(shù)據(jù)進(jìn)行擷取、管理、處理并整理成能為決策提供幫助的信息。美國政府率先提出并啟動(dòng)了“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,標(biāo)志著大數(shù)據(jù)已上升到國家意志,大數(shù)據(jù)時(shí)代到來。

一、主題數(shù)據(jù)庫的理論發(fā)展

1.數(shù)據(jù)庫和數(shù)據(jù)管理的發(fā)展

維基百科中對數(shù)據(jù)是這樣定義的:“描述事物的符號記錄,是可以定義為意義的實(shí)體,它涉及到事物的存在形式。”[2]數(shù)據(jù)逐漸演變?yōu)橹腔鄣牧鞒倘鐖D1所示。縱觀數(shù)據(jù)庫和數(shù)據(jù)處理的發(fā)展階段,也是圍繞著數(shù)據(jù)演化流程中的處理、挖掘和分析不斷發(fā)展和完善的。

圖1 數(shù)據(jù)演化流程圖

20世紀(jì)50年代中期以前,數(shù)據(jù)管理處于人工管理階段,數(shù)據(jù)并不被保存,只在需要使用時(shí)輸入。數(shù)據(jù)庫在20世紀(jì)50年代產(chǎn)生,此時(shí)數(shù)據(jù)管理簡單,通過大量的分類、比較和表格繪制的機(jī)器運(yùn)行數(shù)百萬穿孔卡片來進(jìn)行數(shù)據(jù)處理。Remington Rand Inc 1950年推出的一秒鐘可以輸入數(shù)百條記錄的磁帶驅(qū)動(dòng)器,引發(fā)了數(shù)據(jù)管理的革命。20世紀(jì)50年代后期到60年代中期,磁盤、磁鼓等存儲設(shè)備出現(xiàn),數(shù)據(jù)管理進(jìn)入到文件系統(tǒng)階段。1969年IBM建立第一個(gè)數(shù)據(jù)庫系統(tǒng)IMS,數(shù)據(jù)管理由此進(jìn)入數(shù)據(jù)庫系統(tǒng)階段。

由于數(shù)據(jù)獨(dú)立性和抽象級別上的欠缺,1970年E.F.Codd在論文《大型共享數(shù)據(jù)庫的數(shù)據(jù)關(guān)系模型》中提出關(guān)系模型的概念。隨著信息技術(shù)不斷發(fā)展,關(guān)系數(shù)據(jù)庫系統(tǒng)技術(shù)趨向成熟,但是不斷出現(xiàn)的復(fù)雜數(shù)據(jù)類型對數(shù)據(jù)庫提出了更新更高的要求,接下來出現(xiàn)了演繹數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫等新的數(shù)據(jù)庫類型研究,但沒有一個(gè)統(tǒng)一的數(shù)據(jù)模型能夠?qū)⑿滦偷臄?shù)據(jù)進(jìn)行表示和聯(lián)系[3]。數(shù)據(jù)管理隨數(shù)據(jù)特點(diǎn)和外部環(huán)境變化共經(jīng)歷了如表1所示的三個(gè)階段。

由于事務(wù)處理環(huán)境的局限性,數(shù)據(jù)庫無法實(shí)現(xiàn)高效的數(shù)據(jù)分析決策功能,大量數(shù)據(jù)處于分散狀態(tài),而有效正確分析的前提是需要完整和集成的數(shù)據(jù),這樣所得到的結(jié)果更加可靠。新的數(shù)據(jù)庫環(huán)境需求由此出現(xiàn),人們的需求從向數(shù)據(jù)庫中添加信息轉(zhuǎn)變?yōu)閺臄?shù)據(jù)庫中得到有用的信息。Bill Inmon 在《建立數(shù)據(jù)倉庫》中提出被人廣泛接受的概念——數(shù)據(jù)倉庫是一個(gè)面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,用于支持管理決策[4]。數(shù)據(jù)庫與數(shù)據(jù)倉庫的主要區(qū)別如表2所示。

表1 數(shù)據(jù)管理發(fā)展三個(gè)階段

表2 數(shù)據(jù)庫與數(shù)據(jù)倉庫的主要區(qū)別

數(shù)據(jù)倉庫是面向主題而不是面向事務(wù)的,主題是根據(jù)日常事務(wù)處理的業(yè)務(wù)進(jìn)行提取的。主題數(shù)據(jù)庫始于20世紀(jì)的70年代末期到80年代初,James Martin在《戰(zhàn)略數(shù)據(jù)規(guī)劃方法學(xué)》中提出了“主題數(shù)據(jù)庫”的概念和相關(guān)理論方法。主題數(shù)據(jù)庫隨著應(yīng)用的增多,數(shù)據(jù)庫不再增多,它不是按單證報(bào)表原樣去進(jìn)行數(shù)據(jù)庫的搭建,而是面向業(yè)務(wù)主題建立數(shù)據(jù)庫,實(shí)現(xiàn)系統(tǒng)的集成,解決數(shù)據(jù)冗余、信息共享程度低等亟需解決的問題[5]。

數(shù)據(jù)倉庫是集成的、面向主題的數(shù)據(jù)集合,主題數(shù)據(jù)庫就是這個(gè)集合中的元素。主題數(shù)據(jù)庫是四類數(shù)據(jù)環(huán)境中的高層次數(shù)據(jù)環(huán)境,經(jīng)過歸納總結(jié),主要有以下幾個(gè)方面的優(yōu)點(diǎn):

(1) 高度共享集約化的數(shù)據(jù)環(huán)境,易于管理。雖然建設(shè)時(shí)間長,但是所需維護(hù)成本低,信息共享程度高,不再是“自建自用”數(shù)據(jù)庫,而是各個(gè)應(yīng)用系統(tǒng)之間的“共建和共用”。

(2) 獨(dú)立于計(jì)算機(jī)的具體應(yīng)用。主題數(shù)據(jù)庫與企業(yè)組織需要解決的主要問題相關(guān)聯(lián),建成之后很多應(yīng)用項(xiàng)目可以此為基礎(chǔ)進(jìn)行構(gòu)建,減少冗余。

(3) 可以保證數(shù)據(jù)庫邏輯結(jié)構(gòu)的穩(wěn)定性。數(shù)據(jù)處于相對穩(wěn)定的環(huán)境之中,以此可以建立相對穩(wěn)定的數(shù)據(jù)模型,通過數(shù)據(jù)模型可以保證信息的準(zhǔn)確性和及時(shí)性,提供可靠的分析決策。

大數(shù)據(jù)時(shí)代下傳統(tǒng)的數(shù)據(jù)倉庫必須向大數(shù)據(jù)進(jìn)行靠攏,必須具有如表3所示的重要特性才能滿足目前的大數(shù)據(jù)需求。

表3 數(shù)據(jù)倉庫系統(tǒng)必須具備大數(shù)據(jù)的重要特性

面對大數(shù)據(jù)時(shí)代的數(shù)據(jù)特點(diǎn),主題數(shù)據(jù)庫的規(guī)劃方法和數(shù)據(jù)管理方式也應(yīng)產(chǎn)生新的變化以應(yīng)對數(shù)據(jù)思維的改變。

2.相關(guān)概念界定

大數(shù)據(jù)最早在Apache org的項(xiàng)目Nutch中被定義為“更新網(wǎng)絡(luò)搜索所需要進(jìn)行批量處理或分析的大量數(shù)據(jù)”[6]。Grobelnik M給出大數(shù)據(jù)的3V定義,認(rèn)為大數(shù)據(jù)需要基于以下3個(gè)特點(diǎn):Volume(規(guī)模性)、Velocity(高速型)和Variety(多樣性)[7]。IDC考慮大數(shù)據(jù)價(jià)值稀疏性的特點(diǎn),提出了大數(shù)據(jù)4V的定義,即在3V的基礎(chǔ)上添加了Value(價(jià)值性)[8]。由于大數(shù)據(jù)的真實(shí)性,IBM的4V定義是在3V的基礎(chǔ)上添加了Veracity(真實(shí)性)[9]。目前國內(nèi)外在大數(shù)據(jù)的定義上并沒有達(dá)成共識,本文基于主題數(shù)據(jù)庫在大數(shù)據(jù)時(shí)代下的應(yīng)用,把大數(shù)據(jù)定義為:“海量的數(shù)據(jù)規(guī)模已經(jīng)無法通過目前主流的工具在合理的時(shí)間范圍內(nèi)對業(yè)務(wù)數(shù)據(jù)進(jìn)行搜集、管理和分析處理。”

國內(nèi)高復(fù)先最早指出主題數(shù)據(jù)庫是一種數(shù)據(jù)環(huán)境,它獨(dú)立于具體的應(yīng)用,數(shù)據(jù)經(jīng)過設(shè)計(jì)后的存儲結(jié)構(gòu)與處理過程獨(dú)立開來,保持主題數(shù)據(jù)庫的邏輯結(jié)構(gòu)穩(wěn)定性[10]。李俊、趙霽對主題數(shù)據(jù)庫的特點(diǎn)與組織方式進(jìn)行研究后,定義主題數(shù)據(jù)庫為“一個(gè)用于支持企業(yè)或組織的決策分析處理的、面向主題的、集成的數(shù)據(jù)集合”[11]。本文結(jié)合大數(shù)據(jù)時(shí)代背景重新定義主題數(shù)據(jù)庫,認(rèn)為主題數(shù)據(jù)庫是在對整體業(yè)務(wù)需求分析規(guī)劃的前提下,以面向業(yè)務(wù)主題為基準(zhǔn)對各類應(yīng)用數(shù)據(jù)進(jìn)行綜合管理,消除冗余,抽取主題而建立的穩(wěn)定數(shù)據(jù)庫。

二、大數(shù)據(jù)下主題數(shù)據(jù)庫的研究現(xiàn)狀

目前國內(nèi)外的學(xué)者對主題數(shù)據(jù)庫的研究主要集中在信息資源規(guī)劃和主題劃分兩個(gè)方面。

1.信息資源規(guī)劃的相關(guān)研究

I.B.Singh最早在《信息資源規(guī)劃方法:案例研究》中以加拿大Albert地區(qū)殺蟲劑的使用和相關(guān)管理網(wǎng)建設(shè)為例,解釋了IRP產(chǎn)生的時(shí)代背景、目的和理論方法,其實(shí)施的主要步驟如圖2[12]所示。

圖2 IRP的實(shí)施流程圖

信息資源規(guī)劃的研究角度主要有以下幾個(gè)方面:

(1) 戰(zhàn)略角度。大數(shù)據(jù)時(shí)代信息資源主要是海量的業(yè)務(wù)數(shù)據(jù),無論多復(fù)雜龐大的信息系統(tǒng)都是以信息資源作為基礎(chǔ)和先導(dǎo)工作。

陳延壽在《企業(yè)信息資源的開發(fā)和利用》一文中指出了信息資源規(guī)劃的戰(zhàn)略性地位,認(rèn)為由于信息資源規(guī)劃的復(fù)雜性,存在著在規(guī)劃中缺乏相關(guān)的理論指導(dǎo)和專業(yè)型人才缺乏的問題[13]。秦艷姣在《信息資源規(guī)劃與企業(yè)信息化》中對我國的信息化發(fā)展現(xiàn)狀進(jìn)行了分析,認(rèn)為信息化的首要解決辦法就是信息資源規(guī)劃,闡釋了信息資源規(guī)劃的實(shí)施流程和步驟,并對其在企業(yè)信息化中相關(guān)的具體應(yīng)用進(jìn)行歸納總結(jié)[14]。王學(xué)穎在《基于生命周期視角的企業(yè)信息資源規(guī)劃研究》中分析了我國企業(yè)信息資源管理和規(guī)劃的現(xiàn)狀,在此基礎(chǔ)上提出了基于生命周期的規(guī)劃方法ILEA,并對其基本構(gòu)成和開發(fā)的方法進(jìn)行了闡述[15]。

大多數(shù)企業(yè)或組織在業(yè)務(wù)處理中沒有明確的信息資源規(guī)劃,還有一些企業(yè)形成的信息資源戰(zhàn)略管理的思維是信息資源杠桿戰(zhàn)略,因此信息資源的整合需要相應(yīng)的戰(zhàn)略制定[16]。S.K.Min指出,數(shù)據(jù)信息是目前企業(yè)或組織在競爭市場中獲得有利地位的決定性資源,提出了戰(zhàn)略系統(tǒng)規(guī)劃的概念,并且介紹了相關(guān)的方法論以及實(shí)施的具體過程[17]。

隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)信息共享以及工作的跨領(lǐng)域特性,在交接環(huán)節(jié)中就會導(dǎo)致延遲或者錯(cuò)誤。許捷關(guān)注財(cái)務(wù)系統(tǒng)在各個(gè)組織中的重要地位,并試圖從信息資源規(guī)劃的角度去詮釋建立財(cái)務(wù)信息系統(tǒng)在數(shù)據(jù)規(guī)劃中的相應(yīng)模型[18]。李翔認(rèn)為,信息資源規(guī)劃的工作需要和業(yè)務(wù)流程重組聯(lián)系,以業(yè)務(wù)流程重組為中心點(diǎn)進(jìn)行展開[19]。

(2) 應(yīng)用角度。信息資源一般可以按照來源分為內(nèi)部資源和外部資源。其中內(nèi)部資源系指與企業(yè)組織內(nèi)部業(yè)務(wù)聯(lián)系的各種信息資源,而外部資源就是企業(yè)或組織運(yùn)營之外產(chǎn)生的但是與其緊密相連的各種信息的集合。

從內(nèi)部信息資源來看,企業(yè)組織在空間上的跨度越來越大,分布地區(qū)越來越分散,然而對信息共享的要求越來越高,而且每個(gè)層次對于信息需求的程度和類型不同。從外部信息資源來看,Asa.Du.Toit在其《南非制造企業(yè)信息管理》一文中對南非制造企業(yè)的信息競爭優(yōu)勢進(jìn)行了研究分析,討論了通過有效的信息資源,從戰(zhàn)略的眼光來看其競爭優(yōu)勢能否增強(qiáng)[20]。我國學(xué)者孫毅通過對遼寧大連圣達(dá)公司為某企業(yè)成功實(shí)施信息資源規(guī)劃項(xiàng)目的研究,闡釋了如何使IRP適合各種應(yīng)用系統(tǒng)。

此外,我國學(xué)者對不同行業(yè)IRP進(jìn)行了研究。其中,吳迪針對建筑行業(yè)闡述了因?yàn)椴捎梅稚㈤_發(fā)和局部應(yīng)用系統(tǒng)造成“信息孤島”問題的現(xiàn)實(shí)存在,并探討了通過信息資源規(guī)劃的相關(guān)方法進(jìn)行信息系統(tǒng)的集成,進(jìn)而解決數(shù)據(jù)共享程度低的問題[21]。郭崇針對電信行業(yè),介紹了集成化和網(wǎng)絡(luò)化的龐大任務(wù)以及采用信息資源規(guī)劃和應(yīng)用系統(tǒng)進(jìn)行資源整合、引進(jìn)先進(jìn)的軟件和系統(tǒng)開發(fā)間的聯(lián)系[22]。

(3) 方法模型角度。大多數(shù)學(xué)者對信息資源規(guī)劃、管理的模型和框架進(jìn)行了探討。馬爾香提出了信息資源管理7模塊的理論,包括電子通訊、數(shù)據(jù)管理、文書和記錄管理、圖書館和技術(shù)情報(bào)中心、辦公系統(tǒng)研究和統(tǒng)計(jì)信息管理、信息服務(wù)[23]。而我國學(xué)者王曉光提出了6I模型,包括信息產(chǎn)品、信息內(nèi)容、信息標(biāo)準(zhǔn)、信息系統(tǒng)、信息流程、信息組織[24]。

蔡文海重點(diǎn)突出了主題數(shù)據(jù)庫建設(shè)在信息組織技術(shù)中的核心地位,探討了主題數(shù)據(jù)庫在運(yùn)輸經(jīng)濟(jì)中的應(yīng)用和重要地位[25]。陳騫在探討主題數(shù)據(jù)庫規(guī)劃的過程中提出了建立主題數(shù)據(jù)庫的相關(guān)方法,并闡述了對模型進(jìn)行遴選的方法[26]。

2.主題劃分的相關(guān)研究

主題數(shù)據(jù)庫在某種程度上是IRP實(shí)施數(shù)據(jù)標(biāo)準(zhǔn)化的支撐,對主題合理的規(guī)劃實(shí)施才能保證數(shù)據(jù)庫系統(tǒng)高效率、穩(wěn)定地運(yùn)行,并能快速適用于多變的應(yīng)用環(huán)境。在主題數(shù)據(jù)庫的構(gòu)建中,如何找出實(shí)體之間的關(guān)系,根據(jù)業(yè)務(wù)需求、數(shù)據(jù)需求提取主題是國內(nèi)外學(xué)者研究的重要內(nèi)容。

James Martin在《信息工程》中提出實(shí)體和活動(dòng)之間的內(nèi)在聯(lián)系,親和度的概念以及計(jì)算公式也同時(shí)被給出,企業(yè)組織可以依據(jù)計(jì)算出的親和度值判斷實(shí)體之間聯(lián)系的密切程度,然后進(jìn)行實(shí)體劃分,最后可以實(shí)現(xiàn)主題數(shù)據(jù)庫的簡單劃分[26]126-127。然而,親和度具有雙向性,也就是說實(shí)體A到實(shí)體B的親和度并不等同于實(shí)體B到實(shí)體A的親和度。因此,親和度不能明顯地區(qū)分和確定實(shí)體之間的關(guān)系,容易造成實(shí)體之間緊密程度的混淆,影響業(yè)務(wù)活動(dòng)中對實(shí)體關(guān)系的分析,這對于主題的劃分并沒有實(shí)際的意義。

周炎濤在親和性分析的基礎(chǔ)上提出了單向性模型,對雙向性的方法進(jìn)行改進(jìn),定義了聚合性分析以及聚合度的概念,以此來區(qū)別親和度和親和性分析的相關(guān)概念,通過建立聚合性分析的矩陣,可以清楚地看到實(shí)體之間的關(guān)聯(lián)程度,規(guī)避了親和性分析中的雙向性問題,更有利于實(shí)體分析中對于實(shí)體關(guān)系的分析和理解[27]。而王思昌通過對實(shí)體活動(dòng)之間關(guān)系的研究,建立了E-A矩陣,間接地判斷實(shí)體之間的關(guān)聯(lián)程度,從而對實(shí)體進(jìn)行規(guī)劃:首先確立核心實(shí)體,然后計(jì)算核心實(shí)體和其他各個(gè)實(shí)體之間的關(guān)系數(shù)值R,當(dāng)R大于給定的關(guān)聯(lián)系數(shù)分界值時(shí),表明兩個(gè)實(shí)體之間的關(guān)聯(lián)程度為緊密,因此這兩個(gè)實(shí)體組就可以歸為一個(gè)實(shí)體大組;相反則兩個(gè)實(shí)體組之間的關(guān)系為互相獨(dú)立[28]。

劉文遠(yuǎn)在對聚合性分析的研究中發(fā)現(xiàn),一些非核心的實(shí)體和核心實(shí)體對中的兩個(gè)實(shí)體之間的聚合度值是相同的,但是遇到聚合度不相等的情形,依然會出現(xiàn)和親和度一樣的雙向性問題,導(dǎo)致無法準(zhǔn)確判斷對兩個(gè)實(shí)體如何進(jìn)行劃分。為解決此問題,劉文遠(yuǎn)在《IRP中基于廣義聚合度的主題數(shù)據(jù)庫劃分技術(shù)》一文中給出了廣義聚合度的概念,規(guī)避了核心實(shí)體和與其聚合的其他實(shí)體具有次要聯(lián)系時(shí)的雙向性問題。這樣主題數(shù)據(jù)庫的劃分技術(shù)就更具有普遍適用性,實(shí)體之間的關(guān)系更為清晰且易于理解[29]。

樊康新等在研究實(shí)體之間的關(guān)系以及聯(lián)系強(qiáng)度的基礎(chǔ)上,提出了實(shí)體閉包的概念,指出可以將有關(guān)聯(lián)的實(shí)體劃分到一個(gè)閉包中,在進(jìn)行實(shí)體分組時(shí),計(jì)算實(shí)體之間聯(lián)系的緊密程度和使用頻率,認(rèn)為同一組的所有實(shí)體應(yīng)該都具有較緊密的關(guān)聯(lián)并較為頻繁地被使用,與此同時(shí),各個(gè)組的實(shí)體之間原則上應(yīng)該沒有關(guān)聯(lián)或者關(guān)聯(lián)性較弱而且被使用頻率較低。基于這種理論,企業(yè)組織應(yīng)該根據(jù)實(shí)際應(yīng)用情況確定各個(gè)實(shí)體之間的關(guān)聯(lián)程度,然后根據(jù)實(shí)體之間關(guān)聯(lián)程度的強(qiáng)弱進(jìn)行再次調(diào)整[30]。

綜合主題數(shù)據(jù)庫主題規(guī)劃的研究現(xiàn)狀,主題數(shù)據(jù)庫的規(guī)劃就是從上至下對業(yè)務(wù)所涉及的所有實(shí)體進(jìn)行聚類分析,并將全部數(shù)據(jù)劃分成可管理的單元。

3.大數(shù)據(jù)背景下數(shù)據(jù)的管理決策

大數(shù)據(jù)時(shí)代下的數(shù)據(jù)思維發(fā)生了革命性的變化,國內(nèi)外學(xué)者緊跟時(shí)代步伐,對大數(shù)據(jù)背景下的管理決策進(jìn)行研究與探索。包括R.E.Bryant在內(nèi)的三位信息科學(xué)領(lǐng)域的資深專家發(fā)表了《大數(shù)據(jù)計(jì)算:商務(wù)、科學(xué)和社會領(lǐng)域的革命性突破》,讓研究人員和業(yè)界認(rèn)識到,最重要的是大數(shù)據(jù)帶來的用途和見解的新穎性而不是數(shù)據(jù)本身[31]。緊隨其后,包括IBM在內(nèi)的國際知名公司爭先開始了大數(shù)據(jù)戰(zhàn)略的進(jìn)程,主動(dòng)跟進(jìn)大數(shù)據(jù)研究的最新進(jìn)展和應(yīng)用。目前的大數(shù)據(jù)研究仍處于初步階段,大部分研究集中于數(shù)據(jù)的挖掘、儲存、處理以及數(shù)據(jù)安全等方面。國內(nèi)外鮮有學(xué)者從管理決策的層面對大數(shù)據(jù)帶來的革新和變化進(jìn)行研究,這個(gè)領(lǐng)域是大數(shù)據(jù)背景下亟需關(guān)注的研究方向。

三、總結(jié)與展望

主題數(shù)據(jù)庫概念的提出已有時(shí)日,但主題數(shù)據(jù)庫的相關(guān)理論和方法并沒有被大規(guī)模地應(yīng)用到實(shí)踐中,因此還存在很多值得深入探討的問題。隨著大數(shù)據(jù)時(shí)代的到來,主題數(shù)據(jù)庫也必然產(chǎn)生新的理論和問題,總結(jié)歸納起來主要有以下幾個(gè)方面:

(1) 計(jì)算機(jī)技術(shù)隨著時(shí)代的發(fā)展飛速變化,IRP中主題數(shù)據(jù)庫的相關(guān)劃分方法也將隨之發(fā)生新的改變。如何在海量數(shù)據(jù)的今天,在滿足信息化要求的同時(shí)簡化主題數(shù)據(jù)庫流程,提高適用性,統(tǒng)一標(biāo)準(zhǔn),仍需要對理論方法不斷完善并和IRP結(jié)合起來,開展大量的工作。

(2) 大數(shù)據(jù)背景下,大部分?jǐn)?shù)據(jù)是非結(jié)構(gòu)化的數(shù)據(jù),數(shù)據(jù)質(zhì)量參差不齊。主題數(shù)據(jù)庫中主題的劃分方法在此時(shí)代背景下需要得以完善,如何對實(shí)體與實(shí)體、實(shí)體與活動(dòng)之間的關(guān)系建立合理的模型或者進(jìn)行計(jì)算,快速地將龐大的數(shù)據(jù)量分成合理的數(shù)據(jù)單元,建立起符合業(yè)務(wù)需求的主題數(shù)據(jù)庫是擺在面前的首要問題[32]。

目前大數(shù)據(jù)仍然處于起步探索階段,對于大數(shù)據(jù)的管理決策問題并沒有太多相關(guān)的研究成果。主題數(shù)據(jù)庫的建立是為了對數(shù)據(jù)進(jìn)行管理和通過數(shù)據(jù)進(jìn)行決策,因此在大數(shù)據(jù)背景下的主題數(shù)據(jù)庫更應(yīng)該側(cè)重于主題數(shù)據(jù)庫的數(shù)據(jù)分析和數(shù)據(jù)管理決策問題。針對大數(shù)據(jù)的幾個(gè)特點(diǎn),哪個(gè)特點(diǎn)對數(shù)據(jù)管理決策的影響最大,不同領(lǐng)域的使用人員和不同學(xué)科的研究人員之間如何溝通和協(xié)作才能有利于大數(shù)據(jù)背景下主題數(shù)據(jù)庫相關(guān)問題的解決,都將是下一步需要研究的方向。

[1] Gantz J,Reinsel D.2011 digital universe study:extracting value from chaos [EB/OL].[2011-09-01].http://china.emc.com/collateral/analyst-reports/idc-extracting-value-from-chaos-ar.pdf.

[2] 維基百科.數(shù)據(jù) [EB/OL].[2014-04-05].http://zh.wikipedia.org/w/index.php?title=%E6%95%B0%E6%8D%AE&oldid=28910777.

[3] 覃雄派,王會舉,李芙蓉,等.數(shù)據(jù)管理技術(shù)的新格局 [J].軟件學(xué)報(bào),2013(2):175-197.

[4] 劉喜文,鄭昌興,王文龍,等.構(gòu)建數(shù)據(jù)倉庫過程中的數(shù)據(jù)清洗研究 [J].圖書與情報(bào),2013(5):22-28.

[5] 陳騫,劉偉,孟慶久.信息資源規(guī)劃中的主題數(shù)據(jù)庫研究 [J].情報(bào)雜志,2006(2):136-137.

[6] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn) [J].計(jì)算機(jī)研究與發(fā)展,2013(1):146-169.

[7] Grobelnik M.Big-data computing:creating revolutionary breakthroughs in commerce,science,and society [EB/OL].[2014-04-05].http://videolectures.net/eswc2012_grobelnik_big_data.

[8] Barwick H.The “four Vs” of big data:implementing information infrastructure symposium [EB/OL].[2014-04-05].http://www.computerworld.com.au/article/396198/iiis_four_vs_big_data.

[9] IBM.What is big data [EB/OL].[2014-04-05].http://www-01.ibm.com/software/data/bigdata.

[10]高復(fù)先.信息工程與總體數(shù)據(jù)規(guī)劃 [J].交通與計(jì)算機(jī),1988(2):8-14,55.

[11]李俊,趙霽.主題數(shù)據(jù)庫的特點(diǎn)與組織方式 [J].交通與計(jì)算機(jī),2000(3):12-13.

[12]柯新生.基于網(wǎng)絡(luò)的企業(yè)級信息資源規(guī)劃理論與方法研究 [D].北京:北京交通大學(xué),2009:2-15.

[13]陳延壽.企業(yè)信息資源的開發(fā)與利用 [J].現(xiàn)代情報(bào),2005(7):193-195.

[14]秦艷姣.信息資源規(guī)劃與企業(yè)信息化 [J].現(xiàn)代情報(bào),2006(7):179-181.

[15]劉益江,毛寧,陳慶新.一種評估數(shù)據(jù)倉庫設(shè)計(jì)質(zhì)量的方法 [J].計(jì)算機(jī)技術(shù)與發(fā)展,2012(9):161-165.

[16]王學(xué)穎.基于生命周期視角的企業(yè)信息資源規(guī)劃研究 [J].情報(bào)雜志,2011(6):156-160,147.

[17]Chantrasa R.Decision-making approaches for information sharing in a supply chain [D].USA:Clemson University,2005:5-20.

[18]許捷.財(cái)務(wù)信息化與信息資源規(guī)劃 [D].大連:東北財(cái)經(jīng)大學(xué),2003:15-32.

[19]李翔.試論企業(yè)經(jīng)營秘密的保護(hù) [J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2003(11):181-183.

[20]李曉鋼.智慧城市的信息資源規(guī)劃研究 [J].電子政務(wù),2011(4):32-37.

[21]劉明,高明印,李常建.企業(yè)信息資源規(guī)劃實(shí)施研究 [J].價(jià)值工程,2004(4):113-116.

[22]郭崇.應(yīng)用信息資源規(guī)劃建立電信企業(yè)信息化基礎(chǔ) [J].東北財(cái)經(jīng)大學(xué)學(xué)報(bào),2004(6):51-53.

[23]覃雄派,王會舉,杜小勇,等.大數(shù)據(jù)分析:RDBMS與Map Reduce的競爭與共生 [J].軟件學(xué)報(bào),2012(1):32-45.

[24]王曉光.面向信息企業(yè)的信息資源規(guī)劃研究 [D].武漢:武漢大學(xué),2004:21-31.

[25]蔡文海.信息資源規(guī)劃工具的研制及其在運(yùn)輸經(jīng)濟(jì)中的應(yīng)用 [D].大連:大連海事大學(xué),2000:6-18.

[26]詹姆斯·馬丁.戰(zhàn)略數(shù)據(jù)規(guī)劃 [M].北京:清華大學(xué)出版社,1994.

[27]周炎濤,謝東,吳正國.單向性模型下的主題數(shù)據(jù)庫聚合性分析 [J].湖南大學(xué)學(xué)報(bào):自然科學(xué)版,2005(3):101-104.

[28]王思昌,冀亞林.信息工程中主題數(shù)據(jù)庫的規(guī)劃與設(shè)計(jì) [J].價(jià)值工程,2005(9):66-68.

[29]劉文遠(yuǎn),徐麗娜,王寶文,等.IRP中基于廣義聚合度的主題數(shù)據(jù)庫劃分技術(shù) [J].情報(bào)雜志,2007(10):70-71,74.

[30]樊康新,李春明,顧暉,等.MIS戰(zhàn)略數(shù)據(jù)規(guī)劃與主題數(shù)據(jù)庫構(gòu)造 [J].工業(yè)控制計(jì)算機(jī),2002(10):4-7.

[31]Watts D J.A twenty-first century science [J].Nature,2007,445(7127):489.

[32]王珊,王會舉,覃雄派,等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望 [J].計(jì)算機(jī)學(xué)報(bào),2011(10):1741-1752.

Statusquoandprospectofresearchesonsubjectdatabaseineraofbigdata

YU Zhao-ji, WEI Chuang

(School of Management, Shenyang University of Technology, Shenyang 110870, China)

Based on summarizing the development process of database and data management, the opinion is proposed that subject database should be repositioned and changed combining with the data features under the background of big data era.Through filtering, classifying and analyzing related literatures of big data and subject database, the conceptions of big data and subject database are recognized and defined, the status quo of related researches closely connected with subject database is reviewed and elaborated including topic partition, information resource planning, and management and decision-making under background of big data, and the further research direction of subject database in era of big data is proposed finally.

big data; data management; data analysis; subject database; subject partition; information resource planning; research review

2014-03-22

國家軟科學(xué)研究計(jì)劃資助項(xiàng)目(2012GXS4D078); 遼寧省自然科學(xué)基金項(xiàng)目(201202169); 遼寧省高等學(xué)校優(yōu)秀人才支持計(jì)劃項(xiàng)目(WR2012003)。

基金項(xiàng)目:于兆吉(1975-),男,遼寧遼陽人,副教授,博士,主要從事企業(yè)管理與技術(shù)創(chuàng)新等方面的研究。

* 本文已于2014-05-20 16∶55在中國知網(wǎng)優(yōu)先數(shù)字出版。 網(wǎng)絡(luò)出版地址:http://www.cnki.net/kcms/detail/21.1558.C.20140524.2141.016.html

10.7688/j.issn.1674-0823.2014.03.12

C 93-0

A

1674-0823(2014)03-0263-05

(責(zé)任編輯:吉海濤)

猜你喜歡
數(shù)據(jù)庫規(guī)劃資源
基礎(chǔ)教育資源展示
一樣的資源,不一樣的收獲
資源回收
規(guī)劃引領(lǐng)把握未來
快遞業(yè)十三五規(guī)劃發(fā)布
商周刊(2017年5期)2017-08-22 03:35:26
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
數(shù)據(jù)庫
多管齊下落實(shí)規(guī)劃
數(shù)據(jù)庫
數(shù)據(jù)庫
主站蜘蛛池模板: 亚洲欧美国产视频| 手机在线国产精品| 成人午夜久久| 麻豆精品视频在线原创| 72种姿势欧美久久久久大黄蕉| www.99精品视频在线播放| 国产玖玖视频| 狠狠亚洲婷婷综合色香| 国产最爽的乱婬视频国语对白| 日韩精品中文字幕一区三区| 婷婷六月天激情| 1级黄色毛片| yy6080理论大片一级久久| 色综合天天综合中文网| 欧美97色| 老色鬼久久亚洲AV综合| 在线观看免费人成视频色快速| 91丨九色丨首页在线播放| 免费女人18毛片a级毛片视频| 久久久久九九精品影院| AⅤ色综合久久天堂AV色综合| 国产视频你懂得| 国产第一页第二页| 无码在线激情片| 亚洲欧美天堂网| 欧美在线综合视频| www.国产福利| 久久国产热| 久久精品中文无码资源站| 国产激情无码一区二区APP| 91精品啪在线观看国产91| 国产精品视频猛进猛出| 成人午夜在线播放| 午夜精品福利影院| 亚洲天堂网在线播放| 中文字幕久久精品波多野结| 青青热久麻豆精品视频在线观看| 又爽又黄又无遮挡网站| 亚洲av无码人妻| 黄色污网站在线观看| 波多野结衣AV无码久久一区| 国产成人资源| 国产亚洲高清视频| 久久精品无码一区二区日韩免费| 狼友视频一区二区三区| 婷婷六月综合| 亚洲首页在线观看| 亚洲欧美在线综合图区| 国产精品无码久久久久AV| 亚洲一区二区成人| 国产精品综合久久久| 精品成人一区二区| 亚洲中文字幕无码mv| 成人小视频在线观看免费| 国产成人8x视频一区二区| 国产SUV精品一区二区| 亚洲精品成人福利在线电影| 强奷白丝美女在线观看| 美女国内精品自产拍在线播放| 老司机精品一区在线视频| 欧美一区二区三区国产精品| 国产美女无遮挡免费视频| 亚洲无码日韩一区| 伊人蕉久影院| 女同久久精品国产99国| 欧美成人午夜影院| 精品成人免费自拍视频| 色男人的天堂久久综合| 国产av无码日韩av无码网站| 91极品美女高潮叫床在线观看| 亚洲一区二区三区国产精华液| 国产18在线| 国产精品久久久久久搜索| 91久久精品国产| 国产精品高清国产三级囯产AV| 日本日韩欧美| 91精品日韩人妻无码久久| a天堂视频在线| 日本人又色又爽的视频| 亚洲人成网站色7799在线播放| 在线不卡免费视频| 黄色一级视频欧美|