999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

科學(xué)主題數(shù)據(jù)庫研究進展及應(yīng)用潛能

2022-11-26 10:02:18楊紅周小蕙郝淼陶衡通信作者
電子元器件與信息技術(shù) 2022年9期
關(guān)鍵詞:數(shù)據(jù)庫資源信息

楊紅,周小蕙,郝淼,,陶衡(通信作者)

1.貴州貴科大數(shù)據(jù)有限責(zé)任公司,貴州 貴陽 550000;2.貴州省分析測試研究院,貴州 貴陽 550000

0 引言

在數(shù)字經(jīng)濟、信息化社會的大環(huán)境下,存在嚴(yán)重的“信息孤島”現(xiàn)象,為使不同部門如采購、設(shè)計、生產(chǎn)、銷售之間實現(xiàn)信息共享、數(shù)據(jù)暢通,需要通過信息資源規(guī)劃來梳理業(yè)務(wù)流程,治理目前較為混亂的數(shù)據(jù)環(huán)境。由此構(gòu)建主題數(shù)據(jù)庫,而不是按照各種單一的報表原樣只建立所謂的“數(shù)據(jù)庫”。

主題數(shù)據(jù)庫是信息資源共享和數(shù)據(jù)利用的基礎(chǔ)體系,其構(gòu)建是為了匯聚常規(guī)信息系統(tǒng)的業(yè)務(wù)數(shù)據(jù)、人員數(shù)據(jù)、項目數(shù)據(jù)、研究數(shù)據(jù)等,夯實數(shù)據(jù)資源,為實現(xiàn)數(shù)據(jù)的整合、挖掘、共享交換和應(yīng)用奠定基礎(chǔ)。在主題數(shù)據(jù)庫的支撐下,實現(xiàn)對業(yè)務(wù)系統(tǒng)、政策方案、科學(xué)研究、項目情況等數(shù)據(jù)的深度匯總和挖掘分析,充分利用數(shù)據(jù)帶來業(yè)務(wù)價值的提升,實現(xiàn)業(yè)務(wù)高效化、規(guī)范化的目的。

構(gòu)建主題數(shù)據(jù)庫可滿足多方用戶需求,涉及多方領(lǐng)域、多種資源,較為全面。通過建立主題數(shù)據(jù)庫,簡易、科學(xué)地實現(xiàn)了應(yīng)用系統(tǒng)的集成,能夠為科研院所、企業(yè)和各級政府部門的戰(zhàn)略決策、研究成果等提供數(shù)據(jù)支持。

1 主題數(shù)據(jù)庫的作用

主題數(shù)據(jù)庫面向相應(yīng)的學(xué)科或是應(yīng)用領(lǐng)域,由眾多邏輯相關(guān)的數(shù)據(jù)資源按照統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范整合形成,具備系統(tǒng)性和完整性,并通過統(tǒng)一的系統(tǒng)以提供一站式服務(wù),是科學(xué)大數(shù)據(jù)的一種主要形式,作為某一類別基礎(chǔ)數(shù)據(jù)搜集、保存和分享的工具。在往昔的探索中,主題數(shù)據(jù)庫的研究同樣不羈于一種門類,而是在全行業(yè)廣泛研究和應(yīng)用。

王玉書和董丕明[1]在其研究成果中闡述了主題數(shù)據(jù)庫的概念,并給出關(guān)于企業(yè)的抽象化描述,認為主題數(shù)據(jù)庫是與企業(yè)主題有關(guān)、與常規(guī)計算應(yīng)用無關(guān)的長期穩(wěn)定的數(shù)據(jù)構(gòu)成,如產(chǎn)品數(shù)據(jù)庫就是一種主題數(shù)據(jù)庫。

針對產(chǎn)品制造商面臨的業(yè)務(wù)信息系統(tǒng)數(shù)據(jù)結(jié)構(gòu)異構(gòu)、產(chǎn)品數(shù)據(jù)管理與企業(yè)整體需求脫節(jié)等問題,分析企業(yè)層面產(chǎn)品數(shù)據(jù)資源模型的優(yōu)勢,研究復(fù)雜產(chǎn)品主題數(shù)據(jù)庫規(guī)劃的主要方法,形成基于主題集成和復(fù)雜產(chǎn)品數(shù)據(jù)全局管理的概念。經(jīng)由過程建立繁雜產(chǎn)品主題數(shù)據(jù)庫模型,利用數(shù)據(jù)適配器成立雙源數(shù)據(jù)與產(chǎn)品主題數(shù)據(jù)庫之間的聯(lián)系,可實現(xiàn)繁雜產(chǎn)品數(shù)據(jù)的集成和全局處理。

經(jīng)理信息系統(tǒng)(Executive Information System,EIS)[2]主要針對企業(yè)高管,由于暫時沒有“不變”的數(shù)據(jù)基礎(chǔ)而沒有施展出應(yīng)當(dāng)具有的效力。建立以EIS主題數(shù)據(jù)庫為核心的面向“主題”的數(shù)據(jù)剖析環(huán)境,所謂“主題”實則就是在較大、較高的層次將數(shù)據(jù)歸類為標(biāo)準(zhǔn),將分析對象抽象化的表現(xiàn)。每一個“主題”對應(yīng)一個“實體”,如人員、設(shè)施、產(chǎn)品等,其中各類數(shù)據(jù)都可集約化,設(shè)計為一種主題數(shù)據(jù)庫,在相對宏觀的數(shù)據(jù)分析領(lǐng)域中對數(shù)據(jù)有效管理,滿足查詢等需求。

科學(xué)數(shù)據(jù)網(wǎng)格(Scientific Data Grid,SDG)[3]的目的是在科學(xué)數(shù)據(jù)庫的數(shù)據(jù)資源基礎(chǔ)上,通過高性能調(diào)度技術(shù)、資源管理技術(shù)、數(shù)據(jù)網(wǎng)格技術(shù)[4]等進行網(wǎng)格計算,解決大量數(shù)據(jù)廣泛分布的異構(gòu)問題,并以此為基點研討、建立對科學(xué)探索有啟迪作用的應(yīng)用系統(tǒng),實現(xiàn)數(shù)據(jù)資源共享。數(shù)據(jù)挖掘中的數(shù)據(jù)分析、處理和計算能力可用來分析數(shù)據(jù)的關(guān)聯(lián)和數(shù)據(jù)聚類,發(fā)現(xiàn)數(shù)據(jù)隱藏的模式和關(guān)系過程,挖掘數(shù)據(jù)中的“內(nèi)容”。科學(xué)主題數(shù)據(jù)庫的建立,特別是以業(yè)務(wù)為導(dǎo)向、數(shù)據(jù)融合應(yīng)用為目標(biāo)的科學(xué)大數(shù)據(jù)主題庫,對于服務(wù)特色學(xué)科發(fā)展、為科技大數(shù)據(jù)多維度下的應(yīng)用服務(wù)提供了有力的數(shù)據(jù)支撐。早期的相關(guān)研究對主題數(shù)據(jù)庫的定義、概念及構(gòu)建具有重要的啟發(fā),對此,本文將繼續(xù)從橫向視角對主題數(shù)據(jù)庫的發(fā)展進行論述。

2 主題數(shù)據(jù)庫的發(fā)展

2.1 國內(nèi)研究進展

隨著大數(shù)據(jù)時代的到來,主題數(shù)據(jù)庫的數(shù)據(jù)管理方式和規(guī)劃方法發(fā)生了一定的轉(zhuǎn)變。王井樂[5]通過信息資源規(guī)劃梳理業(yè)務(wù)流程,進行了信息資源規(guī)劃研究,主要從以下三個角度出發(fā)。

(1)戰(zhàn)略角度。大數(shù)據(jù)時代下的信息資源能夠被概述為數(shù)以百計的業(yè)務(wù)類數(shù)據(jù),即使再復(fù)雜的信息系統(tǒng)也勢必要以信息資源作為其本源,因此信息資源規(guī)劃具有關(guān)鍵的戰(zhàn)略性地位。

(2)應(yīng)用角度。信息資源按來源可以分為內(nèi)部和外部資源,即與之內(nèi)部業(yè)務(wù)相關(guān)聯(lián)的資源和在外產(chǎn)生的,以及與內(nèi)部發(fā)展密切聯(lián)系的外部資源。從內(nèi)部資源角度看,企業(yè)的空間跨度越大,對信息共享的要求就越高;反之,從外部資源角度看,合理整合、利用外部資源可以明顯增強企業(yè)的競爭優(yōu)勢。

(3)方法模型角度。 很多學(xué)者從方法模型角度研討了信息資源規(guī)劃及其管理模型和管理框架。目前的主流理論將信息資源管理分為七大模塊研究,即數(shù)據(jù)管理、電子通信、圖書館、技術(shù)情報中心、文書和記錄管理、辦公系統(tǒng)研究、信息服務(wù)以及統(tǒng)計信息管理。

事實上,主題數(shù)據(jù)庫還未被大規(guī)模地普及到實踐應(yīng)用中,更多的是對其特征和技術(shù)環(huán)境等方面的摸索。周炎濤等人[6]對主題數(shù)據(jù)庫的技術(shù)進行了親合性分析方法研究,將主題數(shù)據(jù)庫作為高檔次的數(shù)據(jù)環(huán)境,其設(shè)計目的是能夠加速應(yīng)用項目的開發(fā),其邏輯結(jié)構(gòu)是獨立于當(dāng)前的計算機軟硬件實現(xiàn)過程,并具有以下基本特征[7]:①面向業(yè)務(wù)主題,與科研、政府及企業(yè)管理待解決的主要問題有關(guān);②咨詢分享,在不同的應(yīng)用系統(tǒng)中“共建共用”主題資料庫;③一次一處輸入系統(tǒng),數(shù)據(jù)直接獲得、利用、存儲和傳輸;④由基本表(Base Table)組成,即主題數(shù)據(jù)庫的科學(xué)數(shù)據(jù)結(jié)構(gòu)由“基本表”規(guī)范的數(shù)據(jù)實體構(gòu)成。

按照關(guān)系模式的觀點,現(xiàn)實世界中有聯(lián)系的數(shù)據(jù)對象就構(gòu)成了一個“實體”[8],每一個主題相對應(yīng)一個“實體”,數(shù)據(jù)庫則是由無數(shù)的“實體”匯聚而成,“實體”間存在一定的關(guān)系,把“實體”聚合成主題數(shù)據(jù)庫需遵循如下原則:①極弱的聯(lián)系,必須在不同的大組中;②較弱聯(lián)系或不常使用的聯(lián)系,可以在不同的大組中;③一般聯(lián)系,是否在一個大組中沒有影響;④較強聯(lián)系或經(jīng)常使用的聯(lián)系,可以在同一個大組中;⑤極強聯(lián)系,必須在一個大組中。

現(xiàn)階段主題數(shù)據(jù)庫的研究還包括專題數(shù)據(jù)庫,李娟等人[9]提出如何構(gòu)建“一帶一路”專題數(shù)據(jù)庫,并且將其分為4步:①面向不同用戶開展需求分析,制定數(shù)字資源建設(shè)規(guī)劃;②篩選數(shù)字資源內(nèi)容,涵蓋多樣化資源類型;③多渠道開展資源獲取,保障高質(zhì)量數(shù)據(jù)資源;④數(shù)字資源加工與整合揭示。

事實上,主題數(shù)據(jù)庫和專題數(shù)據(jù)庫在某一層面的確有共通之處,對專題數(shù)據(jù)庫的研究更是進一步探索了主題數(shù)據(jù)庫的構(gòu)建及其構(gòu)建意義。

主題數(shù)據(jù)庫的一種集約化數(shù)據(jù)環(huán)境,能很好地解決由于信息系統(tǒng)缺乏總體規(guī)劃,分散開發(fā),數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,導(dǎo)致數(shù)據(jù)大量冗余,信息綜合利用率低,信息共享和反饋困難等問題。關(guān)于主題數(shù)據(jù)庫的構(gòu)建方法和評估機制,陳勇躍等人[10]同樣指出主題數(shù)據(jù)庫的設(shè)計是面向“主題”設(shè)計,對“實體”進行“主題”的劃分,形成一個“主題”的“實體”組合,后在此基礎(chǔ)上進行概念、邏輯、物理等類似“主題”數(shù)據(jù)庫的策劃和實行。“主題”的合理區(qū)分對制定主題數(shù)據(jù)庫具有決定性作用。

主題數(shù)據(jù)庫的規(guī)劃是對需求進行梳理,對業(yè)務(wù)進行分析,以構(gòu)建模型。主題數(shù)據(jù)庫的建模過程(圖1)主要是采集信息、收集數(shù)據(jù)、編制標(biāo)準(zhǔn)、建立體系。其中,制定概念數(shù)據(jù)庫和邏輯數(shù)據(jù)庫標(biāo)準(zhǔn)是主題數(shù)據(jù)庫建立時的準(zhǔn)則和依據(jù)。

圖1 主題數(shù)據(jù)庫建模過程

2.2 國外研究進展

國際上,縱觀數(shù)據(jù)庫的發(fā)展歷程,早在20世紀(jì)50年代左右,美國國防部就將其在國內(nèi)外的兵隊部署、設(shè)備設(shè)施和戰(zhàn)略補給等相關(guān)數(shù)據(jù)集中起來用計算機進行相應(yīng)處理和傳送,稱之為“數(shù)據(jù)庫”[11],數(shù)據(jù)庫即具有多目的性文件的“集合體”。在后來的發(fā)展中,為確保相同數(shù)據(jù)統(tǒng)一管理,規(guī)范收集并處理數(shù)據(jù),從而構(gòu)建了有相應(yīng)邏輯和概念的“主題”數(shù)據(jù)庫,對主題數(shù)據(jù)庫的研究更多指向不同領(lǐng)域,如醫(yī)學(xué)試驗、信息系統(tǒng)、企業(yè)管理等。

Andre Pinho等人[12]研究科學(xué)主題數(shù)據(jù)庫以應(yīng)對臨床試驗存在的許多挑戰(zhàn),包括對適當(dāng)研究對象的招募和登記。每年全世界花費數(shù)十億美元用于藥物開發(fā)和相關(guān)的臨床試驗,贊助臨床試驗的制藥公司需要確保其數(shù)據(jù)的準(zhǔn)確性和及時性。因此探索了一個全球監(jiān)管合規(guī)數(shù)據(jù)庫的開發(fā),該數(shù)據(jù)庫收集研究對象的歷史確切信息,以發(fā)現(xiàn)多種潛在的缺陷和違反方案,這將對加強臨床試驗數(shù)據(jù)準(zhǔn)確性有不可估量的好處。臨床試驗驗證(Verified Clinical Trials,VCT)是世界上最大、最全面的研究性主題數(shù)據(jù)庫。通過利用VCT,發(fā)起者可以確保他們的受試者得到了驗證,既沒有參加另一個臨床試驗,也沒有處于洗脫期,更沒有違反任何其他方案標(biāo)準(zhǔn)。

Trachtengerts Michael[13]演示了一種方法,以更好地收集科學(xué)專題數(shù)據(jù)中心的數(shù)據(jù)。對于大多數(shù)主題數(shù)據(jù)庫來說,收集新發(fā)表的數(shù)據(jù)是一個長期且耗費人力的過程,因此改進數(shù)據(jù)收集方法在學(xué)科數(shù)據(jù)中心的內(nèi)部活動中具有一定的優(yōu)先地位。他們中的許多人在相似的科學(xué)領(lǐng)域做著幾乎相同的工作,從相同的來源中選擇數(shù)據(jù),根據(jù)采用的規(guī)則設(shè)置信息、打字、精確控制等。

收集效率的提高依賴于科學(xué)技術(shù)的進步,基于數(shù)據(jù)揭示新發(fā)現(xiàn)、新事實等。主題數(shù)據(jù)庫中相關(guān)資源的分配是一個難題,因為它們通過多種信息來源廣泛傳播。較早的解決辦法是將各個有關(guān)中心的小組聯(lián)合在網(wǎng)絡(luò)上,為它們之間的信息交換制訂統(tǒng)一的格式。這一做法在組織活動時造成一系列障礙,并常常使這種聯(lián)系的結(jié)果無效。

Trachtengerts Michael[13]還以某課題熱物理中心的局部BD系統(tǒng)為例,重點介紹了一種能夠方便地將VLIS(Very Large Information Systems)的搜索結(jié)果轉(zhuǎn)換為局部BD系統(tǒng)的方法,并揭示需要有權(quán)威可靠的數(shù)據(jù)來源以構(gòu)建主題數(shù)據(jù)庫。

M.S.Trakhtengerts[14]則在其研究成果中提及使用全球信息檢索系統(tǒng)作為生成主題數(shù)據(jù)中心集合來源的方法。

3 發(fā)展前景預(yù)測

隨著大數(shù)據(jù)時代的到來和快速發(fā)展,數(shù)據(jù)庫的應(yīng)用也在向各個領(lǐng)域拓展。在當(dāng)前時代及不遠的未來,數(shù)據(jù)庫有著更強的社會性和領(lǐng)域廣泛性,能夠更好地為大眾服務(wù)。科學(xué)大數(shù)據(jù)的發(fā)展,使得數(shù)據(jù)庫也呈現(xiàn)出多樣化的趨勢,科學(xué)主題數(shù)據(jù)庫便是其中更具有深度、專業(yè)性和綜合性的一類數(shù)據(jù)庫。

由于信息處于爆發(fā)式增長,科研機構(gòu)、政府、企業(yè)每天處理的數(shù)據(jù)量高達上百萬,而龐大的數(shù)據(jù)量呈現(xiàn)出不統(tǒng)一、不全面、不清晰等特征,如何有效處理信息,已成為當(dāng)代面臨的重大難題。因此,數(shù)據(jù)挖掘作為主題數(shù)據(jù)庫應(yīng)用中重要的技術(shù)之一,綜合了機器學(xué)習(xí)、統(tǒng)計分析和數(shù)據(jù)庫技術(shù),為數(shù)據(jù)庫中數(shù)據(jù)的決策型使用提供服務(wù),在海量及復(fù)雜的數(shù)據(jù)中索取隱性且有用的信息和知識。

隨著計算機技術(shù)的飛速發(fā)展和廣泛應(yīng)用,各種數(shù)據(jù)參差不齊等現(xiàn)象都對主題數(shù)據(jù)庫的應(yīng)用提出了挑戰(zhàn)。在大數(shù)據(jù)背景下,主題數(shù)據(jù)庫技術(shù)占有重要地位,并具有廣闊的發(fā)展前景。

4 結(jié)語

大數(shù)據(jù)的利用已遍及到越來越多的學(xué)科和范疇中,受到廣泛關(guān)注。科學(xué)數(shù)據(jù)作為國家經(jīng)濟社會發(fā)展和科技創(chuàng)新的重要資源,從科研申報、科研啟動、研究過程的實施、研究成果提煉、成果轉(zhuǎn)化應(yīng)用,到產(chǎn)生經(jīng)濟價值等過程,涉及科研基礎(chǔ)數(shù)據(jù)、科研技術(shù)數(shù)據(jù)、科研資料、環(huán)境數(shù)據(jù)、研究數(shù)據(jù)等。隨著科學(xué)數(shù)據(jù)的爆發(fā)式增長,匯聚全方位的科學(xué)數(shù)據(jù),對數(shù)據(jù)進行深度挖掘,提煉科研數(shù)據(jù)趨勢、決策分析報告,對于促進科學(xué)研究和產(chǎn)業(yè)發(fā)展具有重大意義。例如生態(tài)資源普查、生物多樣性保護、臨床試驗等,都急需建立主題數(shù)據(jù)庫,并投入到處理數(shù)據(jù)、資源規(guī)劃等應(yīng)用中。

研究表明,每個主題數(shù)據(jù)庫和實體集合都反映了實體之間的關(guān)系,通過實體聯(lián)系分析、實體聚合分析形成主題數(shù)據(jù)庫并對其進行規(guī)劃。研究主題數(shù)據(jù)庫在各領(lǐng)域的應(yīng)用,并提出專題數(shù)據(jù)庫的構(gòu)建過程,對于大數(shù)據(jù)時代下數(shù)據(jù)的進一步匯總和挖掘分析具有重要意義,有利于提升數(shù)據(jù)價值。同時,相關(guān)研究也解決了主題數(shù)據(jù)庫中關(guān)于資源分配的難題,揭示需要有權(quán)威、可靠且大量的數(shù)據(jù)來源,才得以構(gòu)建全方位的主題數(shù)據(jù)庫。

猜你喜歡
數(shù)據(jù)庫資源信息
基礎(chǔ)教育資源展示
一樣的資源,不一樣的收獲
資源回收
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 国产一区二区福利| 97av视频在线观看| 超清无码熟妇人妻AV在线绿巨人| 在线亚洲精品自拍| 亚洲三级影院| 亚洲国产天堂久久综合226114 | 69视频国产| 爱色欧美亚洲综合图区| 青草视频网站在线观看| 亚洲免费成人网| 午夜视频日本| 国产午夜一级毛片| 中文字幕在线日韩91| 国产无码制服丝袜| 久久99热66这里只有精品一| 免费 国产 无码久久久| 四虎国产在线观看| 91年精品国产福利线观看久久| 成年看免费观看视频拍拍| 久久综合丝袜长腿丝袜| 高清无码手机在线观看| 自偷自拍三级全三级视频| 国产精品xxx| 毛片网站在线看| 成人在线综合| 黄色不卡视频| 无码高清专区| 久久久久免费看成人影片 | 国产99精品久久| 国产高清又黄又嫩的免费视频网站| 91蜜芽尤物福利在线观看| 熟妇丰满人妻| 婷婷伊人久久| av一区二区三区在线观看| 精品综合久久久久久97超人该| 亚洲aaa视频| 欧美日本激情| 午夜人性色福利无码视频在线观看| 久久国产香蕉| 国产欧美视频在线| 久久精品国产免费观看频道| 伊在人亚洲香蕉精品播放| 玩两个丰满老熟女久久网| 成人毛片免费观看| 国产第四页| 亚洲一区网站| 久久精品中文字幕免费| 国产玖玖视频| 亚洲AV一二三区无码AV蜜桃| 伊人成人在线| 亚洲国产日韩一区| 久久婷婷六月| 91系列在线观看| 欧美国产视频| 国产原创第一页在线观看| 亚洲日本精品一区二区| 免费毛片在线| 中文字幕欧美日韩| 日韩免费毛片视频| av大片在线无码免费| 欧美亚洲一二三区| 91人妻在线视频| 国产手机在线ΑⅤ片无码观看| 在线观看精品自拍视频| 福利视频一区| 国产69精品久久久久孕妇大杂乱 | 54pao国产成人免费视频| 毛片基地美国正在播放亚洲| 久久久久亚洲AV成人人电影软件 | 99在线视频精品| 日韩无码一二三区| 日韩人妻无码制服丝袜视频| 日韩精品一区二区三区中文无码| 亚洲国产成人自拍| 国国产a国产片免费麻豆| 国产电话自拍伊人| 亚洲乱亚洲乱妇24p| 国产精品所毛片视频| 欧美精品不卡| 国产精品亚洲综合久久小说| 国产乱肥老妇精品视频| 色AV色 综合网站|