999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向數據的軟件體系結構初步探討*

2016-10-28 07:41:39
計算機與生活 2016年10期

苗 放

1.成都理工大學 地球物理學院,成都 610059

2.地質災害防治與地質環境保護國家重點實驗室,成都 610059

面向數據的軟件體系結構初步探討*

苗放1,2+

1.成都理工大學 地球物理學院,成都 610059

2.地質災害防治與地質環境保護國家重點實驗室,成都 610059

受軟件體系結構的限制,信息技術領域長期存在的問題在大數據時代愈發突出:系統間的信息難以共享;已建系統功能擴展困難;海量、異構、多源、動態、實時變化和爆發式增長的大數據難管理,難分析,難挖掘;面向業務的軟件工程開發過程復雜,維護困難,生命周期短;在互聯網開放環境下的信息安全、數據安全問題面臨挑戰;數據所有者利益得不到保障等。面向數據的軟件體系結構(data-oriented software architecture,DOA),采用“面向數據和以數據為核心”的思想,通過數據注冊中心(data register center,DRC)、數據權限中心(data authority center,DAC)和數據異常中心(data exception control center,DEC)統一定義數據、管理數據和提供數據服務;通過數據應用單元(data application units,DAUs)對各種應用進行管理和服務,建立了一種數據大平臺與碎片化應用的數據生態系統,為構建大數據時代從數據保護到授權應用整套機制的軟件體系結構,進行了有益的探索。

大數據;軟件體系結構;面向數據的體系結構;數據生態系統;數據注冊中心;數據權限中心

1 引言

以大數據為特征的新時代已經來臨。2011年12月,趙國棟等人發布了《大數據時代的即將到來》的報告,這是中國關于大數據的第一聲吶喊;2012年,《大數據》和《大數據時代》先后出版;同年12月,鄂維南院士組織召開了第一屆數據科學及產業發展大會,中關村大數據產業聯盟也成立了;直到2015年5月,貴陽國際大數據博覽會成功舉辦,形成全國性的影響力;2015年9月,國務院發布《促進大數據發展行動綱要》,發展大數據正式成為國家意志,也標志著大數據時代來臨。

大數據時代下,大數據技術、大數據分析和挖掘,以及數據管理、信息共享、信息安全、軟件工程、系統擴展等[1-5],已經成為政府、企業界和科技界關注的熱點和面臨的挑戰[6-11]。李國杰院士在關于大數據應用與研究所面臨的問題與挑戰中指出,大數據時代,“需要考慮對整個IT架構進行革命性的重構”。廣義上講,革命指推動事物發生根本性變革,引起事物從舊制到新制的飛躍。IT架構的革命性重構本文認為應該從硬件和軟件兩個方面來考慮。云計算已經較好地解決了硬件方面的問題[12-16],是目前公認非常高效的處理大數據的方法之一[17]。亞馬遜的彈性計算云(elastic compute cloud,EC2)和簡單存儲服務(simple storage service,S3)是云計算發展的典范;OpenStack憑借開放先進的架構、高效的社區開發、靈活的部署模式獲得了業界的廣泛認可,成為當今最有影響力的云計算開源項目[18];OpenStack和Hadoop的融合,既最大限度提高了服務器的資源利用率,又大大降低了大數據儲量的準入門檻;NoSQL技術系統解決了類型多樣的大數據的管理、處理和分析問題;以MapReduce、Hadoop、Spark等為代表的非關系數據分析技術,快速地借助云計算平臺和大數據處理技術把數據轉換為商業價值,在互聯網搜索和其他大數據分析領域取得了重大進展。

云計算為軟件方面的革命性重構奠定了重要基礎,但在軟件的體系結構上,目前還沒有很好的解決方案。加拿大實時創新公司(Real-Time Innovation,Inc)的Joshi博士提交了“面向數據的體系結構:松散耦合的實時SOA”白皮書。該作者曾指出:數據是第一位的,對數據的操作是第二位的[19-20]。但作者只是從系統集成角度開展研究,沒有在面向數據方面的后續研究。Mohanty等人在“Big Imperatives,Enterprise Big Data Warehouse,BI Implementations and Analytics”一書中,討論了傳統的企業數據倉庫和大數據倉庫儲存大數據時面臨的挑戰,提出通過設計一個混合數據倉庫架構來實現數據平臺生態系統,體現了部分面向數據的思維[21]。Sawant等人在“Big DataApplicationArchitecture Q&A”一書中,較深入地探討了大數據的應用體系結構設計原則和實現方法,明確提出數據作為服務(data as a service,DaaS)對于大數據下的應用架構具有較重要的指導意義[22]。Llopis等人也在游戲設計領域采用面向數據的設計思想實現產品設計[23]。國內外還有一些相關研究,都不同程度地體現了一些面向數據的思想、大數據的應用架構及相關技術[24-25],但均未提出較完整的面向數據的軟件理論和方法體系。

本文在云計算的硬件架構之上,采用“面向數據和以數據為核心”的思想,構建一種適應于大數據時代的面向數據的軟件體系結構(data-oriented software architecture,DOA)。DOA通過數據注冊中心(data register center,DRC)、數據權限中心(data authority center,DAC)、數據異??刂浦行模╠ata exception control center,DEC)來統一定義數據、管理數據和提供數據服務,通過數據應用單元(data application units,DAUs)對各種應用進行管理和服務,建立一種數據大平臺與碎片化應用的可持續發展的數據生態系統,并構建從數據保護到授權應用的整套機制,為有效解決大數據時代所面臨的問題和挑戰提供基礎理論和方法技術支撐。云計算與DOA分別從硬件和軟件兩個方面,共同構建起大數據時代的IT基礎架構,其特點和優勢如表1所示。

Table 1 Advantages and characteristics of cloud computing and DOA表1 云計算與DOA的特點和優勢

2 大數據時代面臨的挑戰

受軟件體系結構的限制,信息技術領域長期存在的問題在大數據時代愈發突出:

(1)信息共享。經過數十年來信息技術發展和信息化應用的積累,政府部門和企業中建立的各種業務信息系統越來越多,但系統間很難實現信息共享,甚至新建的信息系統也難以和其他系統共享信息。信息“孤島”和信息“煙囪”現象普遍存在,而且問題越來越嚴重[22-23]。采用“接口”和“信息交換平臺”或“數據交換平臺”等方案,不能從根本上解決問題。

(2)系統擴展。信息系統建設完成后,應用需求發生變化就要重新修改代碼才能實現功能更改,造成應用信息系統對軟件開發者的依賴。一旦需求變化成為常態,系統的功能擴展問題就變得非常突出。

(3)數據管理[26-27]。過去的信息系統涉及的多是結構化數據,通過關系型數據庫管理系統(relational data base management system,RDBMS)就能很好地對數據進行管理。現在,面臨的大數據具有海量、異構、多源、動態、實時變化和爆發式增長的特點[28],數據來源多樣,種類繁多,動態變化,包括來自物聯網的物理空間數據,社交網絡的網絡空間數據等,至今沒有統一的數據定義和管理辦法。

(4)大數據分析和挖掘支持[29]。大數據需要通過處理、分析和挖掘才能產生價值,才能為決策提供支持。目前,對具有上述特點的大數據缺乏符合數據密集型模式的數據管理機制和平臺[30],因而對大數據的處理、分析和挖掘難以獲得具有持續、全面、科學和客觀的大數據分析和挖掘結果。

(5)軟件工程。傳統的面向業務的軟件開發過程復雜,開發和維護成本高,無法應對處于常態的業務應用需求變更,軟件生命周期短,更新、淘汰和重新開發投入大。在互聯網和移動互聯網時代,強調一切業務數據化[31],意味著要采集、記錄、存儲和管理一切業務過程中產生的數據,這對于需求分析、數據模型和業務應用等,都充滿了不確定性,也和傳統的軟件開發中要盡量有一個穩定、明確的需求正好相反,給傳統的面向業務的軟件工程帶來了嚴峻的挑戰。

(6)信息安全。信息安全涉及國家安全、社會穩定、企業利益和個人隱私。傳統的信息安全多是封閉環境下的信息安全,強調的是網絡安全、系統安全和應用安全[32]。在信息安全上,我國采用的是分級保護和等級保護的信息安全制度。傳統的數據安全,多強調的是數據中心的安全,雖然有備份、災備等技術保障數據的安全,但還存在著越權訪問等數據泄露隱患。在云計算、互聯網和移動互聯網應用以及大數據時代下,環境更為開放,對數據安全的要求更高,給信息安全帶來了更為嚴峻的挑戰。因此,信息安全除了網絡安全和系統安全保障之外,在安全的軟件體系結構和安全的數據進行保護機制等方面還要有更深入的研究。

(7)數據所有者利益保障。在大數據時代,以數據建設和提供信息(數據)服務的企業和部門越來越多,對這類數據提供者的利益保護愈發重要。但由于信息具有易復制、易傳輸、難保護的特點,現有的技術體系缺乏對數據進行保護和授權使用的機制,不足以保障數據所有者的利益,不利于這類企業或部門的發展。

3 軟件體系結構分析

3.1SOA與DOA

現有的軟件體系結構如圖1所示,是隨應用需求不斷演變而產生的。

Fig.1 Software architecture圖1 軟件體系結構

SOA(service-oriented architecture)為利用網絡提供軟件服務起到了至關重要的作用。SOA實施過程中,模塊化服務模式使得不同又相互連接的系統之間安全性變得非常復雜;SOA的標準以及兼容性方面不能適應市場上業務和功能的擴展,造成發展受限。加拿大博士Joshi在松散耦合的實時SOA白皮書中針對集成系統的擴展性和復雜性要求,采用面向數據的思想,來建立大規模系統集成的可行范式,并指出數據是第一位的,對數據的操作是第二位的,但沒有進行更深入的研究。面向數據的軟件體系結構DOA[33-34]不同于SOA(見表2),與具體的硬件平臺和軟件系統無關,通過數據的分類體系和訪問權限、數據注冊和登記中心,建立一種可持續發展的數據生態系統。

網絡技術出現以后,形成了C/S、B/S、P2P模式?,F在發展為由云計算支持的G/S(general browser/services cloud)模式[35-36],也稱端/云模式,以解決空間信息的網絡服務應用問題。DOA和端/云模式示意圖如圖2所示。

“端”表示利用面向人的客戶端,通過碎片化應用,隨時隨地、隨心隨意地和“云”互動;“云”表示包括物理世界數據采集云,網絡世界數據采集云,數據存儲云,DOA的數據注冊中心以及分布式、虛擬化引擎在內的后臺,為隨時隨地的碎片化應用提供支撐,其中“物理”云、“網絡”云和“存儲”云是DOA概念里廣義數據的表現方式。只有站在數據的角度上,才能把“云物移大智”融合在一起。DOA采用“面向數據和以數據為核心”的思想,有效解決了大數據時代面臨的軟件體系結構方面的諸多問題。

Table 2 Difference between DOAand SOA表2 軟件體系結構DOA與SOA的區別

3.2以數據為核心和面向數據的思維

大數據時代,數據思維至關重要。2015年,馬云在全球大數據時代貴陽峰會上講到從IT到DT的變革,不單單是技術的變革,要高度重視DT時代的數據思維,數據是未來制造業最大的能源。

“互聯網+”行動計劃帶給人們兩點啟示:一是以互聯網為代表的信息技術集合由過去的行業特征,轉變為可以支撐各行業發展的基礎;二是只有互聯網+數據,才能把傳統行業加到互聯網上去發展。

隨著人類的發展,在地球上構建了不同的皮膚,讓人們賴以生存、生活和發展,如表3所示。在由互聯網構成的新皮膚上,承載著數據,使人類得到更好的發展。

從人類文明演進軌跡上看,人類文明進入到信息社會和數據時代的文明3,是利用計算機、互聯網等技術,對人類自己思想和智慧的提升,利用數據為人類服務,如表4所示。

Fig.2 Data oriented architecture and end/cloud model圖2 面向數據的體系結構與端/云模式

Table 3 Earth?s skin concept of data thinking表3 數據思維之地球皮膚概念

Table 4 Evolution of human history and civilization of data thinking表4 數據思維之人類文明演進軌跡

而文明3的核心就是數據。從映射真實世界的虛擬世界,到信息、知識、智慧的根本,都是數據;從數據出發,才有信息、知識、智慧和決策;從網絡連接傳輸的內容,到服務器、云主機、終端所存儲、處理和展示的內容,都是數據。數據是人類認識世界、溝通交流、獲得知識、智慧決策的本源。一切技術、業務、功能、流程都是為了數據和圍繞數據而開展的。因此,一切均回歸本質,回歸數據,以數據為核心。

數據是有生命的,具有生命周期,生命過程需要全記錄。數據是有屬性的,具有安全屬性、身份屬性、時間和空間屬性。數據要加密呈現,并且具有不同的加密級別和深度。數據獨立于系統,是應用的基礎,不依賴于特定的硬件和軟件環境。同一數據可以支撐不同的應用。數據的訪問和應用是基于授權的,特定的訪問者,特定的場合(環境),特定的時間(時段)。

數據系統是生態、變化和發展的,是可持續發展的,自生長、自管理、自適應的。建立數據生態系統,就要面向數據和以數據為核心。數據生態系統包括生態的各種應用,是“肥沃的”數據“土壤”上生長著“茂盛的”應用“森林”。數據生態系統需要構建邏輯的數據資源池,支持數據大平臺與碎片化和不斷增長的應用,支持數據共享和系統可擴展。

4 面向數據的軟件體系結構

面向數據的體系結構(DOA)建立在云計算的硬件架構之上,采用“面向數據和以數據為核心”的思想,通過數據注冊中心、數據權限中心、數據異常控制中心來統一定義數據、管理數據和提供數據服務,通過數據應用單元對各種應用進行管理和服務,構建起從數據保護到授權應用的整套機制,為有效解決大數據時代所面臨的軟件體系結構問題提供基礎理論和方法技術支撐,建立一種數據大平臺與碎片化應用的數據生態系統。一個生態系統的好壞取決于這個生態系統的構成和運行機制,而面向數據的軟件體系結構就是探索一種解決數據與應用之間自生長、自適應、自管理和可持續發展的機制,也包括數據的安全機制和應用中數據的授權使用機制。數據是大數據時代下的廣義數據,是真實世界映射成虛擬世界的各種類型的數據,應用則是根據政府、企業和個人在互聯網和移動互聯網中隨時隨地、隨心隨意的各種需求產生出的碎片化和個性化的應用。數據生態系統可以簡單形象地比喻為“肥沃的數據土壤上生長著茂盛的應用森林”。從不同視角理解DOA如表5所示,DOA主要內容如圖3所示。

Table 5 Different perspectives to understand DOA表5 不同視角理解DOA

Fig.3 DOAmain content圖3 DOA主要內容

4.1面向數據的軟件體系結構的機制

(1)大數據時代對體系結構的需求。馬云提出,人類已經從IT時代走向DT時代,IT時代是以自我控制、自我管理為主,而DT時代,它是以服務大眾、激發生產力為主的技術[37-38]。數據技術包括信息技術,數據技術范圍更廣,內涵更豐富;信息技術更具體,針對性更強。數據技術時代需要新的世界觀,即數據世界觀,數據安全觀需要相適應的軟件體系結構,支持數據安全,支持一切業務數據化,管理海量、異構、復雜、變化和爆發式增長的大數據,并為挖掘有價值信息提供支持,同時需要重新審視數據,站在數據的角度審視技術、架構、安全體系。

(2)數據的定義和分類。大數據時代的數據是廣義數據,是真實世界映射成虛擬世界的內容。除了理解的計算機可以直接處理的數據外,還可以是能被注冊的各類事物,如設備、服務、APP、人、物等。這就需要研究大數據時代下的數據定義或廣義數據定義??梢詮牟煌嵌葋矸诸悢祿航Y構化/非結構化數據,關系型數據庫/NoSQL,動態數據/靜態數據,變化的數據/歷史數據,簡單數據/復雜數據,自有數據/共享數據/公開數據,不斷變化和不斷積累增長的大數據等。

(3)數據的載體及與云計算的關系。本質上云計算就是云服務。從數據角度,云計算更多是數據的存儲服務,是IaaS和DaaS,通過分布式和虛擬化技術,將基礎設施與數據融為一體(infrastructure plus data,I+D),為終端用戶提供彈性、可計量、個性化的數據和計算服務,可以簡稱“云”。一切皆在云中,包括所有的數據、網絡世界和物理世界的數據等。以數據為內容定義云,可以分為存儲云、網絡云和物理云(見圖2)。

(4)數據生態系統的含義及DOA的作用。數據生態系統是“肥沃的數據土壤上生長著茂盛的應用森林”,DOA是數據與應用之間可持續發展的關系描述。一個數據生態系統能夠成立,關鍵是要建立一種有效的作用機制,這就是面向數據的體系結構。

(5)DOA與數據和應用的關系。DOA就是建立在云計算支撐的數據和各種應用之間的,分別可以對數據和應用進行管理和服務的一種機制、一個平臺,形成一個以這種機制和平臺的相對不變來應對萬變的數據和應用的生態系統。這種關系和機制,也可以實現從實時數據到實時應用的支持。數據、DOA平臺和應用所構成的三層架構見圖4。

Fig.4 Three-layer architecture of data,DOAplatform and application圖4 數據、DOA平臺和應用所構成的三層架構

(6)DOA對數據的管理和服務模式。DOA面對的數據是廣義數據。要對廣義數據進行管理和服務,首先要解決對各種類型數據的統一標識和管理問題。其次,要考慮數據的價值保護,對數據進行屬性管理,并對數據進行權限和授權管理。第三,在分布式應用和有數據冗余的情況下,要考慮數據的唯一性和一致性問題。據此提出DRC、DAC和DEC,互相配合實現對各種類型數據的統一管理,并為應用提供數據服務。

(7)DOA與應用的業務邏輯和數據邏輯關系。傳統的應用信息系統構建邏輯大都是面向業務的邏輯,要求信息處理流程、數據結構等都按照業務過程的要求進行設計。好處是:信息流程與業務流程比較一致;缺點是:今后業務流程一旦發生變化,信息處理流程、數據結構等都要做相應的變化,給系統開發和維護帶來不可預測的困難。DOA要求面向數據,即要將應用的業務邏輯轉換為數據邏輯,這樣就要求將業務流程按照對數據資源池訪問的周期梳理成一個個小的面向數據的流程,最后再將這些面向數據的流程整合成面向業務的流程,完成應用信息系統的開發。好處是:一旦構建了數據資源池,構建面向數據的業務流程會比較便捷,而且業務流程發生變化,不會影響整個數據邏輯和數據流程,只需增加變化的部分或調整一些數據流程去適應新的變化即可;難點是:要將業務邏輯轉換為數據邏輯。

(8)DOA下數據安全的基本原理。傳統的信息安全,首先是建立一個封閉和相對安全的環境,通過各種方式來保證這個封閉環境是安全的或可信的,但在這里面的數據卻大多是“裸露”的,一旦有不速之客通過漏洞進入到這個環境,“裸露”的數據就面臨著極大的危險。在互聯網和云計算的開放環境下,按照這種封閉環境下的信息安全策略進行數據保護,將面臨著越權訪問帶來的極大挑戰。DOA是面向數據和以數據為核心的。數據具有安全屬性,即數據的身份屬性,明確數據的主人、朋友、陌生人和敵人。從數據角度考慮安全問題,要保證數據的完整性、機密性和可用性。數據要“天生加密,授權使用”。數據具有自保護功能,要穿戴盔甲,以加密方式呈現,具有不同的加密級別和深度。數據的使用要經過授權。數據具有兩種狀態:存儲和傳輸時的“數據態”以及授權使用中的“應用態”。“數據態”是加密狀態,“應用態”是解密狀態。當完成“應用”或離開了應用環境,數據應立即“變”為加密的“數據態”。DOA提供一種加解密機制和授權使用機制,使得數據在存儲和傳輸時是不可訪問和使用的,而經過授權的用戶在訪問數據或通過應用使用數據時,是透明的,即感覺不到數據的加密和解密過程。因此,DOA下的數據安全策略是,“數據態”的數據,既適合于封閉環境,也適合于開放環境,而“應用態”的數據,僅適合于“封閉”環境。這樣,數據安全問題就化解為數據加密和授權使用機制、數據自我保護和自動加解密機制、應用環境安全等幾個關鍵問題了。

4.2面向數據的軟件體系結構的組成

(1)面向數據的體系結構(DOA)的組成及完備性。作為協調數據和應用之間的關系以及構建數據生態系統的一種機制,DOA具有對廣義數據進行全面管理和服務的功能,以及對各類應用進行全面管理和服務的功能。DOA組成包括:對廣義和各類數據進行登記注冊管理的DRC,對數據進行授權、認證和計帳(授權及訪問過程記錄)管理的DAC,對數據的一致性進行管理的DEC,以及對各類應用進行管理、服務提供支持的DAUs。它們之間既相互獨立,又相互關聯,形成一個有機的整體。相互獨立,體現在它們的任務和功能互不相同;相互關聯,體現在它們之間的互為依賴。

(2)數據注冊中心(DRC)基本功能。數據注冊中心對各種類型的數據和廣義數據進行登記注冊,形成邏輯的數據資源池,方便應用對數據的訪問。其功能涉及但不限于:數據注冊信息定義,數據屬性信息,數據分類,元數據標準,元數據分類,不同類型數據的注冊方法,數據索引,元數據索引,數據檢索,廣義數據模式識別,分布式部署等。

(3)數據權限中心(DAC)基本功能。數據權限中心對數據進行權限管理,功能涉及但不限于:數據安全屬性定義,數據合法性鑒別,數據訪問權限定義,用戶權限認證,應用授權,用戶授權,數據授權與PKI(public key infrastructure),計帳算法及機制,數據透明加解密機制,高效數據加解密算法等。

(4)數據異??刂浦行模―EC)基本功能。數據異??刂浦行膶Ψ植际江h境下有數據冗余時的數據一致性進行處理,功能涉及但不限于:數據維護,自適應管理,異常探測與處理,巡檢,異常與沖突發現,同步處理,冗余處理,負載均衡等。

(5)數據應用單元(DAUs)基本功能。數據應用單元是在數據資源池之上的一系列應用單元模塊,針對應用管理和服務,通過類似于基于構件的軟件開發模式的搭積木方式和應用程序接口(application programming interface,API)調用,以“數據驅動應用”,快速滿足用戶的各種應用功能需求。其功能根據各種具體應用的需求,涉及但不限于:根據不同數據類型提供不同功能的數據功能單元(data function unit,DFU),以推送方式提供服務的數據服務單元(data service unit,DSU),數據加解密單元(data encryption unit,DEU),數據授權調用單元(data invocation unit,DIU),數據應用組合單元(data combination unit,DCU),數據可視化單元(data visualization unit,DVU),數據處理單元(data processing unit,DPU)等。

(6)面向數據的軟件工程原理初步探索。面向數據的體系結構(DOA)為軟件開發提供了新的方法。區別于傳統的面向業務的軟件工程,新的面向數據的軟件工程需要研究:具有生命周期的應用軟件與數據生態系統的關系,業務邏輯轉化為數據邏輯的開發過程,邏輯的數據資源池建設和運行維護機制,基于成長型數據生態系統的應用軟件開發模式,基于DAUs的面向數據的應用軟件快速構建機制,已有系統的數據整合方法等。

4.3數據注冊中心機制

數據注冊中心(DRC)是DOA的核心部件,通過它來構建邏輯的數據資源池,并管理數據和提供數據服務。DRC按照統一標準進行設計,可以將各個行業或不同規模的DRC進行互聯和關聯,從而構成更大規模的DOA系統。

(1)數據注冊內容定義及元數據標準。廣義數據包括云中存儲的各種類型的數據,也包括互聯網中傳遞的實時變化的數據,還包括物理世界存在的實體對象和狀態所表征的數據。數據注冊的內容包括數據特征、數據名稱、存在位置、數據描述、數據屬性、數據權限等。需要制定統一的數據注冊元數據標準。

(2)數據屬性信息定義。數據具有屬性,例如數據權人(數據主人)、數據的生命周期、數據權限、數據狀態、數據性質、數據合法性、數據質量等。

(3)數據分類及分類標準。包括數據分類的標準、分類的方法、分類的類別和分類的應用等。

(4)數據注冊方法。包括數據注冊方法,分為手動注冊、半自動注冊和全自動注冊。在數據注冊的同時,建立數據索引。應用產生的數據應自動進行注冊。

(5)元數據索引和檢索方法。數據注冊中心是為應用提供數據訪問服務的,訪問效率取決于索引和檢索方法。要建立高效的元數據索引和檢索機制,開發高效的索引和檢索方法。

(6)廣義數據模式識別。數據注冊中心注冊的內容可以是廣義數據,例如物理世界的實體。要快速檢索這些廣義數據,需要采取新的識別技術,例如可以采用基于模糊理論的模式識別技術來建立索引等方法。

(7)數據注冊中心分布式部署模式。數據注冊中心的數據注冊信息可以非常大,因此數據注冊中心也要部署到云的分布式環境中。

DRC數據自動注冊,數據注冊內容隨需自適應,并對歷史數據進行注冊與管理,鑒定數據來源及保障數據唯一性。

4.4數據權限中心機制

數據權限中心(DAC)是DOA的關鍵部件,對數據的安全存儲、傳輸及應用授權進行管理。對數據實行“天生加密,授權使用”的機制,將數據分成存儲和傳輸時保持加密的“數據態”和在應用中授權使用時解密的“應用態”,充分保證數據的安全及使用的授權。DOA從架構角度通過DAC來保障數據的安全性。DAC通過數據權限的管理對數據進行保護,并提供數據授權使用的機制,也可以保護數據擁有者的利益。

(1)開放環境下數據安全基本理論。開放環境下,要做到數據本身的安全,并能夠安全使用,首先就是數據應該具有“天生加密,授權使用”的特性。假設數據在使用中是不加密狀態,那么數據不在使用中就應該保持加密狀態。因此,設定數據具有兩種狀態:存儲和傳輸時處于加密狀態的“數據態”以及授權使用中處于解密狀態的“應用態”。DOA作為一種機制,就要保證數據能夠在這兩種狀態中與授權和加解密技術關聯起來。目前有關數據安全的理論和方法體系,網絡的授權、認證和計帳的AAA技術,CA技術,PKI技術,密鑰體系,加解密技術等,以及網絡安全技術、系統安全技術、應用環境安全技術等,都是適用的,但要從面向數據和以數據為核心的角度進行重新梳理,從數據安全的理念、理論、方法和受保護數據的應用機制等方面,進行適應性研究和更進一步的探討。

(2)數據的狀態機制。以面向對象的觀點來看待數據,數據除了其自身應具有的價值外,還具有內部屬性和外部狀態。從外部看,數據應具有“數據態”和“應用態”兩種狀態。要研究數據狀態的定義,數據狀態的設置和獲取,數據狀態的轉化,數據狀態的作用,數據狀態對環境的要求,數據狀態與數據加解密關系及作用機制等。

(3)數據固有安全屬性。數據的內部屬性包括關鍵的數據安全屬性。要研究數據安全屬性的定義,數據安全屬性的內容,數據具有的訪問權限,數據安全性說明,數據狀態,數據的主人(數據權人)、朋友(被授權人)、陌生人(未授權人)和敵人(不受權人),數據讀寫權利,數據追加歷史記錄,數據的數字水印與防偽鑒別,數據授權記錄等。

(4)數據訪問控制權限及管理機制。數據訪問控制依賴于數據安全屬性,又與數據的加解密關系密切。過去的數據訪問控制權限是由軟件所控制,由訪問軟件控制數據的訪問,而數據本身則有可能加密也有可能不加密。當另外的軟件訪問數據時,有可能繞過權限控制,例如越權訪問數據,造成對數據的非法訪問和重要信息泄露。本文立足于數據“天生加密,授權使用”的觀念,數據的訪問依據數據的安全屬性和訪問者的身份,通過應用授權、用戶授權,再確定數據授權,依據授權的方式和應用的環境,提供解密密鑰或解密算法,實現數據的安全使用。其研究涉及數據的使用,還有數據的讀寫權限、修改權限、追加權限,數據的獲取,數據權人的確定,以及按照數據權人的身份信息進行數據自動加密和自動注冊等。依照不同的應用類型、不同的應用場景、不同的用戶表現方式,這種數據訪問控制方法及權限管理機制,需要深入開展研究。

(5)數據權限中心的作用和運作機制。數據權限中心負責對數據進行安全保護,并對數據的使用進行授權管理和應用安全管理。因此,數據權限中心要管理數據安全屬性,鑒別數據的合法性,設定數據的訪問權限,認證用戶和應用,對數據進行用戶和應用授權,對授權過程進行記錄和計帳,對數據進行加解密等。數據權限中心要與數據注冊中心配合,有關數據的屬性和權限等數據,需要在數據注冊中心進行注冊和登記;數據權限中心根據注冊的信息,對數據進行監控、授權、回收權利、認證、計帳、加解密和新數據安全屬性注冊等操作。從內部看,數據的使用過程就是數據的授權和不斷擴大授權范圍的過程,計帳就是對這些授權的記錄,可以為后續的商業應用奠定基礎。未來任何一個DOA平臺,在提供數據管理和服務的同時,也具備了數據商業運作的基本能力。

(6)用戶認證機制及證書授權(certificate authority,CA)技術。數據應用授權是建立在用戶認證的基礎上的。用戶認證與用戶的屬性相關,認證過程是用戶注冊和管理維護過程。登記用戶信息是數據注冊中心重要的數據注冊內容,也是數據權限中心需要用到的重要數據。用戶認證技術,可以采用傳統的CA技術,需要有第三方權威中心或局部中心向用戶頒發用戶證書(私鑰)。同時,數據和用戶之間通過數據安全屬性建立關聯關系。

(7)數據授權機制及與公鑰基礎設施(PKI)的關系。向用戶授權使用數據,就需要將經數據權人(數據的主人)公鑰加密的數據轉變成用被授權用戶(數據的朋友)公鑰加密的數據,再提供給被授權用戶下載使用。當遇到體量較大的數據時,為提高加解密效率,用公鑰加密的應該是對數據進行對稱加密的密鑰,而不是數據本身。數據權限中心要提供這種基于PKI的加解密授權機制和方法。

數據權限中心的研究內容包括:數據合法性鑒定,數據使用記錄及溯源,數據計帳,多級授權及認證,單個數據與批量數據或大數據量授權使用,密鑰體系,數據透明加解密策略和算法,加解密效率與安全性及授權過程的妥協關系,傳統數據傳輸加密技術適應性,應用環境安全保障,數據非法使用識別及數字水印技術,數據權人權利和知識產權相關問題等。

面向數據的體系結構還將研究數據異常控制中心(DEC)機制和數據應用單元機制。DEC是DOA的主要部件,對數據資源池進行自適應管理,也是數據生態系統的主要構成,主要用于數據維護,保證數據的唯一性、一致性、數據的自適應管理和異常檢測與處理。研究內容具體包括數據一致性維護機制、數據動態變化自適應管理機制、數據一致性異常探測與處理機制、數據巡檢算法、數據異常與沖突發現算法、數據同步處理算法、數據冗余處理算法、熱數據自動復制技術、冷數據自動刪除技術、系統負載均衡技術等。

數據應用單元(DAUs)是DOA的關鍵部件,關聯應用對數據的訪問,對各種應用提供支持。類似于構件系統,在數據資源池上,以模塊和積木方式提供API,供應用系統直接調用,可以由易到難,由簡到繁地構建生態的應用系統。DAUs以“數據驅動應用”的方式快速滿足用戶的應用功能需求,包括若干數據應用單元“DAU”組件。DFU為數據功能單元,根據不同的數據類型,提供不同的數據功能API;DSU為數據服務單元,以服務和推送提供不同需求的服務支持API;DVU為數據訪問單元,根據權限,提供數據訪問API;DCU為數據組合單元,提供服務聚合、功能和應用組合的API;DUU為數據用戶單元,提供個性化應用和可視化用戶界面API;DPU為數據處理單元,根據各種不同的應用要求,集成一些專門的數據處理功能API。DAUs研究內容具體包括數據應用單元的結構規范、程序調用參數規范、數據訪問規范、應用注冊管理規范、應用擴展機制、授權數據訪問機制、非授權數據訪問識別、數據功能單元、數據服務單元、數據加解密單元、數據授權調用單元、數據應用組合單元、數據可視化單元、數據處理單元等。

5 結論

(1)大數據時代,信息技術領域長期存在信息共享難,功能擴展難,數據管理、分析和挖掘難,及軟件工程開發過程復雜,維護難,生命周期短,信息安全無法保障等問題愈發突出[39],亟待解決。

(2)DOA是數據思維和數據世界觀的產物,在云計算的支撐下,從軟件體系結構上解決問題,突破現有軟件體系結構的局限性,為大數據的研究、發展和應用奠定了重要的基礎。

(3)DOA采用“面向數據和以數據為核心”的思想,通過DRC、DAC、DEC實現數據的統一定義和管理,通過DAUs實現各種應用的管理和服務,建立數據大平臺與碎片化應用的數據生態系統;通過數據“天生加密,授權使用”,建立從數據保護到授權應用的整套機制。

(4)基于DOA的示范項目初步應用表明,面向數據的體系結構能有效解決大數據時代面臨的信息共享、系統功能擴展、數據管理、大數據分析和挖掘支持、軟件工程、信息安全等軟件體系結構方面的問題和挑戰。

[1]Li Guojie.The scientific value of big data research[J].Communications of CCF,2012,8(9):8-15.

[2]Lee J,Lee G G.A data-driven grapheme-to-phoneme conversion method using dynamic contextual converting rules for Korean TTS systems[J].Computer Speech and Language,2009,23(4):423-434.

[3]Eskandarpour M,Dejax P,Miemczyk J,et al.Sustainable supply chain network design:an optimization-oriented review[J].Omega,2015,54:11-32.

[4]Jung S,Lee C,Kim K,et al.Data-driven user simulation for automated evaluation of spoken dialog systems[J].Computer Speech and Language,2009,23(4):479-509.

[5]Ma Yinglong,Zhang Xiaolan,Lu Ke.A graph distance based metric for data oriented workflow retrieval with variable time constraints[J].Expert Systems with Applications,2014,41 (4):1377-1388.

[6]Li Guojie,Cheng Xueqi.Research status and scientific thinking of big data[J].Bulletin of Chinese Academy of Science, 2012,27(6):647-657.

[7]Mayer-Schonberger V,Cukjer K.Arevolution that will transform how we live,work,and think[M].Hangzhou:Zhejiang People?s Publishing House,2013:1-23.

[8]Wu Hequan.Opportunities and challenges of big data era[J]. Weishi,2013(4):47-49.

[9]Zhu Yangyong.Big data data science and industry[R/OL]. Guilin:CCF Young Computer Scientists&Engineers Forum, 2013[2015-08-30].http://www.gliet.edu.cn/ExtGuetWeb/News/ Details?newID=90471.

[10]Zhang Hongli.Big data privacy protection problems[C/OL]// Second CCF Big Data Conference,Beijing,2014[2015-08-30].http://pasa-bigdata.nju.edu.cn/ccf-bigdata2014/.

[11]Hu Chunming,Gao Wen.Big data core technology and the application of BBS[C/OL]//Sixth China Cloud Computing Conference,Beijing,2014[2015-08-30].http://special.csdncms. csdn.net/ciecloud2014/.

[12]Ma Yun.Human being is from IT era to DT era[N/OL].Beijing Daily,2014-03-03[2015-08-30].http://bjrb.bjd.com.cn/ html/2014-03/03/content_156985.htm.

[13]Chen Xiang.The power of open source cloud computing on OpenStack[N].China Computer News,2012-04.

[14]Wang H M.Integration of OpenStack and Hadoop[EB/OL]. [2015-08-30].http://wenku.baidu.com/link?url=oJkSq33ZphugUSLL_EQUnVhOlVn6FFIr5Y0Rp-vhLgAtL-YsHAH-0Jo5B2JhyFyGHy-BmbXn3oBBUWeYoGC4xx_s1WtnA3ap-WkE7LoHEK2ga.

[15]Zhao Yongli,He Ruiying,Yang Hui,et al.Data center application oriented control architecture in multi-domain optical networks[J].Optik,2013,124(20):4260-4265.

[16]García-Valls M,Uriol-Resuela P,Ibá?ez-Vázquez F,et al. Low complexity reconfiguration for real-time data-intensive service-oriented applications[J].Future Generation Computer Systems,2014,37:191-200.

[17]Miao Fang.Data oriented architecture(DOA)[EB/OL].(2014-03)[2015-08-30].http://baike.baidu.com/subview/649092/ 12822804.htm#viewPageContent.

[18]Li Song,Qi Wenhua.Data-oriented architecture for system integration[J].Journal of Computer Applications,2012,32 (S2):85-88.

[19]Joshi R.Data-oriented architecture:a loosely-coupled realtime SOA[R/OL].(2007-08)[2015-08-30].http://rtcgroup. com/whitepapers/files/RTI_DataOrientedArchitecture_White-Paper.pdf.

[20]Joshi R.Data-oriented architecture:loosely coupling systems into“systems of systems”[R/OL].(2008-01)[2015-08-30].http://www.rtcmagazine.com/articles/view/100926.

[21]Liu Runda,Sun Jiulin,Liao Shunbao.Preliminary research on data licensing in scientific data sharing[J].Journal of Intelligence,2010,29(12):15-18.

[22]Li Xiaobo,Zhu Kongqiang,Jia Guangyu,et al.The idea of science data sharing technology platform[J].China Basic Science,2003(1):52-54.

[23]Sun Wei,Luo Zhilan,Zhang Wei.Research on management of science data sharing platform[J].Science of Science and Management,2005,26(12):32-36.

[24]Bryant R E,Katz R H,Lazowska E D.Big data computing: creating revolutionary breakthroughs in commerce,science and society[EB/OL].(2008-12-22)[2015-08-30].http://cra. org/ccc/wp-content/uploads/sites/2/2015/05/Big_Data.pdf.

[25]Ginsberg J,Mohebbi M H,Patel R S,et al.Detecting influenza epidemics using search engine query data[J].Nature, 2009,457(7232):1012-1014.

[26]Dean J,Ghemawat S.MapReduce:simplified data processing on large clusters[J].Communications of the ACM,2008,51 (1):107-113.

[27]Llopis N.Data-oriented design(or why you might be Shooting yourself in the foot with OOP)[EB/OL].(2009-04)[2015-08-30].http://gamesfromwithin.com/data-oriented-design.

[28]Li Qingquan,Li Deren.Big data GIS[J].Geomatics and Information Science of Wuhan University,2014,39(6):641-644.

[29]UN Global Pulse.Big data for development:challenges& opportunities[R/OL].(2012-10-02)[2015-08-30].http://www. unglobalpulse.org/sites/default/files/BigDataforDevelopment-UNGlobalPulseJune2012.pdf.

[30]Hey T,Tansley S,Tolle K.The fourth paradigm:data-intensive scientific discovery[M].[S.l.]:Microsoft Research,2009.

[31]Tu Zipei.All business digitization:specific ideas of traditional business transformation[EB/OL].(2015-02)[2015-08-30].http://tuzipei.baijia.baidu.com/article/47068.

[32]Agrawal D,Bernstein P,Bertino E,et al.Challenges and opportunities with big data—a community white paper developed by leading researchers across the United States[R/OL]. (2012-10-02)[2015-08-30].http://www.cra.org/ccc/files/docs/ init/bigdatawhitepaper.pdf.

[33]Chen Ken,Miao Fang,Yang Wenhui,et al.Design and implementation of emergency management system based on the DOA architecture[J].The Chinese Journal of Geological Hazard and Control,2013,24(3):94-99.

[34]Cheng Fuchao,Miao Fang,Yang Wenhui,et al.Designing and implementation of the distributed computing framework of massive remote sensing image[J].Computing Techniques for Geophysical and Geochemical Exploration,2014 (3):358-361.

[35]Guo Xirong,Miao Fang,Wang Huajun,et al.The research on digital tourism services platform based on G/S model architecture[J].Remote Sensing Technology and Appplication,2009,20(4):490-495.

[36]Guo Xirong,Miao Fang,Wang Huajun,et al.Preliminary on architecture of a spatial information network access model-G/S[J].Computer Applications and Software,2009, 26(10):72-74.

[37]Pete.Developing quality health care software since 1982 [EB/OL].Data-oriented System,Inc.[2015-08-30].http:// dataoriented.com/.

[38]Fan Wei,Chen Zhenyong,Xiong Zhang,et al,The Internet of data:a new idea to extend to the IOT in the digital world [J].Frontiers of Computer Science,2012,6(6):660-667.

[39]Shen Rongjun.Digital earth,making progress through applications[J].Journal of the Academy of Equipment Command&Technology,2009,20(1):1-6.

附中文參考文獻:

[1]李國杰.大數據研究的科學價值[J].中國計算機學會通訊,2012,8(9):8-15.

[6]李國杰,程學旗.大數據研究:未來科技及經濟社會發展的重大戰略領域——大數據的研究現狀與科學思考[J].中國科學院院刊,2012,27(6):647-657.

[7]邁耶-舍恩伯格,庫克耶.大數據時代:生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:浙江人民出版社, 2013:1-23.

[8]鄔賀銓.大數據時代的機遇與挑戰[J].唯實,2013(4):47-49.

[9]朱揚勇.大數據數據科學與數據產業[R/OL].桂林:中國計算機學會青年計算機科技論壇,2013[2015-08-30].http:// www.gliet.edu.cn/ExtGuetWeb/News/Details?newID=90471.

[10]張宏莉.大數據隱私保護問題[C/OL]//第二屆CCF大數據學術會議,北京,2014[2015-08-30].http://pasa-bigdata. nju.edu.cn/ccf-bigdata2014/.

[11]胡春明,高文.大數據核心技術與應用論壇[C/OL]//第六屆中國云計算大會,北京,2014[2015-08-30].http://special.csdncms.csdn.net/ciecloud2014/.

[12]馬云.人類正從IT時代走向DT時代[N/OL].北京日報,2014-03-03[2015-08-30].http://bjrb.bjd.com.cn/html/2014-03/03/content_156985.htm.

[13]陳翔.OpenStack開源云計算的力量[N].中國計算機報, 2012-04.

[17]苗放.面向數據的體系結構[EB/OL].(2014-03)[2015-08-30].http://baike.baidu.com/subview/649092/12822804.htm-#viewPageContent.

[18]李松,齊文華.面向數據的系統集成架構[J].計算機應用, 2012,32(S2):85-88.

[21]劉潤達,孫九林,廖順寶.科學數據共享中數據授權問題初探[J].情報雜志,2010,29(12):15-18.

[22]李曉波,??讖?賈光宇,等.科學數據共享技術平臺構想[J].中國基礎科學,2003(1):52-54.

[23]孫衛,羅之蘭,張蔚.科學數據共享平臺的數據管理研究[J].科學與科學技術管理,2005,26(12):32-36.

[28]李清泉,李德仁.大數據GIS[J].武漢大學學報:信息科學版,2014,39(6):641-644.

[33]陳墾,苗放,楊文暉,等.基于DOA的應急管理指揮系統設計與實現[J].中國地質災害與防治學報,2013,24(3): 94-99.

[34]程付超,苗放,楊文暉,等.適用于海量遙感影像的分布式計算框架設計與實現[J].物探化探計算技術,2014(3): 358-361.

[35]郭曦榕,苗放,王華軍,等.基于G/S模式架構的數字旅游服務平臺研究[J].遙感技術與應用,2009,20(4):490-495.

[36]郭曦榕,苗放,王華軍,等.空間信息G/S網絡訪問模式體系架構初探[J].計算機應用與軟件,2009,26(10):72-74.

[39]沈榮駿.數字地球,在應用中求發展[J].裝備指揮技術學院學報,2009,20(1):1-6.

MIAO Fang was born in 1958.He received the Ph.D.degree in geophysics from Chengdu University of Technology in 1990.Now he is a professor and Ph.D.supervisor at Chengdu University of Technology.His research interests include computer applications,spatial information technology,earth detection and information technology,cloud computing and big data management,etc.

苗放(1958—),男,北京人,1990年于成都理工大學獲得工學博士學位,現為成都理工大學教授、博士生導師,主要研究領域為計算機應用,空間信息技術,地球探測與信息技術,云計算,大數據等。發表學術論文160余篇,主持國家自然科學基金、國家863計劃、973計劃子課題等項目。

Discussion of Data-Oriented SoftwareArchitecture*

MIAO Fang1,2+
1.College of Geophysics,Chengdu University of Technology,Chengdu 610059,China
2.State Key Laboratory of Geohazard Prevention and Geoenvironment Protection,Chengdu 610059,China

E-mail:mf@cdut.edu.cn

The problems existing in the field of information technology for a long time are more and more serious due to the limitation of software architecture.Information between different systems is burdensome to share,and it is difficult to expand the built-up systems.Besides,data in massiveness,heterogeneity,various sources,real-time,dynamic and in explosive growth,are unmanageable,difficult to analyzing and mining.There are several problems in businessoriented software engineering,notably,it is hard to manage the process of developing and maintaining.The software life-cycle is not usually sustained.What is more,the problem of information security and data security is facing a challenge in network-opening environment.And more,the benefits of data owner will not usually be protected.This paper brings up a new architecture called data-oriented software architecture(DOA),which is designed by the ideology of“orienting data”and“data as kernel”.The DOA systems define,manage data and provide services through data register center(DRC),data authority center(DAC)and data exception control center(DEC).In addition,the data application units(DAUs)are designed to realize the management of various kinds of applications.The destination is to set up a data ecosystem for big data platforms and fragmented applications.This paper explores the architecture which consideringthe mechanism of data protection and authorization in the age of big data.

big data;software architecture;data-oriented architecture;data ecosystem;data register center;data authority center

2015-10,Accepted 2016-02.

10.3778/j.issn.1673-9418.1510042

A

TP31;TP39

*The National Natural Science Foundation of China under Grant No.61071121(國家自然科學基金);the Program of State Key Laboratory of Geohazard Prevention and Geoenvironment Protection(地質災害防治與地質環境保護國家重點實驗室項目).

CNKI網絡優先出版:2016-02-03,http://www.cnki.net/kcms/detail/11.5602.TP.20160203.1126.012.html

MIAO Fang.Discussion of data-oriented software architecture.Journal of Frontiers of Computer Science and Technology,2016,10(10):1351-1364.

主站蜘蛛池模板: 久久久久久久蜜桃| 亚洲美女一区| 超碰精品无码一区二区| 五月婷婷欧美| 欧美狠狠干| 亚洲综合色婷婷中文字幕| 久久伊伊香蕉综合精品| 2021精品国产自在现线看| 成人亚洲视频| 在线a视频免费观看| 免费AV在线播放观看18禁强制| 区国产精品搜索视频| 亚洲国产综合自在线另类| 欧美亚洲一区二区三区在线| 国产呦视频免费视频在线观看| 精品国产一二三区| 国产xx在线观看| 精品国产91爱| 中文字幕无码制服中字| 亚洲美女久久| 亚洲精品无码专区在线观看| 91亚洲精品国产自在现线| 蜜桃视频一区二区| 亚洲性网站| av大片在线无码免费| 亚洲无限乱码| 亚洲国产天堂久久综合| 欧美色综合网站| 日韩二区三区无| 97人人模人人爽人人喊小说| 国产丝袜无码一区二区视频| 欧美亚洲一二三区| 婷婷伊人久久| 欧美一区日韩一区中文字幕页| 久久综合色视频| 18禁黄无遮挡网站| 国产真实乱子伦精品视手机观看| 激情爆乳一区二区| 在线免费亚洲无码视频| 国产呦精品一区二区三区下载| 99性视频| 波多野结衣无码视频在线观看| av在线5g无码天天| 无码aaa视频| 人人看人人鲁狠狠高清| 欧美亚洲激情| 玖玖精品视频在线观看| 伊人久久福利中文字幕| 色成人综合| 精品人妻无码中字系列| 精品久久久久无码| 99久久人妻精品免费二区| 被公侵犯人妻少妇一区二区三区| 久久精品66| 国产欧美专区在线观看| 国产美女91视频| 97综合久久| 日本不卡视频在线| 日韩欧美中文在线| 亚洲成网777777国产精品| 成人亚洲国产| 亚洲人视频在线观看| 亚洲第一极品精品无码| 不卡午夜视频| 51国产偷自视频区视频手机观看| 亚洲天堂.com| AV无码国产在线看岛国岛| 欧美午夜网| 亚洲人免费视频| 国产欧美日韩91| 国产大全韩国亚洲一区二区三区| 久久精品中文字幕少妇| 国产国语一级毛片| 成年片色大黄全免费网站久久| 国产亚洲欧美日韩在线观看一区二区| 亚洲国产精品成人久久综合影院| 国产精品美女免费视频大全| 91在线中文| 国产在线观看91精品| 欧美三级不卡在线观看视频| www.youjizz.com久久| 久久综合丝袜长腿丝袜|