馬桂琴++崔虹燕

〔摘 要〕信息資源整合與共享作為數字城市建設的重要內容,可以實現城市數字化資源的合理布局和高效利用。本文以數字城市的資源視角與技術發展之間的關系為出發點,從宏觀的角度提出了數字城市資源整合與共享的服務模型,總結了模型工作流程中主要涉及的關鍵技術,并對這些技術進行了分析和研究。最后對數字城市信息資源整合與共享的發展前景和研究方向做了展望。
〔關鍵詞〕數字城市;資源整合與共享;海量數據;元數據;互操作;交互服務
DOI:10.3969/j.issn.1008-0821.2014.02.013
〔中圖分類號〕TP393 〔文獻標識碼〕A 〔文章編號〕1008-0821(2014)02-0062-04
信息資源整合與共享是在數字城市信息資源極大豐富的背景下,針對“信息孤島”和“資源過載”問題而提出的重要解決方案。它將資源視為一個系統,依據一定的需要和要求,通過各種技術把不同來源和不同通信協議的信息體系有機的融合在一起,使不同類型、不同格式的信息資源實現無縫連接,在實現信息資源結構優化和合理布局的基礎上,通過有效的共享機制,最終形成一個具有集成化服務功能的跨平臺、跨系統、跨數據庫、跨內容的新型信息資源服務體系[3-4]。它是網絡環境下數字城市信息服務向縱深發展的結果,也是當前數字城市集成化信息服務的主流模式,不僅能實現城市信息資源的合理配置、開放共享和充分利用,保證資源效益最大化,也將為城市的整體、可持續發展提供科學決策的依據,也能夠為經濟建設、社會發展和廣大人民群眾生活服務的提高提供有力的保障和支持。
1 數字城市與信息資源
1.1 數字城市的資源視角與技術發展從資源的角度看,數字城市是使城市信息資源成為經濟、社會發展過程中最重要的戰略資源,并逐漸弱化甚至取代物質和能源的過程。雖然信息資源遠不如土地、材料、能源等自然資源易于觀察、測量和使用,但卻可以有效減少工業化城市對物質資源和能源的過度消耗,解決資源匱乏、環境污染等現代城市問題,進而使城市的經濟結構、社會結構和文化結構得到優化與提升[5]。因此,合理開發與高效利用以信息和知識為主導的戰略資源就成了數字城市建設與發展的關鍵問題。由于資源與人類利用資源的能力是同時成長的,傳統技術主要集中于物質與能源的利用,而信息技術則集中于信息資源的開發利用。我們可以清楚地看到,信息技術的快速發展,不僅豐富了信息資源的理論體系、深化了信息資源的內涵,同時在信息技術發展的不同階段,也反映了不同的資源觀念。那么,在數字城市信息資源開發與利用的過程中,將其資源觀念與信息技術緊密結合起來,用信息技術支撐資源的開發與利用,用資源觀念推廣技術應用,最終實現城市信息資源效益的最大化。
2 數字城市信息資源整合與共享的服務模型信息互通與資源共享作為數字城市的靈魂,其目的是在對城市各種信息資源進行有效整合的基礎上,解決數字城市建設中的資源協同共建與社會化共用問題,以創造一個整體互動的信息資源共享環境。由于一個完整的信息服務過程包括信息資源、信息服務方式和用戶3個相關的主體,因此,應在協調處理好這3個相關主體關系的基礎上,以數字城市的資源特征與用戶需求為指導,以數字城市的內容與框架[6]為依據,本文將從宏觀的角度構建數字城市資源整合與共享的服務模型(圖1)。圖1 數字城市信息資源整合與共享的服務模型
從圖1可以看出,整個服務過程是以信息資源為基礎,圍繞用戶的資源需求展開服務的。為了實現資源的整合與共享,首先,資源提供者通過網絡以不同的方式提交各類信息資源;其次,對提交的信息資源進行分析處理,將分散、動態、異構的網絡資源按照一定的標準轉換為有序、準確的結構化資源;第三,提取表達資源屬性特征的元數據,用形式化語言進行描述,并確定資源之間的相互關系,以對資源按照不同的共享需求進行有效的組織和管理;第四,根據用戶的資源需求,從信息資源目錄數據庫獲取所請求資源的元數據,并根據資源的相關信息,通過Web Services對分布式資源進行集成,并構建各種服務應用,從而實現數據級和應用級的信息資源共享與重用。以上流程涉及多方面技術的應用,包括網絡通信、數據處理、信息安全等基礎支撐技術,也包括了數據標準化、數據交換、數據融合、互操作等應用服務技術,這些技術的綜合應用為數字城市信息資源的整合與共享提供了必要的技術支持。
2 資源整合與共享的關鍵技術
2.1 基礎支撐技術
2.1.1 網絡通信技術網絡通信技術使得人與物可以通過網絡進行連接,而有線網絡向無線網絡和移動無線網絡的發展,進一步增強了無時和無處不在的信息通信能力。通信技術的核心對象是消息(Message),消息是信息的容器,可以包括內容和指令。從面向對象的技術角度,消息是發送給對象的,并發出一個活動請求。消息可以由事件觸發,網絡通信技術的發展將促進網絡技術架構向事件或消息驅動模式遷移,為數字城市的數字模型的動態驅動或消息(事件)驅動機制奠定基礎。很明顯,網絡通信技術不僅為數字城市的網絡基礎設施提供了基本的技術支持,同時其支持異構環境、高效的統一消息系統也將成為數字城市的關鍵技術。
2.1.2 信息安全技術信息安全技術就是保護信息網絡的軟硬件設施、信息系統和信息平臺中的信息資源免受各種類型的干擾、威脅、破壞、篡改和泄露的安全保障技術。但隨著互聯網應用的快速發展,信息安全不僅深入到眾多領域,同時其內涵也不斷地延伸,從最初的信息保密性發展到信息的完整性、可用性、可控性和不可否認性,進而又發展為“攻(攻擊)、防(防范)、測(檢測)、控(控制)、管(管理)、評(評估)”等諸多方面。對于數字城市而言,信息作為一種城市資源,不僅具有普遍性、可處理性、多效用性、共享性和增值性等特點,對于數字化時代的城市具有特別重要的意義,而且其安全性也是數字城市實施成敗的關鍵因素之一。因此,為了構建一個完整的、可控的、共建共享的、自主創新的數字城市安全運行應用系統就需要從標準規范、風險評估、設置安全基線、制定方案、實施準備、實施監控、策略調整等全過程進行分析和設計,并恰當而有效的解決信息安全與信息共享的關系問題,以最大程度的滿足信息的公眾化服務需求。endprint
2.2 數據處理技術
2.2.1 海量數據存儲技術海量數據存儲技術是對海量數據進行快速、高效地存取、運算和傳輸的技術,它是實現和支撐數字城市的重要技術基礎。從存儲設備來看,以磁帶、光盤、硬盤3種存儲介質為基礎,磁帶機、光盤庫、磁盤陣列是目前常用的海量存儲設備,而固態存儲和全息存儲則是未來高速海量數據存儲的重要發展趨勢。從數據存儲的模式來看,海量存儲技術可以分為DAS(Direct Attached Storage,直接附加存儲)和網絡存儲兩種,其中網絡存儲又可以分為NAS(Network Attached Storage,網絡附加存儲)和SAN(Storage Area NetWork,存儲區域網絡)。而從數據存儲系統的組成上看,無論是DAS、NAS還是SAN,其存儲系統都是以磁盤陣列為基礎,通過連接和網絡子系統實現一個或多個磁盤陣列與服務器之間的連接,并在系統和應用級上,利用存儲管理軟件實現多個服務器共享、防災等存儲管理任務。具體的技術解決方案包括硬件方案和軟件方案兩種,硬件方案是通過采用高性能的并行計算機,通過多個CPU的并行計算來提高數據處理的速度,而軟件方案則是通過采用基于小波變換的算法,對數據的高效壓縮與解壓來提高數據處理的效能。此外,針對海量數據傳輸問題的解決方案也有兩種,一種是數據組織的解決方案,是通過采用分布式存儲管理,將集中式數據存取轉化為分散式數據存取來提高數據存取的效率,另一種是通訊網絡的解決方案,是采用超高速光纖網,通過大幅度增加通信信道的帶寬來提高數據傳輸的速率。以上各種技術解決方案,僅單一地運用其功能和作用都是很有限的,只有將它們綜合起來運用才能發揮最佳的效果。
2.2.2 元數據及標準化技術元數據(Metadata)是關于數據的數據,通常采用結構化、規范化或標準化的方法對數字化資源進行標識。在數字城市信息資源的組織和控制中,元數據可以被定義為“提供關于信息資源或數據的一種結構化的數據”,它不僅可以為各種形態的數字化信息單元和資源集合提供規范、普遍的描述方法和檢索工具,有效實現信息資源的組織、管理、挖掘和查詢,而且也為分布的、由多種數字化資源有機構成的信息體系提供整合的工具與紐帶。作為信息共享的核心標準之一,建立元數據的主要任務是制定元數據標準、開發元數據的操作工具和建設元數據庫[8]。信息標準化則是指通過應用相應的標準和語義格式將各種結構化、半結構化的數據,甚至是零散的數據內容轉化為標準化和結構化的形式來存儲。而在元數據的基礎上要實現數據的標準化和結構化,其核心就是建立標準化的數據描述符,即使用定義描述語言(DDL)對元數據元素和結構進行定義和描述。XML作為當前互聯網通用的標準化的DDL,既是一種語義、結構化標記語言,又是一種元標記語言。XML主要包括3個元素:DTD、XSL和XLL。DTD(Document Type Definition)描述了包含在任何XML詞匯中的部件和準則,定義了組成詞匯的元素、標記、屬性,提供了用DTD寫成的文檔中的實體清單以及相互關系。XSL(eXtensible Style Language)用戶將XML數據翻譯為HTML或其他格式的語言,主要負責解決XML的格式化和可視化問題。XLL(eXtensible Linking Language)提供了不受文檔制約,完全按照用戶要求來指定和管理的XML文檔之間的鏈接。由此可見,XML通過采用統一的、開放的、簡單而靈活的標準格式,為Web應用提供了一種描述和交換數據的有效手段。很明顯,數字城市中的信息要滿足共享和互操作的要求,必須具有統一性的數據。在數字城市信息資源整合與共享的平臺環境下,元數據是數據的生產者、管理者和使用者溝通的橋梁,而將XML應用于數字城市信息標準化的實現,不僅能改善和提高信息資源的控制效率,也將有效解決資源整合與共享層次上的跨平臺語法互操作問題。
2.2.3 數據倉庫數據倉庫是一種新型的數據庫應用技術,是在數據庫已經大量存在的情況下,為了進一步挖掘數據資源和決策的需要而產生的,它不是所謂的“大型數據庫”,而是研究和解決從數據庫中獲取信息的問題,更側重于數據的分析和決策支持。由于數據倉庫通常是一個面向主題的、集成的、隨時間變化的、但信息本身相對又穩定性的數據集合,主要用于對管理決策過程的支持,因此數據倉庫的主要任務和工作流程可簡單描述為:首先,將空間上分散的來自于不同操作型數據庫中的內容不同、類型不同、結構不同、格式不同的原始數據抽取出來,進行標準化、過濾與匹配、凈化等加工處理;然后,根據不同的主題,再對這些數據進行集成與分割、概括與聚集、預測與推導、翻譯與格式化等組織化處理;最后進行數據倉庫的建模、數據的概括、數據的聚集、數據的調整與確認、建立結構化查詢和創建詞匯表,形成高質量的、且相對穩定的決策分析數據[8]。很明顯,數據倉庫技術就是從不同數據源集成數據,并進行整理、加工和綜合,最后利用各種數據分析技術挖掘數據當中的規律,為決策者提供幫助的過程。它不僅是數字城市整合信息資源的重要載體,也是數字城市實現信息共享的基礎平臺,對于數字城市的建設具有十分重要的支撐作用。
2.2.4 Web數據挖掘Web數據挖掘是數據挖掘技術在Web環境下的應用,是一個從大量的Web文檔集和活動中提取隱含在其中的、未知的、但又是潛在有用的信息和模式,歸納推理,預測用戶行為,幫助決策者做出正確決策的過程。該技術不僅能夠實現從網絡文檔和服務中發現和提取信息,也可以實現對Web存取模式、Web結構和規則、以及動態Web內容的查找,因此在確定權威頁面、文檔分類、日志挖掘、智能查詢、建立Web元數據庫等方面有著重要的作用。在數字城市信息資源管理的實際應用中,Web數據挖掘具有處理的數據規模龐大、不能形成精確的查詢要求和需要隨時對規則進行更新等特點,其處理流程為:①確定任務:清晰的定義出任務問題,確定數據挖掘的目標;②獲取數據源:根據任務需求,從Web資源中提取相關數據,形成目標數據集;③信息選擇與預處理:檢查目標數據集中數據的完整性和一致性,去噪聲、填補丟失的域、刪除冗余數據、精選有效數據,并將數據轉換成分析和挖掘的有效形式,以發現有用的參數或模型;④模式發現:根據任務要求,對預處理后的數據進行自動挖掘和模式發現,找到普遍模式和規則,并用一定的方法將其表述成用戶易于理解的形式;⑤模式分析:解釋和評估發現的模式,有需要時可返回以上某些步驟反復提取;⑥知識表達與應用:將發現的、經過分析得到的知識以一定的方式集成到業務應用系統的組織結構中去。endprint
2.3 共享與集成服務技術
2.3.1 信息資源目錄信息資源目錄是支撐數字城市集成化信息服務構建的技術基礎,它以元數據為核心,以各種業務的分類表和主題詞表為控制詞表,按照統一的標準規范,對分散的各級各類信息資源進行整合和網狀組織,形成邏輯上集中,物理上分散,可以統一管理和服務的數據資源共享目錄體系[8-9]。針對不同領域的城市信息資源,目錄服務可分別采用適用于通用政務信息資源的計算機領域的LDAP(Lightweight D-irectory Access Protocol,輕量目錄訪問協議)目錄服務,或者針對空間信息資源的空間信息領域的OpenGIS的Catalog Service協議的目錄服務[10]。前者支持共享信息資源目錄內容的編目、注冊、發布、查詢和維護;后者則在目錄中存儲空間信息資源的元數據信息,并通過Catalog Service實現異構空間信息資源的目錄發布,以及幫助用戶和應用程序便捷、準確地找到所需要的空間數據。很明顯,信息資源目錄作為一種信息組織方式,更作為一種從分類、主題、應用等多個角度對城市信息資源進行管理、識別、定位、發現、評估與選擇的工具,將很好地解決資源提供者和使用者之間的信息互通與共享問題。
2.3.2 互操作技術雖然元數據及標準化技術可以滿足同一領域數據描述的需要,但在不同領域,卻存在元數據格式種類繁多,相互之間缺乏有效的互操作機制的問題。所謂互操作是指一種能力,可以使分布式異構環境下的多個實體通過相關信息的數字化交換,能夠協調工作,從而完成一個具有共同目標的特定任務。因此,作為信息共享和系統集成的基礎,互操作為了達到“平臺和編程語言之間交換和共享數據”的目的,就需要對運行環境、應用程序和處理對象等實體按照不同的層次實現互操作,具體包括:①硬件、網絡和操作系統層次的底層互操作,主要解決各通訊協議之間的接口問題;②數據、信息、系統層次的互操作,主要通過建立數據結構、格式、語法、語義等標準規范和服務過程、組合、發現等體系規范,來解決異構數據之間的轉換問題;③應用軟件層次的互操作,主要解決在網絡環境下各種平臺軟件和應用軟件的操控、協調處理數據和信息交互的問題。實現的主要技術有動態數據庫訪問技術、Web Service技術、通用服務中間件技術、資源元數據獲取與選擇技術、開放資源互操作協議OAI、分布目錄信息存取協議LDAP、分布式系統簡單對象訪問協議SOAP,以及實現異構資源互操作的Z39.50協議和建立開放信息資源及動態服務鏈接的OpenURL協議等[11-12]。這些技術和協議的綜合應用,是“數字城市”實現信息共享和系統集成的重要技術途徑,不僅能建立異構信息系統之間的互操作、而且能實現數字城市跨系統的資源多方位鏈接和整合。
2.3.3 基于Web的交互服務交互服務在數字城市信息資源整合的基礎上,可以將其理解為以用戶為中心的信息互動服務模式。交互服務的實現可以通過社會計算、P2P、開源軟件等方法。社會計算(Social Computing)是社會行為與計算系統相結合的產物,通過計算系統支持各種社會行為,基于軟件與技術構建或重建社會規約與社會環境。主要應用包括Blog(博客)、Wiki(維基)、RSS(簡單信息聚合)、SNS(社交網絡服務)、Tag(社會書簽)、AJAX等。其中,Bolg提供了與用戶個人交互的基本手段;Wiki和Tag不僅能聚合集體智慧,而且還能通過建立信息共享平臺來方便、快捷的實現群間交互;RSS作為一種重要的“推送”技術,可以解決信息交互中的延時問題,并能實現信息資源的聚合與主動推送;Ajax則作為幾種廣泛使用技術(HTML、JavaScript、DHTML和DOM)的強強結合,采用異步通信模式來優化用戶體驗。P2P即對等網或點對點技術,該技術架構形成了一個全球標準的協議,在即時通信、文件共享、協同工作、對等計算等多種網絡服務中被應用,它不僅使互聯網中的“內容”從“中心”走向“邊緣”,也改變了控制互聯網的C/S模式,使實現實時交互的主要技術。開源軟件則提供了開放代碼和開放內容,對信息資源的整合和服務集成具有重要作用。以上這些技術都具有分布式架構、平臺獨立性等特點,不僅能方便地建立與用戶的交流與互動,也為構建和優化數字城市集成化信息服務提供了技術支撐。
3 結束語從理論研究和技術實現的角度來看,數字城市信息資源整合與共享服務是一項多學科交叉的系統工程,需要綜合運用數字通信、網絡技術、多媒體技術、安全技術、數據采集、數據挖掘、數據融合、人工智能、決策支持、開放與互操作技術,服務平臺與應用服務集技術等理論與技術。作為一個由眾多技術與應用系統構建起來的虛擬城市系統,數字城市資源管理過程中仍有許多關鍵問題需要做深入細致的研究,尤其是網格、本體、SOA與ESB、物聯網、云計算等新技術的應用研究,如如何利用語義網格解決數字城市資源共享、協同工作和異構系統的互操作問題,如何利用本體技術在高效表達領域知識、提高模型表達能力的基礎上優化信息集成的質量,如何綜合利用SOA和ESB有效解決異構應用集成問題,如何通過物聯網實現城市信息多源實時獲取和智能化信息互動,如何利用云計算技術解決多源海量數據存儲、管理、分析處理、共享、整合和應用問題等。很明顯,這些技術對于數字城市資源整合與共享服務的實現,以及數字城市向智慧城市的發展均具有重要的作用,只有很好地解決這些問題,并對這些關鍵技術進行集成和有效應用,才能在最大程度地開發與整合資源的基礎上,最終實現城市數字化資源的合理布局、高效利用與優化共享。
參考文獻
[1]錢健,譚偉賢.數字城市建設[M].北京:科學出版社,2007.
[2]李江.構建數字城市共享平臺的三個要素[N].中國計算機報,2007-09-03,(B18).
[3]黃月勝,劉喬.高校數字化教育資源整合現狀及對策研究[J].現代情報,2011,31(9):67-70.
[4]王長全,艾.云計算環境下的數字圖書館信息資源整合與服務模式創新[J].圖書館工作與研究,2011,(1):48-51.
[5]廣州市信息化辦公室,廣東省社會科學院產業經濟研究所聯合課題組.城市信息化發展戰略思考——廣州市國民經濟和社會信息化十一五規劃戰略研究[M].廣州:廣東經濟出版社,2006.
[6]陳柳欽.“數字城市”內涵與框架的研究綜述[J].中國市場,2010,(42):52-62.
[7]丁火平,陳建平,余劍平.基于SOA架構的數字城市信息共享方法研究[J].計算機工程與設計,2009,30(20):4632-4635.
[8]王建虎,吳昊.數字城市關鍵技術研究[J].科技資訊,2012,(17):10-11.
[9]劉純波.數字城市空間信息資源管理與集成調度技術研究[D].北京:北京大學,2003.
[10]廖通逵,李琦,張燕,等.基于ESB的數字城市信息資源共享服務平臺研究與實現[J].GIS技術,2010,(6):106-109.
[11]尹芳.基于SOA的應急數據交換平臺研究與實現[D].天津:天津大學,2008.
[12]張遂征,王艷輝等.交通信息集成與綜合服務關鍵技術研究與應用[J].交通信息與安全,2013,(1):5-11.
[13]熊盛武,方志祥,徐虹.數字城市中的分布式技術體系及實施策略[J].測繪通報,2002,(8):19-21.
[14]李社,宋富林,盧中正.基于數字城市的關鍵技術應用研究[J].地理空間信息,2008,6(2):64-67.
[15]王璐,吳華意,宋紅.數字城市與生態城市的技術結合模式初探[J].湖北大學學報:自然科學版,2003,25(2):177-181.
(本文責任編輯:馬 卓)endprint