□ 陜西省標準化研究院 孫建軍 種芳
基于Web應用的法人庫系統(tǒng)設計
□ 陜西省標準化研究院 孫建軍 種芳
整合和統(tǒng)一不同部門的法人單位基礎信息,實現(xiàn)信息資源共享和法人單位基礎信息的實時更新,對我省其他行業(yè)信息化的發(fā)展起著示范作用,有利于國家的宏觀調控,擴大了政府應用和服務領域。
為加快政府信息化建設步伐,增強政府網(wǎng)絡建設、互聯(lián)互通,增強政府監(jiān)管和服務能力,提高政府行政管理質量和效率,實現(xiàn)行政管理電子化和信息化,國務院信息化領導小組辦公室“十五”期間制定的《我國電子政務一期工程建設方案》,確定了國家近期重點建設的4大基礎性、戰(zhàn)略性資源數(shù)據(jù)庫——“人口基礎信息庫”、“法人單位基礎信息庫”、“自然資源和空間地理基礎信息庫”、“宏觀經(jīng)濟信息數(shù)據(jù)庫”。其中就“法人單位基礎信息庫” (以下簡稱法人庫)建設明確要求:建設以機構代碼為惟一標識的全國法人單位基礎信息庫和查詢服務系統(tǒng),向社會提供服務。
依據(jù)《關于我省電子政務十二個業(yè)務系統(tǒng)和四個基礎數(shù)據(jù)庫建設有關問題的會議紀要》(陜西省政府2005年第35次專項問題會議紀要),啟動人口基礎信息庫、法人單位基礎信息庫、自然資源和空間地理基礎信息庫、宏觀經(jīng)濟數(shù)據(jù)庫建設。陜西省“法人單位基礎信息數(shù)據(jù)庫”建設項目由陜西省質量技術監(jiān)督局牽頭,省工商行政管理局、省國家稅務局、省地方稅務局、省統(tǒng)計局、省民政廳、省機構編制委員會辦公室共同參建。建設以組織機構代碼為惟一標識,采集具有民事行為能力、依法獨立享有民事權利和承擔民事義務的組織及其分支機構的登記注冊、銀行開戶和納稅等行業(yè)信息的政府公共基礎信息數(shù)據(jù)庫。
法人庫即法人基礎信息數(shù)據(jù)庫,是具有信息高速處理、同步交換、適時共享的業(yè)務工作平臺,為各級政府建立“信息共享、業(yè)務聯(lián)動、交叉稽核、統(tǒng)一監(jiān)管”的宏觀管理和服務體系提供技術支撐。
基于web應用的法人庫系統(tǒng)框架如圖1所示,由部門前置機系統(tǒng)、數(shù)據(jù)交換中心和法人基礎數(shù)據(jù)庫構成。部門通過數(shù)據(jù)橋接系統(tǒng)將各部門業(yè)務交換庫的數(shù)據(jù)導入到各部門前置機交換庫中,部門前置機交換庫與數(shù)據(jù)交換中心實現(xiàn)信息共享,在數(shù)據(jù)交換中心實現(xiàn)數(shù)據(jù)一致性比對或按照法人業(yè)務交換流程最終形成法人數(shù)據(jù),導入法人基礎數(shù)據(jù)庫。

1.2.1 web發(fā)布系統(tǒng)
web應用是一系列web頁面和其他資源的集合,web頁面由對象組成,如JPEG圖形文件、GIF圖形文件、聲音文件、Java程序等。web應用一般采用客戶端/服務器端的服務模式,瀏覽器是web應用的用戶代理,用于顯示web頁面,并且提供大量導航功能,客戶按需操作。這保證了web應用的功能完善、快速、高效與可靠的性能,通過對法人庫進行數(shù)據(jù)挖掘與分析的結果,在web中能得到充分的應用展示。
基于以上分析,我們設計了適用于法人庫web應用項目的web發(fā)布系統(tǒng),達到通用、易用、滿足用戶個性化需求、提高系統(tǒng)穩(wěn)定性的目的。本系統(tǒng)采用J2EE+Tomcat+SqlServer實現(xiàn)web應用原型開發(fā),設計基于網(wǎng)絡應用的法人庫系統(tǒng),充分利用Ip技術、Xml語言、SOA集成框架、數(shù)據(jù)挖掘等技術資源,對法人基礎信息數(shù)據(jù)庫開發(fā)基于web應用的業(yè)務功能組件,提高電子政務信息化系統(tǒng)的設計水平。
1.2.2 web發(fā)布系統(tǒng)應用
法人庫包含了描述一個單位的基本特征的信息,最大的特點是以組織機構代碼作為數(shù)據(jù)庫中所有單位的惟一的、始終不變的標識。法人庫信息分為基本元素信息和擴展元素信息兩大類。基本元素信息是指法人庫基礎信息,包括:組織機構代碼、法人名稱、法人狀態(tài)、法人類型、法人住所、法定代表人姓名、成立日期、批準機關、注冊或登記號等9項。法人擴展元素信息是指除法人基本信息外部門間共享需求較為普遍的法人信息,包括:組織機構代碼信息、注冊或登記信息、稅務登記信息、統(tǒng)計信息4大類等34項。法人庫信息具有權威性、準確性、完整性、動態(tài)性及易于應用的特性,同時基于web的法人庫應用有著廣泛的用途:
a)信息資源服務
包括提供法人單位的基礎信息、注冊登記信息和納稅登記信息,也可提供法人單位的類型和行業(yè)信息,還可動態(tài)地了解法人單位的機構變化情況等。當然通過基本信息服務不僅可以清楚地掌握當前法人單位的狀態(tài),也可作為核實信息的依據(jù)。
b)專題服務
政府機構應向社會提供高效、規(guī)范、透明和全方位的服務,全面實現(xiàn)政府職能從管理型向服務型的轉變。政府部門在構造自己應用時可充分運用法人庫豐富的信息資源,針對服務對象不同定制相應的專題服務,全面滿足服務對象個性化的服務需求。
政府根據(jù)政務需求,通過定制法人庫特定信息或經(jīng)加工后法人信息,滿足自身需要或對外開展服務。如國家在減災防災中,需要獲取某行政區(qū)劃內法人單位的類型和分布情況,作為制定應急預案或救災過程的決策依據(jù),以提高事件應急處理的效率和科學性。
c)決策服務
宏觀決策是指通過全面地統(tǒng)計和分析法人庫相關數(shù)據(jù),獲取有關法人(類型、區(qū)域)結構分布、所有制結構、經(jīng)濟行業(yè)特征等諸多與國家宏觀管理與決策相關的重要信息。這些信息從不同方面反映了當前國家的實際情況,是決策部門全面認識和了解全國及區(qū)域性經(jīng)濟社會發(fā)展情況的重要依據(jù),具有重要的價值。
法人庫系統(tǒng)要實現(xiàn)質監(jiān)、編辦、民政、工商、國稅、地稅6部門的法人基礎信息實時的數(shù)據(jù)交換、信息交換與共享平臺,是在不同的系統(tǒng)上部署數(shù)據(jù)交換的設置工具,提供可靠的數(shù)據(jù)交換傳輸服務,支持同步異步的數(shù)據(jù)交換功能以及數(shù)據(jù)交換監(jiān)控的管理機制;數(shù)據(jù)交換采用適配器技術,通過簡單界面配置的方式在信息交換與共享平臺上實現(xiàn)6部門的數(shù)據(jù)交換,改變以編程為主的硬鏈接方式,實現(xiàn)系統(tǒng)間的快速集成。
數(shù)據(jù)橋接系統(tǒng)是數(shù)據(jù)采集與集成的過程。采集數(shù)據(jù)由6大參建部門提供,是法人庫數(shù)據(jù)的源頭,是數(shù)據(jù)交換和比對處理的基礎。數(shù)據(jù)交換系統(tǒng)把部門前置機交換庫連接到業(yè)務交換庫,并支持法人數(shù)據(jù)在部門業(yè)務交換庫和前置交換庫間的雙向交換。

如圖2所示,數(shù)據(jù)橋接系統(tǒng)主要由用戶管理模塊、配置管理模塊、導入導出模塊和日志管理模塊組成。各部門管理員通過用戶管理模塊登陸該系統(tǒng),完成數(shù)據(jù)庫目標配置,并最終將本部門需要提供的法人數(shù)據(jù)提取到本部門的業(yè)務交換庫中。
數(shù)據(jù)交換系統(tǒng)主要完成數(shù)據(jù)傳遞以及在這個過程中產(chǎn)生的線程處理與信息監(jiān)控,主要實現(xiàn)數(shù)據(jù)匯總、比對、業(yè)務流程及入庫并反饋不一致數(shù)據(jù)的功能。數(shù)據(jù)交換平臺包括數(shù)據(jù)交換、適配器運行環(huán)境、適配器開發(fā)工具、適配器連線工具和元數(shù)據(jù)管理5大功能模塊。其中數(shù)據(jù)交換完成數(shù)據(jù)接受與發(fā)送的功能;適配器運行環(huán)境完成適配器監(jiān)聽、事件處理、總線數(shù)據(jù)發(fā)送和數(shù)據(jù)接收功能;監(jiān)控管理中心監(jiān)控與管理中心子系統(tǒng),并對整個交換平臺進行監(jiān)控和管理;適配器開發(fā)工具和適配器連線工具是基于Eclipse插件開發(fā)的支持圖形界面的工具;元數(shù)據(jù)管理是關系型適配器,支持異構庫與異構表之間的數(shù)據(jù)交換,利用Xml文件作為數(shù)據(jù)交換的橋梁,將表示Xml文件格式的Xml Schema文件注冊到LADP中,以便從中獲得異構表字段對應的Xml標簽。
在部門之間數(shù)據(jù)交換的基礎上,數(shù)據(jù)比對系統(tǒng)對來自不同部門的基礎信息進行自動比對和人工比對,根據(jù)比對結果,找出部門之間法人基礎信息數(shù)據(jù)差異和問題。數(shù)據(jù)比對主要包括數(shù)據(jù)預處理、數(shù)據(jù)自動比對和數(shù)據(jù)手工比對3個過程。數(shù)據(jù)預處理對各部門數(shù)據(jù)進行規(guī)則性分析,查找不完整或含有特殊字符等不規(guī)范的數(shù)據(jù)。數(shù)據(jù)比對(包括自動和手工)檢查數(shù)據(jù)的一致性,發(fā)現(xiàn)差異數(shù)據(jù)。對于在數(shù)據(jù)預處理或信息一致性比對過程中出現(xiàn)的問題數(shù)據(jù),應及時反饋給各相應部門,以便部門可做相應的核對或處理,最終保證信息的準確性和完整性。 數(shù)據(jù)比對系統(tǒng)功能設計如下圖所示:

經(jīng)過數(shù)據(jù)橋接、數(shù)據(jù)交換和數(shù)據(jù)比對系統(tǒng)最終形成的原始法人基礎信息庫,成為web應用的基礎,本系統(tǒng)設計的web應用由數(shù)據(jù)挖掘分析系統(tǒng)和web發(fā)布系統(tǒng)共同組成。這也是本系統(tǒng)設計的核心內容,如圖4所示,最終的法人基礎信息數(shù)據(jù)庫通過web應用服務器將業(yè)務功能發(fā)布成web服務。通過資源層統(tǒng)一接口的數(shù)據(jù)庫,應用邏輯層通過Ip技術、Xml語言、SOA集成框架、數(shù)據(jù)挖掘技術資源提供各項業(yè)務服務,最終通過網(wǎng)絡發(fā)布到客戶層。

2.4.1 web應用技術
因法人庫系統(tǒng)除了本身基礎數(shù)據(jù)的建設,也牽涉到不同政府部門(工商、質監(jiān)、編辦、民政、國地稅)的數(shù)據(jù)整合應用,故采用SOA集成架構即面向服務的體系結構。基于SOA思想,任何一個組件或者非組件的業(yè)務功能都可以發(fā)布成web服務,被其他web服務訪問使用,任何一個web服務都可以通過服務中心根據(jù)服務的描述查找其他自己需要的服務。SOA具有隨時可用、粗粒度的服務接口分級、松散耦合、可重用的服務、服務接口設計管理、 標準化的服務接口、支持各種消息模式、精確定義的服務契約的特征,在法人庫系統(tǒng)的建設中使用SOA集成架構可以使業(yè)務系統(tǒng)間的互操作變得更加簡單、標準化,使得應用系統(tǒng)的集成更加容易。
數(shù)據(jù)挖掘系統(tǒng)是基于Business Objects數(shù)據(jù)挖掘分析工具對法人庫信息進行2次開發(fā),實現(xiàn)法人數(shù)據(jù)的統(tǒng)計挖掘分析,為政府宏觀決策提供依據(jù)。對法人數(shù)量、注冊資本、類型、所屬行業(yè)、經(jīng)營范圍、成立日期等信息,通過聚類分析、正態(tài)分布分析、回歸分析、時間序列分析等方法,挖掘法人信息中包含的潛在信息,如法人存在的生命周期長短、區(qū)域內法人數(shù)量的變化趨勢及各種類型法人的發(fā)展狀況等進行預測分析,以圖形報表的方式進行展現(xiàn),并提供打印的功能。
web發(fā)布系統(tǒng)是法人基礎數(shù)據(jù)庫面向用戶的惟一界面,借助本系統(tǒng)向用戶提供各項功能。用戶可以查詢獲得任何需要的法人基礎信息,法人信息核查比對、法人組織結構、法人趨勢變化分析、法人地理區(qū)域統(tǒng)計分析功能,web發(fā)布系統(tǒng)提供法人單位信息的查詢統(tǒng)計功能,并根據(jù)數(shù)據(jù)和業(yè)務類型進行應用分級,通過界面和數(shù)據(jù)服務接口的方式為用戶提供服務。系統(tǒng)提供角色分級功能,滿足政府、企事業(yè)單位和社會公眾對法人信息不同的需求。
2.4.2 web應用模塊建設
根據(jù)圖4可知web應用模塊有基礎信息服務、數(shù)據(jù)分析、應用服務、OLAP在線分析和數(shù)據(jù)挖掘5個模塊;這些服務能為政府決策提供有力輔助,為社會建設發(fā)展提供支持。
基礎信息服務模塊提供法人基礎信息的查詢、工商法人、事業(yè)單位法人、黨政機關法人、社團法人、基金會法人、民辦非企業(yè)法人的查詢、國地稅稅務登記信息,以及法人變更信息、歷史信息、年檢信息、組織機構代碼廢置、非正常戶信息等。
數(shù)據(jù)分析模塊包含法人類型統(tǒng)計、法人經(jīng)濟類型統(tǒng)計、經(jīng)濟行業(yè)統(tǒng)計等法人登記信息的數(shù)據(jù)統(tǒng)計。例如法人類型統(tǒng)計通過法人類型關鍵詞統(tǒng)計分析法人類型的分布情況,從而了解法人類型的分布比例、變化趨勢以及構成情況,提供全國及區(qū)域性經(jīng)濟社會發(fā)展情況的重要依據(jù)。

應用服務模塊包含法人信息核查比對、法人組織結構圖、法人趨勢變化分析等法人登記信息的數(shù)據(jù)結構分析。例如法人組織結構圖通過法人組織機構代碼及主管代碼查詢法人的上級主管部門和下屬部門,生成樹狀法人組織結構圖,直觀展現(xiàn)法人組織機構和隸屬關系,如圖6示。法人趨勢變化分析以行政區(qū)劃為單位,統(tǒng)計某一行政區(qū)劃法人總體數(shù)量、某一類型(以經(jīng)濟行業(yè)、經(jīng)濟類型分類)法人數(shù)量按年度的變化趨勢,為政府宏觀決策提供支持。

OLAP在線分析模塊通過法人注冊資本、類型、所屬行業(yè)、經(jīng)營范圍、地域、規(guī)模等維度對法人信息進行OLAP在線分析,以圖形、報表的方式展現(xiàn),用戶可以方便地得到需要的報表分析數(shù)據(jù)。
數(shù)據(jù)挖掘模塊通過法人數(shù)量、注冊資本、類型、所屬行業(yè)、經(jīng)營范圍、成立日期等信息,通過聚類分析等數(shù)據(jù)分析方法,挖掘法人信息中包含的潛在信息。主要功能包括法人單位數(shù)量變化時間序列分析、法人生命周期預測分析、法人經(jīng)營范圍分類分析,例如根據(jù)法人單位總量的歷史數(shù)據(jù)建立數(shù)學模型(Arima模型、灰色預測模型等),以歷史數(shù)據(jù)為時間序列,分析得到未來幾年時期法人單位數(shù)量的估計值,如圖7所示。

國家信息化領導小組提出,要“以政府信息資源開發(fā)利用為突破口,帶動社會信息資源的開發(fā)利用,遵循‘統(tǒng)籌規(guī)劃、國家主導、統(tǒng)一標準、聯(lián)合建設、互聯(lián)互通、資源共享’的24字方針,積極開展政府數(shù)據(jù)庫建設,建立政府數(shù)據(jù)庫的數(shù)據(jù)資源體系、政府數(shù)據(jù)庫的管理體系、政府數(shù)據(jù)庫的規(guī)范標準體系、政府數(shù)據(jù)庫的共享體系”。
法人基礎數(shù)據(jù)庫是基礎性、戰(zhàn)略性數(shù)據(jù)庫。基于web應用的法人數(shù)據(jù)庫系統(tǒng)項目的建設,采用防破壞、防泄密的安全技術,系統(tǒng)與功能設計具有長遠戰(zhàn)略考慮。法人數(shù)據(jù)庫解決了我省目前存在的信息孤島問題。整合和統(tǒng)一不同部門的法人單位基礎信息,實現(xiàn)信息資源共享和法人單位基礎信息的實時更新,對我省其他行業(yè)信息化的發(fā)展起著示范作用,有利于國家的宏觀調控,擴大了政府應用和服務領域。