摘 要:結合我國稅收管理在納稅評估方面的應用需求,圍繞電子商務環境下企業納稅信息的收集、整理與分析問題,重點研究建立在Web service技術基礎上基于電子商務的納稅評估服務系統的體系結構及邏輯流程,提出按行業、分稅種、分規模級次的納稅評估預測數學建模方法,設計了基于XML和本體論的用于納稅評估服務系統網上信息交互與集成的信息描述語言。
關鍵詞:納稅評估;電子商務;納稅預測模型;本體論;信息描述語言
中圖分類號:TP393 文獻標志碼:A
文章編號:1001-3695(2008)09-2723-04
Research of taxpaying evaluating serving system based on electronic commerce
ZHOU Xiaoming1,2,ZHU Yunlong1,WU Wenbin1
(1.Advanced Manufacturing Technology Laboratory, Shenyang Institute of Automation, Chinese Academy of Sciences, Shenyang 110016, China;2.Graduate School, Chinese Academy of Sciences, Beijing 100039, China)
Abstract:This paper integrated revenue management of our country with applied requests for taxpaying evaluation. To resolve these problems of enterprises’ information collection, arrangement, and analysis,proposed the system architecture and logical process of the taxpaying evaluating serving system based on electronic commerce (EC), which was founded on Web service.Then, this paper presented a forecasting mathematical model for the taxpaying evaluation by industry, tax category, and enterprise scope. Finally,designed an information description language (IDL) based on XML and ontology for information exchange and integration on taxpaying evaluating serving system.
Key words:taxpaying evaluation; electronic commerce; taxpaying forecasting model; ontology; information description language
0 引言
納稅評估是稅務機關根據納稅人的申報材料、財務資料以及所掌握的各種征管資料進行綜合的分析、審核、評價、判定,結果是盡可能及時地發現有問題的企業。其處于稅務申報和稅務稽查的中間環節,起到過濾的作用。做好納稅評估工作不僅有利于切實提高納稅人的依法納稅意識、降低征納成本;同時還有利于轉變稅務機關的工作職能由監督打擊型向管理服務型轉變。其最終的意義在于不斷地貫徹、實施、深化和完善新的稅務征管法,使其與國際稅收的慣例接軌,最終達到稅務審計的目的。但遺憾的是,目前的納稅評估系統由于納稅人提供的納稅申報信息有時不及時、不完整、不準確、不連續;稅務機關各部門信息無法共享,工作上各行其是;各個監督部門之間沒有聯網,信息采集渠道不暢等問題的存在,嚴重影響了納稅評估工作的質量和效率,難以保證納稅評估預測的準確性,無法提升納稅評估服務水平及保證納稅人的滿意度。隨著網絡和Internet的廣泛應用,尤其是在此基礎上迅速發展的電子商務技術,為解決納稅評估工作中的問題提供了有益的思考。目前,國內外學者對該問題已經作出了一些初步的有益的探索。歐美國家近幾年陸續提出了快速發展公共部門的電子服務接入的規劃。通過電子接口實現電子報稅,納稅人可以通過互聯網實現納稅申報、稅款計算、繳納、稅款查詢、年終結算及退稅等功能。英國稅務總局還開發研制了一種更加親近化的電子接觸方式,納稅人可以由此直接與稅務局的工作人員進行商談。在稅務總局下屬的諸多聯絡中心中,工作人員可以通過屏幕與顧客進行交流。但這些成果只是從實現電子完稅的角度考慮,并未從整體上把握納稅評估的實質并真正實現納稅評估的電子化和網絡化,使之隨著應用的深入逐步向智能分析和公共服務方向發展。本文的研究正是基于解決以上種種問題的考慮,從系統工程的角度出發,結合我國稅收管理在納稅評估方面的應用需求,重點研究基于電子商務納稅評估服務系統的體系結構及邏輯流程,提出按行業、分稅種、分規模級次的納稅評估預測數學建模方法,設計了基于XML和本體論的用于納稅評估服務系統網上信息交互與集成的知識描述語言(IDL)。為基于電子商務的納稅評估服務系統的真正實現奠定了理論和技術的基礎。
1 納稅評估服務系統的體系結構
基于電子商務的納稅評估服務系統的技術基礎是Web service技術。Web service是面向服務的體系結構,由于其具有完好封裝性、松散耦合、協議規范、高度集成、開放性等優點,已經成為新一代電子商務平臺廣泛采用的技術[1]。鑒于Web service的技術特性,本文根據納稅評估的業務邏輯,提出了一種新的分布式的體系結構,即建立在Web service技術基礎上的基于電子商務的納稅評估服務系統的體系結構,如圖1所示。
納稅評估服務系統的體系結構在邏輯上由五部分組成:表示層、Web服務器、應用服務器、數據集成器和數據層。Web瀏覽器與Web服務器之間通過信息描述語言(information description language,IDL)來交換信息,Web服務器與應用服務器之間通過SOAP(simple object access protocol)來訪問應用程序,應用服務器與數據集成器之間也是通過SOAP交換數據。
1)表示層(presentation layer) 其主要任務是將數據組裝成可表示的格式,并提供訪問,主要由Web瀏覽器組成。Web瀏覽器是跨平臺的,以電子商務的形式為納稅戶和稅務機關工作人員提供了界面友好、風格統一、易于使用的通用平臺。通過稅務局內部的局域網,稅務機關工作人員可以按照納稅評估的業務邏輯進行各部門的協同工作;通過Internet,納稅戶可以進行網絡異地電子納稅申報、提交相應報表、查詢本企業納稅情況、與稅務機關進行實時的交流和溝通。
2)Web服務器(Web server) 用來管理和放置電子商務網站及服務器端組件,接收客戶端的請求,進而與應用服務器和數據集成器交互,最后將結果返回給Web瀏覽器。目前流行的Web服務器軟件有UNIX/Linux平臺的Apache和Windows平臺的IIS等,主要采用基于Java的Servlet和基于.NET的ASP.NET技術等實現。
3)應用服務器(application server) 主要實現企業以電子商務的形式體現納稅評估的業務邏輯。應用服務器可分為內聯Web服務和外聯Web服務。內聯Web服務實現稅務機關內部納稅評估的主要邏輯功能,它不對外發布。同時,內聯Web服務器還可以按不同的地點、部門、用戶賦予不同的角色、設置相應的權限。外聯Web服務負責與各納稅企業的信息交互和金稅網絡互聯互通,是納稅評估服務系統對外的邏輯接口。本質上,應用服務器為實現納稅評估的業務邏輯,可以向外無限擴展。由于Web服務基于SOAP(基于HTTP傳輸IDL數據),系統具有良好的跨平臺性、伸縮性,可以靈活修改納稅評估的業務邏輯,適合動態變化納稅評估工作的要求。
4)數據集成器(data integration layer) 基于電子商務納稅評估系統應用中涉及的數據往往存在于異構數據源中。如何將來自異構數據源的數據轉換為格式統一的數據格式是系統運作的基礎。數據集成器負責對異構數據進行提取、轉換和集成,為建立稅務部門數據倉庫打下基礎;同時,數據集成器還隱藏數據層的異構性,對應用服務器或Web服務器提供一致的數據格式——IDL。數據集成器將稅務機關數據屏蔽起來,使外界只能間接訪問數據,增強了數據的安全性。
5)數據層(data layer) 以稅務局數據庫為主,輔以企業財務數據庫、綜合治稅數據庫等其他異構的數據資源作為補充。數據層保證數據的安全性、完整性和一致性,同時也提供OLTP等功能。
2 基于電子商務的納稅評估服務系統的邏輯流程
基于電子商務的納稅評估服務系統的邏輯流程如圖2所示。在納稅評估服務系統中,應用服務器所存儲的邏輯業務流程分別由對象選擇、納稅預測、評估分析、詢問核實、評定處理和納稅信譽度等級評定六部分組成[2]。通過對納稅預測模型的比較和一致性分析,得到納稅預測的結果。在評估分析環節,通過對預測的結果與納稅申報的數據進行單指標分析和指標配比分析,確定有疑點的企業,經過詢問核實環節,得到評定處理的結果,反饋給納稅信譽度等級的評定。
3 納稅預測模型
納稅預測模型在整個納稅評估邏輯業務流程中占有非常重要的地位。其預測的準確性,將直接影響納稅評估整體工作的績效。本文所采用的納稅預測模型具體實現是以基于計量經濟模型的多元線性回歸數學模型為主,輔以基于計算智能的案例推理作為補充;充分利用數學建模預測準確的特點,在信息不完備的情況下輔以案例推理作為補充。兩者相結合,不但可以進行事前的納稅評估,還可以進行事后的納稅評估,大大提高了納稅評估的準確性和效率。同時納稅預測模型不但提供了自適應參數調整的功能,還提供了人機交互的接口,可供人工進行干預。
3.1 多元線性回歸數學模型
本文以主元素逐次優化的方法建立多元線性回歸數學模型??紤]到納稅長期預測和短期預測的目的和表達的內容有所區別,在建立數學模型時分別建立。建立長期預測如年度預測的模型有利于體現企業納稅的稅制結構和進行趨勢預測的分析;通過建立用于長期預測的多元線性回歸方程,既可以通過設置通用評估指標從總體上把握企業應繳的稅款,又可以通過設置可選納稅評估指標按行業、分稅種地進行評估預測。建立短期預測如季度預測或月份預測的模型,通過建立自相關的線性方程,使得預測的結果更加準確。
長期納稅預測通用數學模型如下:
以某企業所得稅的納稅預測數學模型為例,其長期納稅預測通用數學模型為
多元線性回歸數學模型以N(N>3i(i為解釋變量的數量))組觀測值為樣本,采用數理統計和最大似然的求解方法,以方差最小為原則,根據最小二乘法的原理,得到待估參數的估計值和方差的無偏估計。為使納稅預測數學模型趨近最優,采用統計檢驗的方法,分別從擬合優度檢驗、方程的顯著性檢驗(F檢驗)、變量的顯著性檢驗(t檢驗)和參數的置信區間四個方面,來優化納稅預測數學模型。
3.2 基于案例推理的納稅預測模型
案例推理是一種基于經驗知識進行推理的人工智能技術,它是用案例來表達知識并將問題求解與學習相融合的一種推理方法[3]。它強調人在解決新問題時,常常回憶起過去積累下來的類似情況的處理經驗,并通過適當修改過去類似情況處理的方法來解決新問題,使得它比傳統的專家系統更像專家系統一樣運行。它在知識獲取、求解效率、求解質量以及知識積累等方面,有著突出的優勢。在基于案例推理的納稅預測模型中的核心算法是案例匹配的算法。該算法如下式所示:
通過案例匹配的算法,可以快速實現輸入案例與案例庫中案例進行檢索和匹配,通過案例庫識別納稅企業的不同狀況,如行業特點、企業規模等,快速檢索出在該種情況下,企業應該繳納的相應檔次上的稅額。
4 基于XML和本體論的信息描述語言
著重描述數據內容和結構的元語言XML[4],憑借其強大的定義和表示標記語言能力,正成為互聯網信息表示與交換的標準格式。采用XML作為表示語法,W3C開發了在Web上進行元數據處理和交換的標準RDF(S)[5]。RDF(S)的出現使得本體建模技術可以應用于納稅評估內容定義和信息交換,使得開發自動化、智能化和可異地網絡化管理的基于電子商務的納稅評估系統成為可能。盡管RDF(S)定義了一系列標準的語法來定義數據結構和語義,但它沒有提供任何描述納稅評估業務流程和信息交互的數據結構與術語。鑒于上述問題,筆者定義了面向電子商務的信息描述語言。該語言吸收了RDF(S)和本體建模技術的有效思想,為納稅評估內容定義和信息交換提供了一種簡單、高效的方法。
4.1 本體建模技術
為了增加對Web服務的語義描述信息,引入哲學中本體的概念,即本體是客觀存在的一個系統的解釋說明,是客觀現實的一個抽象本質。將哲學中的本體概念借鑒到計算機和人工智能研究領域中,使得本體論成為共享的概念化信息的一種明確的形式化規范。Nicola Guarino將概念化信息定義為C=〈D,W,R〉。其中:D是一個領域;W是該領域中相關的事務狀態的集合;R是領域空間〈D,W〉上概念關系的集合[6]。
從上述定義來看,一個領域中的術語、術語的定義以及各個術語之間的語義網絡是領域本體建模中必須包含的基本信息。IDL采用本體論方法對納稅評估業務流程和交互數據建模。采用屬性—值機制描述每一個概念的重要屬性,應用邏輯語句描述概念間的關系,并按組或類別來組織和管理建模數據。設計IDL時,筆者充分借鑒了描述邏輯(description logics,DL)和框架系統(framebased systems,FS)的研究成果。其中,繼承了FS的建模原語,采用類和屬性的概念對納稅評估信息進行描述,約定屬性是類的一部分,實體間的關系既可定義成類屬性,也可作為具有自身領域和約束的獨立實體來描述。
4.2 IDL的三層框架結構
IDL的三層框架結構(圖3)的功能如下:
a)核心IDL層。覆蓋最基本的納稅評估建模原語,為應用開發人員提供簡潔、高效的語法符號,以及準確的語義描述和推理機制。它大量采用了RDF(S)的語法符號,可以將其看做是RDF(S)標準的擴展。核心IDL能滿足移動設備描述納稅評估知識的需要。
b)擴展IDL層。在核心IDL層的基礎上,添加更多的原語以支持更加強大的建模功能;同時利用新增的原語優化IDL語法符號,在不削弱可讀性的條件下,盡量使其語法形式短小,為開發人員面向特定領域和平臺的納稅評估知識描述提供建模支持。
c)復雜IDL層。在擴展IDL基礎上,添加更多的原語來描述納稅評估中agent的交互信息。同時提供接口,以便與其他Web語言(如DAML+OIL[7]、OWL等)[8]集成。
在IDL分層框架中,每一子層都增強了IDL的功能和復雜性。其中低層子語言為上層提供支撐服務(如申明語法符號、建模原語和語義等),上層子語言調用低層提供的功能以實現新的服務。分層框架結構使IDL具有良好的擴展能力,能適應不同平臺的要求。
4.3 IDL的語法
IDL將電子商務環境中的納稅評估信息視做一系列對象,并應用本體論方法捕捉這些對象所包含的核心概念和術語,進而建立基于電子商務納稅評估領域本體模型。因此,在IDL中,類、槽、槽約束是IDL的核心概念,它們的文法形式如下:
〈類定義〉::=〈類類型,類名,[類屬性]〉
〈類類型〉::=〈基本類型〉|〈自定義類型〉
〈類屬性〉::=〈[注釋],[文檔],{[父類列表]},{[槽定義列表]},{[槽約束列表]},{[類表式]}〉
〈槽定義〉::=〈槽類型,槽名,[槽屬性]〉
〈槽類型〉::=〈對象槽〉|〈數據槽〉
〈槽屬性〉::=〈[注釋],{[父槽列表]},{[值域列表]},{[范圍列表]},{[逆槽]}〉
〈槽約束列表〉 ::=〈槽約束名,{[必要條件]},{[充分條件]},{[最大基數]},{[最小基數]}〉
IDL充分借鑒了XML的語法,并從類擴展定義、槽定義兩個方面對RDFS建模原語進行了擴展。類之間的約束關系通過槽約束表示,槽的定義通過RDFS的屬性擴展定義實現。IDL通過RDF數據模型擴展定義類,類定義將類同名字、文檔、類型、類的超類、為該類定義的屬性聯系在一起。
圖4表示了IDL對RDFS擴展的包容結構關系。在IDL中,類可理解成是某個類表達式的子類,類表達式是類的一個布爾表達式。IDL提供了三種布爾運算符的類,即AND、OR、NOT,均被定義為類idl:ClassExpression的子類。運算符AND、OR和NOT通過利用idl:hasOperand屬性同運算符的操作數連接起來。Idl:hasOperand屬性只用于具體類表達式陳述中。
為了表示槽約束關系,IDL引入了idl:SlotConstraint 屬性作為保留類,面向槽約束的某些特定類,如hasvalue、valuetype、cardinality、sufficient、necessary等都是idl:SlotConstraint子類。IDL和RDFS都允許槽作為本體的首類成員,故IDL定義的槽可以很好地映射到RDFS的屬性定義。
例1應用IDL描述的某企業納稅申報單如下:
〈dkl:DefinedClass rdf:ID=\"Tax Return\"〉
〈rdfs:subClassOf rdf:resource=\"Item\"〉
〈rdfs:subClassOf〉
〈idl:estriction〉
〈idl:onSlot rdf:resource=\"hasStyle\"〉
〈idl:sufficient〉
〈rdf:resource=\"Tax Category\"/〉
〈/idl:sufficient〉
〈/idl:sufficient〉
〈/idl:Restriction〉
〈/rdfs:subClassOf〉
〈/idl:DefinedClass〉
〈rdf:ID=\"*Enterprise Tax Return\"〉
〈hasStyle rdf:resource=\"Sales Tax\"/〉
〈/\"Tax Return\"〉
將本體的概念和相應技術引入Web services技術中,從根本上解決信息格式的異構性、信息語義的多重性以及信息關系的匱乏和非統一性。同時,由于本體具有豐富的語義和廣泛的關系,它將變革現有的Web services,使之成為intelligent Web services,使Web實現從自動化到智能化的轉變成為可能。
5 實例驗證
將該納稅評估服務系統應用到某市地稅局稅務稽查部門模擬運行,本文以減少數據量和重點突破為原則,將應用對象設定在該市重點稅源的納稅評估上。在該市重點稅源如圖5所示的情況下,以“七率”重點稅源稅收征管績效考核為比對指標。從應用納稅評估服務系統后“七率”如表1顯示的結果中可以看出,各項指標較未采用該系統之前有了很大提高,據統計其申報率平均提高了10.3%,查補稅款入庫率增加了7.8%,欠稅增減率降低了8.1%,工作正確率提高了15.5%。經模擬運行驗證,該納稅評估系統是可行的,運行結果是真實有效的。
6 結束語
本文對基于電子商務的納稅評估服務系統的體系結構、邏輯業務流程、納稅預測模型以及基于XML和本體論的IDL語言進行了有益的探索。深刻體會到了信息收集是納稅評估工作的基礎,建立功能完備的稅務數據倉庫是稅務機關今后必須完成的任務,建立準確的納稅預測模型是納稅評估的核心,科學的研究方法才能得到真實有效的評估結論,信息化是納稅評估工作的必由之路。當然,在研究基于電子商務納稅評估服務系統的過程中所提出的納稅預測模型尚未經超大量稅務數據的實際測試,其科學性、準確性和有效性還有待于在后續工作中加以總結、完善和提高。同時,基于本體的Web service的組裝與分解、服務管理等問題,也將是以后工作研究的方向。
參考文獻:
[1]張大強,殷世民,程家興,等.基于Web service的電子商務體系結構[J].計算機技術與發展,2006,16(7):23-24.
[2]鄭堅.納稅評估理論與實踐[M]. 北京:中國稅務出版社,2006.
[3]BARLETTA B.An introduction to casebased reasoning[J].AI Expert,1991,8(1):43-49.
[4]PATELSCHNEIDER P F,SIMEON A.The Yin/Yang Web: a unified model for XML syntax and RDF semantics[J].IEEE Trans on Knowledge and Data Engineering,2003,15(4):797-812.
[5]IMAI A,YUKITA S.RDF model and relational metadata[C]//Proc of AINA.Xi’an:[s.n.],2003:524-537.
[6]GUARINO N.Formal ontology and information system[C]// GUARINO N.Proc of Formal Ontology in Information Systems.Trento:[s.n.],1998:315.
[7]HORROCKS I,PATELSCHNEIDER P F,HARMELEN F.Reviewing the design of DAML+OIL:an ontology language for the semantic Web[C]//Proc of the 18th National Conf on Artificial Intelligence, AAAI2002.Edmonton,Alberta:AAAI Press,2002.
[8]HARMELEN F,HENDLER J,HORROCKS I,et al.OWL Web ontology language reference. World Wide Web Consorium[EB/OL].[2004-0210].http://www.w3.org/tr/owlref.