張 楠,周 亮,刁 玉
(1.清華大學 公共管理學院,北京100084;2.清華中國電子數據治理工程研究院,北京 100084)
隨著物聯網、云計算、區塊鏈、人工智能等技術快速發展,網絡空間已經成為繼陸、海、空、天之后的第五大空間,承載了越來越多的人類活動。數據是溝通網絡與現實的橋梁紐帶,是網絡空間的核心要素。近年來,數據采集設備不斷普及、持續迭代,數據量迎來了爆發式增長,伴隨著數據處理技術的不斷革新,數據價值增值可能性獲得極大提升。在此背景下,采集、管理、利用海量數據的能力已經成為國家、地區、機構和個人的核心能力之一。數據流可以引領技術流、資金流、人才流匯聚與重組,進而改變國家或地區的綜合實力,重塑戰略格局。
2020年4月9日,中共中央、國務院印發《關于構建更加完善的要素市場化配置體制機制的意見》,明確了中國經濟進行市場化配置的要素包括土地、勞動力、資本、技術和數據。其中,數據作為一種新型生產要素首次寫入國家正式文件。對于數據作為生產要素已經和將要發揮的作用,國內學者展開熱烈討論[1-3],普遍認為隨著當前經濟活動數字化轉型的進一步加快,數據資源對提高社會生產效率的作用日趨提升,標志著我國逐步進入數據紅利釋放階段,數據將作為生產要素全面參與市場經濟活動的投入、產出和分配等各階段。因此,數據治理機制的健全完善、數據治理能力的強化提升,已經成為釋放數據價值的迫切需求。與土地、勞動力、資本、技術等生產要素相比,數據既有生產要素的共性特征,也有其新特點,如高度動態性、快速流動性、非獨占性、平臺依托性等,使得數據要素治理必須在參考傳統生產要素治理的基礎上,結合數據要素自身特點進行深入研究和定制調適。
與數據治理包含“用數據治理”和“對數據治理”的兩層含義相類似,數據稽查概念出現以來也存在“用數據稽查”和“對數據稽查”兩種理解。利用數據稽查的研究主要集中在稅務稽查領域,從企業稅收到個人稅收,國內外已有較多探索[4-5],而針對數據的稽查則以關注數據真實性及合法性的監管為導向,但已有研究主要停留在數據質量控制技術層面和一些特定專業領域的數據稽查[6]。盡管劉文奇提出數據稽查的機制設計和制度建設至關重要[7],但在數據明確為生產要素之前鮮有相關系統性研究。
在此背景下,本文試圖以新生產要素視角剖析監管導向的數據稽查,從土地、勞動力、資本、技術等傳統生產要素治理過程中的監管模式和稽查手段比較分析中發現異同,從而厘清數據稽查的本質目的與關鍵節點,探討哪些傳統生產要素監管與稽查理念、模式能夠引入數據要素領域,助力稽查機制建立,破解數據要素化和價值釋放過程中面臨的困難與挑戰,為數據稽查這一數據治理領域的潛在方向貢獻新知。
狹義的“監管”是指由行政機構制定并執行的直接干預市場配置機制或間接改變企業和消費者供需決策的一般規則或特殊行為[8]。對生產要素的監管一般是指政府對市場準入、數量和質量等約束手段進行管理,隱含著對違規行為的處罰處置[9]。政府對生產要素的監管需要事前、事中、事后全方位監管,往往存在著節點和周期性,同時也蘊含著政府管理方式的革新,從舊有的全面管控到管理與一般監管的結合,再從一般監管到有側重有目的的約束監管[10]。我國從社會主義市場經濟建立以來,培育和完善生產要素的同時也在對生產要素監管不斷進行創新。
土地生產要素的監管。1986年我國出臺《土地管理法》,1988年進行修訂,其中關于“國有土地有償使用”的表述標志著土地作為生產要素開始進入市場,打破土地通過行政劃撥方式配置的單一方式,真正實現了市場對土地資源配置的積極作用[11]。在對土地要素進行政府監管方面,主要集中在土地資源的開發、儲備、交易、供應、整治、復墾等領域,由地方國土資源局(現自然資源局)負責沿著土地審批業務對過程中不同環節進行全面監管,如相關法律中關于土地用途管制制度、征地制度、國家土地督察制度的確立與規范等都是政府進行土地要素有效監管的表現。
勞動力生產要素的監管。能動性是勞動力要素的特征[12]。因此政府對勞動力要素的監管除對勞動關系合法性的監管之外,還應有對勞動力再生提供必要條件(包括勞動者是否擁有良好生活質量等問題)的監管,包括聘用情況、工作時間、裁員成本、裁員規定、工作質量和就業服務六個指標[13]。監管主體主要以政府勞動力監管機構(包括人社部內設的人力資源市場司、勞動監察局、調節仲裁管理司等)為主,以勞動就業法律法規(包括《勞動法》等)為依托對勞動力市場中違法行為進行處置。
資本要素的監管。我國是集中式資本監管體制國家,對資本要素的政府監管從資本要素進入市場伊始就相伴相隨。從1993年出臺的《公司法》,到其后《證券法》《保險法》《銀行業監督管理法》《關于推進資本市場改革開放和穩定發展的若干意見》(國九條)等若干法律文件的頒布實施,標志著政府監管體系的逐步建立,并設立全國性的監督管理機構(財政部、證監會、銀監會)來統一管理全國資本市場,在對資本的監管中管理資本市場的整體運行并逐步提升資本生產要素的配置效率。
技術要素的監管。國際治理經驗主要從預測監管、所有權監管、責任監管三方面對技術要素進行監管[14]。預測監管是指預測技術發展的社會風險并進行預見性地引導。所有權監管是指調整與技術有關的所有權問題,如國家市場監督管理局出臺《構建知識產權大保護格局 增強市場主體創新動能》的文件中提到需進行知識產權執法監管。責任監管則是強調技術方面的公共責任和個體責任,如對技術的實體機構 (高新技術企業的認證和資格等)進行監管[15]。隨著人工智能技術、新能源技術等逐漸成為第四次工業革命的焦點,對技術的監管與技術的研發一同成為未來政府關注的重點。
觀察原有生產要素的政府監管內容和過程可以發現,其對要素管理是在立法的基礎之上,運用多種指標體系和方法,輔以機構協同,來最終實現生產要素合理健康配置。過往研究文獻反映出政府監管的理論性、系統性較為有限,對生產要素監管方面的共識比較宏觀,鮮有執行細則的探討。
“稽查”一詞的出現可追溯到明朝,張居正在《請稽查章奏隨事考成以修實政疏》中提出了重在記事立限、監督考核和據實獎懲的“考成法”[16]。作為生產要素監管的重要手段,“稽查”常出現在政府對走私、偷稅、違禁等的非法活動的查處上。針對稽查的文獻主要集中在對資本生產要素的監管領域,如稅務稽查、電力營銷稽查、交通征費稽查、醫療費用稽查、食品藥品稽查等,而土地有償使用費用稽查則涉及另一個生產要素——土地,是在土地監管基礎上設立一個對于土地有償使用繳費領域不法行為的查處環節。對于以上稽查行為的稽查內容歸類一般可以概括為以下幾個步驟:首先,通過計算機輔助手段對生產要素對應的數據進行審計篩選;然后,采用信函問詢審計、案頭或實地審計等方式來實施,對出現的違法行為再依法進行查處。
根據對既有文獻的梳理,本文總結整理了不同生產要素監管和稽查的重點,以及其背后的主要邏輯(如表1所示)。從政府對生產要素監管和稽查活動所呈現的特點中可發現:首先,政府對生產要素的監管往往立足宏觀和總體把控,強調依據不同的管理情境綜合運用各種方式,相比之下,稽查作為以監管為目的的一種手段,其方式相對固定和具體。其次,政府對生產要素的監管涵蓋市場行為事前、事中、事后的全過程,而與之相比,稽查行為主要側重事后階段,強調對生產要素問題的處置。最后,政府稽查行為的對象也呈現明確和固定的特征,資本要素和土地要素由于便于進行憑證核驗與審計,成為稽查手段運用較多的領域。與之相比,勞動力要素和技術生產要素則具有一定的模糊性和不確定性,直接進行稽查具有難度。因此,上述領域的稽查通常會進行概念上的轉化,例如對勞動力要素的監管會轉化為對人口的稽查,對技術要素的監管會轉化為對專利及其合規使用情況的稽查,均體現了將目標要素的監管需求轉化為對其相對固定和明確組成部分內容的稽查行為這一基本思路,體現了生產要素稽查內涵與外延的可拓展性。

表1 傳統生產要素的監管與稽查
盡管各類生產要素都有不同程度和層面的稽查概念討論,但真正形成制度化和體系化的稽查行為,尤其是稅務稽查、海關稽查等,大致都具有以下三方面特征:一是將法律、法規和制度作為稽查依據,這是稽查活動開展的法律保障和遵循原則;二是設立專門機構作為稽查活動的實施主體,機構成立專業性團隊負責具體執行;三是稽查內容主要為實務或行為的真實性、合法性。上述三點是目標生產要素從監管對象具體化為稽查對象的關鍵。例如稅務稽查重點在于偷稅、逃稅、抗稅、騙稅、漏稅以及稅款滯納等情況。
作為生產要素的數據具備公共性。以政府數據為例,其數據來源最初主要依靠人工采集或自主申報,存在因各種利益驅動產生數據造假、瞞報可能性,因此,數據核實和數據打假也是數據稽查的核心[6]。數據稽查工作的開展同樣需要相關的法律法規作為基礎,需要專業機構有效實施。基于以上分析,本文認為,數據稽查是由具有技術能力的機構組織,依據各類法律法規、標準規范、行業準則等,對數據資源的真實性,數據采集、開放共享、開發利用、交易流通等行為的合法性進行核查、檢查與監督。數據稽查的第一個關鍵點即對數據監管進行具體化。
既然各類生產要素的稽查關注的核心均圍繞真實性和合法性,“有據可依”和“鐵證如山”對于稽查來說至關重要。雖然稽查能夠起到發現問題、建立預警機制等方面的作用,但這些功能通常發生在對違法違規行為完成處理之后。例如,海關稽查的時間窗口規定為海關自進出口貨物放行之日起三年內,或者在保稅貨物、減免稅進口貨物的海關監管期限內及其后的三年內[17]。在此期間對被稽查人的會計賬薄、會計憑證、報關單證及其他有關資料和貨物進行核查,監督被稽查人進出口活動的真實性和合法性。重點在事后是各類生產要素稽查中的普遍規律。
對比其他生產要素價值釋放過程,數據生產要素的價值產生可通過數據資產鏈和數據價值鏈兩個層面得以實現[18]。數據資產鏈是指數據在開發利用過程中數據形態不斷轉化的過程;數據價值鏈是指數據在深入挖掘過程中不斷形成數據增值的過程[19]。價值釋放恰恰發生在數據增值的事后,即數據發生了流動或以其他某種形式產生價值之后。在這個時間點之前,數據即使存在錯漏、缺失等各種問題,但并未造成實際后果,從稽查的事后邏輯來看,也沒有開展稽查工作的必要。而在這個時間點之后,數據的價值已經釋放并已經產生了實際的價值影響,即便后續發現問題并“亡羊補牢”,也幾乎不可能完全消除這種影響,這也使得與稽查相配套的處罰措施更符合邏輯。對于時間點的識別對數據稽查意義重大,意味著生產要素的內在邏輯為數據采集過程中的補充和完善留有時間余量。這一關鍵點的厘清有助于抵消在數據共享交換中因害怕問責而阻滯共享的陳舊觀念,使推動數據匯聚和加強數據稽查能夠實現邏輯統一。
稽查行為的具體化不僅體現在前述的法規、機構、目標等層面,更體現在稽查對象層面。真實性與合法性的要求在具體稽查對象情景下才能夠對應細化為具體內涵。上文對傳統生產要素稽查的類比分析發現,除了土地要素、資本要素這類能夠直接便于核驗、審計的直接稽查對象,在勞動力要素、技術要素涉及的領域,稽查通常圍繞與生產要素有直接關聯,能夠作為承載生產要素的基礎或觀測生產要素的標尺的概念和內容展開,例如勞動力要素范疇內的人口和技術要素范疇內的專利等。上述稽查對象的轉換剝離了生產要素中相對動態變化和具有不確定性的內容,此類稽查思路可為數據要素這一復雜新領域的稽查開展所借鑒。
對比傳統生產要素的特點,數據作為生產要素更具復雜性,也兼具技術要素的某些特征。一方面,從數據資產鏈和數據價值鏈兩個維度來看,數據生產要素在不同生命周期環節和不同使用場景下會衍生出多種表現形式。但對比數據要素價值實現過程,原始數據在價值鏈和資產鏈中起到基礎性作用,因此有被篡改、被造假的風險,具備作為數據稽查對象的必要性。另一方面,原始數據自數據源產生而來,其數據屬性往往固定,從難度考量也適宜作為稽查對象。此外,以原始數據作為主要稽查對象也有助于明確數據稽查的邊界,驅動多方主體在維護原始數據真實性、合法性前提下營造數據價值生態。
大數據時代的數據規模使得數據稽查必須日益依賴技術手段。過往研究認為數據稽查主要與數據清洗技術緊密相關,技術性數據清洗主要解決數據的一致性、正確性、完整性等問題。但在數據規模激增與生產要素性質共識形成后,數據稽查更為關注數據的真實性、權威性和隱私保護等問題,情況更為復雜,通常需要人工判斷介入,也被稱為非技術數據清洗[6]。數據生產要素稽查面臨區別于傳統生產要素稽查的不同挑戰。隨著技術的迭代發展,人工智能和人機協同可望引入數據稽查領域,而區塊鏈、隱私計算等新興數據安全技術有望為數據稽查提供新的技術手段,技術進步將在數據稽查體系架構中發揮重要支撐性作用。與已經運用在其他生產要素領域稽查活動中的大數據分析技術相比,數據稽查對技術理念的創新性、先進性要求更高,這既是相關技術快速發展、持續迭代的要求,更是數據要素本身特殊性所決定的。
數據稽查機制建設可從宏觀、微觀兩個層面進行描述。宏觀機制架構主要是解決數據要素稽查體系如何搭建的問題,而微觀層面則關注數據要素稽查機制如何運行的問題。
從監管目的出發,數據稽查的宏觀機制架構應至少包括三個方面。
(1)數據稽查制度建立與規程設置。制度規程在數據稽查體系架構中發揮著核心性作用,是開展稽查活動的主要依據。制度規程可以分為法律規范、制度以及規程三部分。其中,法律規范是以創制形式加以規定的基本稽查辦法,是稽查必須遵循或適宜遵循的基本原則;稽查制度則是對法律法規的必要性補充,是數據稽查的具體指導;稽查規程則是依照法律規范、制度所確立的稽查活動的工作程序、操作準則等。
(2)數據稽查機構設立與主體定位。稽查機構在數據稽查體系架構中發揮著決定性作用,是開展稽查活動責任主體。根據稽查的對象范圍和目的意義,行政機關、平臺企業和社會第三方都可以成為數據稽查機構。稽查機構是貫徹實施稽查法規、制度、規程,開展稽查活動的指揮系統和組織保證。稽查人員則是數據稽查機構實施稽查活動的具體執行人員。稽查人員的專業能力、工作態度與責任感,是影響稽查結果準確性的重要因素。
(3)數據稽查的監管目標與制度保障。數據稽查是以監管為導向的。在稽查活動的全流程中,經常包含對內、外兩套監管機制設計,包括稽查對內、外監控信息系統、稽查活動考核制度、稽查責任追究制度、稽查配套體系、制度保障體系等。數據稽查的配套制度保障在體系架構中起到維護性作用,是確保稽查活動良性規范、持續穩定運行的重要基礎。
數據作為生產要素的稽查運行邏輯與數據價值產生的過程密切相關。根據《城市數據治理工程白皮書》所描述的數據要素市場化過程[18],本文嘗試提出數據稽查的微觀機制(如圖1所示),并從稽查主體的對象、啟動時間節點、技術工具手段三方面簡要描述。

圖1 數據要素市場化場景下的數據稽查的微觀機制
首先,數據稽查應圍繞數據資產鏈和數據價值鏈“雙鏈”運行,以原始數據為對象開展。數據源和數據用戶作為數據產生的來源與數據價值享受者,是“雙鏈”的出發點和到達點,并無稽查的必要性。而原始數據、數據元件、數據產品作為數據在“雙鏈”中的不同階段表現形式,是數據治理和監管的對象。數據元件和數據產品是原始數據經過清洗、加工及算法處理后的產物,其表達形式與算法模型、運算能力和應用場景關系密切,這些環節中更多不確定性因素的引入帶來了極大的監管挑戰,超出了稽查對真實性、合法性的關注范疇。而原始數據特性穩定,對價值實現與傳遞具有根本性的影響,是數據稽查的重心和立足點。
其次,數據稽查應以價值釋放為節點,在數據要素流動和產生價值后啟動。以原始數據為對象進行稽查,并不代表從原始數據入庫即開始稽查。實際上,在數據元件產生流動或形成產品并提交用戶之前,數據稽查沒有啟動的必要。數據元件作為連接數據資源與數據產品的過度狀態,需要和原始數據迭代互動、完善優化,逐步形成富含價值、簡約精煉的數據高階表現形式。在這一過程完成前,數據的采集、清洗、加工過程應有試錯空間,此時開展稽查成本高、效率低,很可能會將稽查投入成本耗費在最終無法進入市場并形成價值的垃圾數據上。數據稽查應樹立“事后”原則,在數據元件形成并出庫后再啟動運行,不在數據價值產生過程本身增加前置環節。
最后,數據稽查應強化技術工具應用,并將其作為主要手段方式。當大數據技術已經助力傳統生產要素稽查的背景下[4],對于數據本身的稽查幾乎無法脫離技術手段來開展。以區塊鏈為例,區塊鏈技術對智能合約、數據目錄、數據共享記錄的存儲,能夠保證數據產生過程、流通過程和使用過程的可追溯、不可篡改[19]。而從稽查角度來看,區塊鏈的可追溯屬性能夠用于回溯數據的產生、加工、應用、流通等全過程,不可篡改屬性也有助于數據稽查證據鏈條的保存,確保稽查的技術可信執行。
數據作為生產要素正在快速融入社會經濟發展進程,將逐步發揮前所未有的重要作用。以監管為目的、以稽查為手段的數據治理活動是數據更好釋放價值、產生紅利的重要保障。面對這一全新領域,本文嘗試從土地、勞動力、資本和技術等傳統要素的監管與稽查規律入手,分析數據作為新生產要素的特征異同,并據此從宏觀和微觀兩個層面對數據稽查機制建設提出了初步思路。在后續工作中,將從技術視角出發,進一步研究如何把當前數據安全新技術有效融入數據稽查工作;從機制視角出發,進一步研究數據稽查中的觸發機制、人機協同以及證據存儲等關鍵環節的實現問題等。相關領域也亟待開展更多的理論探索、原型設計和實證研究工作。