付宏燕
(國家信息中心公共技術服務部,北京 100045)
公共資源交易是要素市場化配置的重要內容,也是關聯政府和市場的紐帶,屬于政務公開范疇[1]。公共資源交易大數據的流通共享是對我國政務數據資源共享開放的積極響應,與數據質量、數據規范、應用需求、軟硬件等因素緊密相連,并和市場主體、市場環境等構成有機整體,是一個動態發展的體系。
國家公共資源交易服務平臺已完成工程招投標、政府采購等五個領域地方數據的歸集,推動相關數據資源化并全國流通急需納入考慮。本文采用服務思維,從交易數據業務特征出發,結合應用需求,設計交易數據資源目錄體系和流通服務框架,推動交易數據在全國范圍的高效流通共享。
一是交易領域漸增,數據海量實時更新。公共資源交易以項目交易進展為主線,圍繞入場登記、招標、投標、評標、中標、合同的業務環節,形成鏈條式結構化數據[2];招標公告、中標公示均要求生成當天在規定媒介發布[3]。相對成熟的領域包括工程建設招投標、政府采購、土地使用權出讓、礦業權出讓、國有產權交易,數據量已超2億條,年度成交項目數量超110萬個。隨著公共資源交易范圍擴展,海洋資源交易、用能權交易等越來越多領域納入電子化范圍,數據量急劇增加。
二是市場主體角色多樣,交易活動類型多樣。市場主體是交易活動的發起者、組織者,也是交易行為的參與者、實現者。同一主體擁有多種交易角色,不同主體的類別性質不同。交易類型除招投標外,還有拍賣、掛牌、協議等多種形式。將鏈條式結構化數據重新組合為不同主題,可反映出交易市場的區域化融合程度,揭示交易行為隱含的資源配置規律。
三是數據多源質量參差,應用需求驅動流通。公共資源交易電子化數據產自全國1000 多個地方交易系統,數據源結構千差萬別,數據正確性、完整性有待提高,大量的原始過程數據沒有產生價值。按照運用大數據加強公共服務的戰略,由需求驅動數據流通和共享,多源數據融合產生應用成效。
數據變成資源是流通共享并發揮價值的前提條件。地方交易系統的海量數據,表結構不同、數據格式不同、數據采集時間點要求也不同[4],通過政務外網級聯式歸集到國家級平臺政務云存儲。國家級平臺對所歸集的數據打標簽,識別所屬領域、主體性質、交易類型、交易時間等業務特征,對疑似異常的大額中標值核查治理后,形成統一格式的庫表和接口資源。
數據規范是交易大數據資源化的依據,是數據共享、交換和應用的基礎。2018 年國家發展改革委聯合財政部、自然資源部、國資委印發《公共資源交易平臺系統數據規范(V2.0)》,覆蓋五個交易領域的主要業務環節,約束了數據內容、來源平臺和格式,為數據流通和溯源做了關鍵準備,也是數據生命周期質量控制的機制保障[5]。
目前,國家級平臺形成140個基礎庫表,涉及3000 多個字段,生成了元數據及數據級聯式匯聚與反饋機制,但庫表之間業務依賴、包含關系并未形成統一對外的資源目錄體系,難以高效支持交易數據資源的流通共享。再者,接口對政務部門開放服務,支持省級、地市級交易平臺直接與國家級平臺扁平式對接,40 多家政務單位呈分散的點狀管理,尚未形成資源應用指標評價使用成效。
交易大數據的資源目錄體系架構如圖1 所示,以數據歸集、資源化體系為基礎,從不同業務角度對資源邏輯分類形成層次清晰的資源目錄樹,支撐從交易領域、流程環節、來源等任意搜索資源,并從交易業務層面定義資源屬性等相關項,以及數據應用、資源監測指標。

圖1 交易數據資源目錄體系架構
3.2.1 數據資源目錄樹結構
以交易流程目錄樹構建為例,應遵循四個原則:第一結合交易流程重點環節、信息公開要求、業務需求劃分大類,覆蓋統計、分析和監管必需的交易首尾資源、信息公開資源;第二細分交易領域,標識子類;第三突出大類與子類的包含關系;第四各級節點均可擴展。因此,歸集的庫表資源可劃分為入場登記信息、招標公告信息、成交公示信息、交易合同信息四大類;整合數據形成主體成交記錄信息類。結合數據規范內容范圍和約束,設計如圖2所示的公共資源交易數據資源目錄樹。

圖2 公共資源交易數據資源目錄樹
對于同筆交易,資源目錄樹的一級子節點縱向跨越交易時間主線,從入場登記到交易合同,表達出一個交易周期;二級子節點、三級葉節點之間為業務層面的包含關系;三級子節點和四級葉節點為1 對N包含關系,代表1 個招標項目包含多個標段。接口資源圍繞主體成交記錄,分解為三個子接口,內容粒度縱向細化。

表1 交易數據資源指標
3.2.2 編輯目錄樹節點屬性
首先標識資源節點的基本屬性和約束。資源節點基本屬性對外公開,包括資源名稱、資源描述、更新頻率、資源容量、是否敏感等。資源節點約束含數據字典和共享條件設置,數據字典說明數據項名稱、類型、非空/必填、主鍵、聯合主鍵、索引、關聯關系等;共享條件設置有條件和無條件共享,有條件共享需資源提供方審批并同意。
其次串聯同筆交易的節點資源。將同一項目的不同葉結點資源,按時間順序銜接并串聯項目編碼,即組合為一筆交易。例如,工程建設招投標領域的標段(包),往前可串聯標段所屬的招標項目,往后可串聯標段的招標公告和資格預審公告、中標結果公示及成交合同,為交易全流程監管做準備。
數據資源指標包括數據應用指標和資源監測指標,見表1所示。數據應用指標映射國家政策對全國公共資源交易市場的影響,也是持續優化營商環境、提升交易服務效能的反饋,根據應用層需求確定,深度綁定交易業務,分領域交易趨勢分析、主體成交行為分析、跨區域市場融合分析等;資源監測指標一方面評價資源提供方的服務能力和服務質量,另一方面反映資源使用方對資源的需求程度,及利用資源對業務的支撐程度。
交易數據在政務系統內流通不存在貨幣媒介的交易,以輔助政務單位的履職為目的。國家電子政務外網承擔著全國交易數據的歸集,也必然地成為面向政務部門資源流通的主要渠道。國家級政務信息共享平臺強化了資源提供方與需求方的有機連接,為數據交換、資源流通和跨部門協同提供了條件。同時,非結構化的交易公告公示,通過互聯網面向社會和市場主體開放。資源需求方優質的場景需求產生優質的應用效果,優質的服務成效創造更優的需求,正向迭代推進,資源流通與服務框架如圖3所示。

圖3 資源流通與服務框架
交易數據跨部門、跨地域的共享和業務協同,體現了交易市場的區域化融合發展,破除省際間招投標的壟斷分割,推動競爭有序的全國統一大市場的建設[6]。流通時間越短,流通效益越高[7]。目前流通到中央政務部門的數據資源,用于輔助行業市場項目監管,如住建部利用篩選出建筑類項目與住建工程項目比對,核查參建主體與中標主體的一致性、業績真實性等;再如銀行信易貸中小微企業融資信用評價,2022 年支撐全國郵儲銀行1 萬多次。流通到地方的數據資源,多用于對招投標業務的簡化,如南京簡化投標人的標書制作和業績錄入;云南利用資源信息取代市場主體注冊,降低人為登記的錯誤,提高辦公效率。在全國類似需求強烈,資源共享服務急需擴展。
數據資源流通過程中,權屬是難題。交易數據產生時,明確標識地方來源平臺的數據所有權,但資源化過程中,數據持有權、加工權均無定義,所有權人無法控制或識別數據后續權屬。流通過程中,同一數據資源歷經不同機構、不同使用者的不同需求,相關使用權難以界定。鑒于此,應優先保護所有權人的權益,嚴格約束需求方對數據的使用邊界,比如對高質量的資源所有權人進行激勵、要求資源使用方書面承諾不得用于商業行為等。
在大數據上升為國家戰略的背景下,數據流通共享擁有政策和市場的雙重機遇。公共資源交易數據資源目錄體系與流通共享框架相輔相成,以服務主體為本,利于交易數據的價值變現,促進資源配置不斷優化。目前區塊鏈技術的應用也在研究中[4],若進一步推動全國主體信用信息、資質信息整合并流通,可極大地提升全國范圍交易業務的招投評標效率,完善公共資源交易政務數據生態環境。