王鴻飛,何 悅
(廣東省科學技術(shù)情報研究所,廣東廣州 510033)
2020 年7 月29 日,廣東省審計廳發(fā)布《廣東省人民政府關(guān)于2019 年度省級預算執(zhí)行和其他財政收支的審計工作報告》,工作報告指出科技孵化育成體系建設績效存在的問題,對廣東省2015 至2018年度科技企業(yè)孵化育成體系建設政策落實和相關(guān)資金管理使用績效進行了審計調(diào)查,抽查相關(guān)孵化載體,發(fā)現(xiàn)6 家孵化器存在虛假申報,騙取相關(guān)資質(zhì)認定和財政補助;通過數(shù)據(jù)篩查發(fā)現(xiàn)7 391 家在孵企業(yè)、畢業(yè)企業(yè)不符合孵化器入駐條件[1]。科技項目申報資料真實性存疑的問題一直存在,虛假申報在傳統(tǒng)形式審查過程中難以識別,未能發(fā)現(xiàn)并有效制止較普遍存在的財政資金被騙取和公共資源損失浪費問題。孵化載體資質(zhì)認定中的虛假申報行為,主要表現(xiàn)為參與孵化載體資質(zhì)認定的申報單位在不符合認定條件的情況下,偽造在孵企業(yè)的工商信息及知識產(chǎn)權(quán)信息,希望通過填報虛假信息達到符合認定條件資格。從廣東省審計廳在工作報告中提出的問題分析,可判斷審計部門對科技項目監(jiān)督管理運用了新的技術(shù)手段,在數(shù)據(jù)挖掘及邏輯關(guān)聯(lián)方面已優(yōu)于科技管理部門事前形式審查的技術(shù)手段,無形中對科技管理部門在科技項目管理工作上也提出新的挑戰(zhàn)。科技事業(yè)的發(fā)展事關(guān)科技進步和國家未來發(fā)展的競爭力,其中項目的申報和遴選是科技事業(yè)發(fā)展的一個重要入口,過往項目事前形式審查的方式已不適應現(xiàn)監(jiān)督管理的要求,虛假申報導致的項目管理問題較為突出,隨之引發(fā)的項目管理風險已逐步呈現(xiàn)。
在此背景下,本研究聚焦于項目申報資料中的工商信息及知識產(chǎn)權(quán)信息校驗研究,結(jié)合孵化載體資質(zhì)認定管理工作的風險特征,對化解項目管理風險提出新的技術(shù)手段,對在孵化企業(yè)的工商信息及知識產(chǎn)權(quán)信息進行真實性校驗,通過實踐引證了防范項目管理風險的有效措施。
2.1.1 理論實踐方面
邱瑩等[2]對2018 年廣東省自然科學基金項目形式審查情況進行總結(jié)和分析,形式審查的內(nèi)容僅對申報要求進行審查,并無對申報資料進行真實性校驗。姚寧廣[3]在安徽省科學技術(shù)獎勵管理工作中,對形式審查提出新的要求,除了過往常見的限項申報審查外,對是否使用上一年度落選項目、獲獎材料是否重復使用等均有進行校驗,但該校驗是通過人工完成。翁振群等[4]通過對2012 年至2016 年度自然科學基金不予受理的常見原因進行分析,形式審查的手段較為簡單,無法校驗真實性。劉培云等[5]以科研項目管理實踐為例,從健全完善信息化項目管理系統(tǒng)、建設推進科研信用體系、管控研究人員風險、監(jiān)控項目經(jīng)費風險、研判項目失敗風險、監(jiān)測技術(shù)與實驗平臺風險等方面,討論提出了若干可選擇的項目風險應對策略。劉春林[6]基于信息不對稱理論,對常見的編輯可以介入的學術(shù)不端行為提出應對措施和建議。顧卓[7]認為科研項目信息存在不對稱的現(xiàn)象,提出加強科技項目的過程管理,建立健全科技項目管理問責制等管理風險控制的建議。姚佳良[8]提出新型學術(shù)不端判定模式,增加了“專業(yè)人員復檢”步驟,形成“計算機審查系統(tǒng)初檢-專業(yè)人員復檢-專家判定”模式,可有效減少對復制比高的學術(shù)論文的誤判,增加判定的專業(yè)性。錢乾等[9]認為科技項目管理中存在風險,需對風險進行準確識別、判斷,并制定針對性的管理策略,應運用信息化手段全面降低科技項目管理風險。
2.1.2 技術(shù)設想方面
馬瑾男[10]在基于數(shù)據(jù)池的項目形式審查智能評判系統(tǒng)在解釋數(shù)據(jù)池內(nèi)涵的基礎上,從審查主體與評判規(guī)則入手,詳細介紹了基于數(shù)據(jù)池的項目形式審查智能評判系統(tǒng)的功能,通過智能評判系統(tǒng),可實現(xiàn)數(shù)據(jù)的積累、匯聚,減少人力操作,但僅限于科研誠信和財務審查,數(shù)據(jù)來源于自有數(shù)據(jù)的校驗,無法多維度對申報資料的真實性進行校驗。張重毅等[11]對科技論文隱性學術(shù)不端行為判別特征分析。針對論文中的公式或圖表抄襲、跨語種抄襲,提出了相關(guān)的算法模型。上官學奎等[12]對科技項目申報限項核查構(gòu)建研究,在項目的限項申報提出了校驗規(guī)則與反饋流程。柳亭等[13]在獎勵申報系統(tǒng)中增加歷史數(shù)據(jù)查詢功能,對涉及重復報獎的專利、論文、專著、標準等獲獎情況進行查重,實現(xiàn)知識產(chǎn)權(quán)狀態(tài)檢索、知識產(chǎn)權(quán)重復使用校驗,避免重復報獎。潘昕昕[14]提出建立統(tǒng)一的監(jiān)督評估信息系統(tǒng),建立相關(guān)數(shù)據(jù)庫,通過提交結(jié)構(gòu)化的報告和數(shù)據(jù),實現(xiàn)對項目實施全過程的痕跡管理,匯集項目管理和監(jiān)督信息,對項目實施動態(tài)監(jiān)控和風險預警,在項目信息分析的基礎上選取項目進行重點監(jiān)督。簡國明等[15]構(gòu)建了大學生創(chuàng)新創(chuàng)業(yè)訓練計劃項目結(jié)項材料查重系統(tǒng),通過結(jié)項材料的文本比對、相似判別、數(shù)據(jù)甄別和線上運行,得出結(jié)項材料查重報告。陶秀杰等[16]對企業(yè)科研項目管理流程進行深入的設計與研究,設計并實現(xiàn)基于情報和知識管理的科研項目管理系統(tǒng),有效地提高科研項目的管理效率。王欣宇[17]設計相似度分析模型,利用大數(shù)據(jù)分析技術(shù)對科技項目申報材料進行相似度計算,計算出申報材料的相似度比率,并詳細列出相似的具體內(nèi)容,可輔助項目管理決策。朱昆等[18]以項目、信息、報表為核心,設計了科研項目管理系統(tǒng),實現(xiàn)科研單位的高效率、精細化、全方位、決策型管理。楊朝紅等[19]提出了一種交換數(shù)據(jù)格式標準、數(shù)據(jù)庫標準和文檔開發(fā)標準的行業(yè)信息化標準的自動化校驗方法,能夠替代部分人工驗證工作。王晨輝等[20]在項目評審中利用神經(jīng)網(wǎng)絡自動擬合能力,對知識產(chǎn)權(quán)關(guān)聯(lián)度進行分析,代替人工進行輔助評審,為人工評審提供參考。
在孵化載體資質(zhì)認定中,在孵企業(yè)的數(shù)量及真實性直接影響申報單位是否符合認定條件。在孵化企業(yè)的工商信息包括統(tǒng)一社會信用代碼、成立時間、注冊地址、注冊資本、企業(yè)類型、登記機關(guān),偽造工商信息是為了偽證在孵企業(yè)主要研發(fā)、辦公場所是否在所屬孵化器場地內(nèi),孵化時限是否超過時限。知識產(chǎn)權(quán)信息包括專利、商標、軟件著作權(quán)、作品著作權(quán),偽造知識產(chǎn)權(quán)信息是為了偽證在孵企業(yè)知識產(chǎn)權(quán)的所有權(quán)歸屬、專利在途狀態(tài)。偽造手段一般通過利用修圖軟件編造虛假材料及對照申報條件利用反向工程的原理,偽造在孵企業(yè)的工商信息或知識產(chǎn)權(quán)信息。導致作造假例頻現(xiàn),原因在于過往沒有手段或方法對申報資料進行多維度真實性校驗。雖然科技管理部門已加大力度實施現(xiàn)場檢查,打破了之前只重“書面審核”,不看“企業(yè)實際”的慣例。但這種檢查單純依靠檢查人員的經(jīng)驗判斷,仍然缺乏有效的工具或手段,無法有效甄別各樣佐證材料的真實性。同時“上有政策,下有對策”,眾多網(wǎng)絡自媒體對如何規(guī)避科技部門的檢查都有科學合理的套路教學,使實際的檢查效果大打折扣。針對虛假申報的問題,2020 年廣東科技管理部門在陽光政務平臺及時補增了知識產(chǎn)權(quán)校驗功能,但只針對高企校驗,其他專題項目暫時無法校驗。
綜上,理論實踐的文獻均聚焦于申報資料合規(guī)性的問題上,形式審查多數(shù)通過人工鑒別,對申報資料的真實性無法進行校驗。技術(shù)設想的文獻止步于具體功能的構(gòu)思或架構(gòu)設計,實踐以查重或限項為主,并無對申報資料進行真實性校驗的實踐。針對文獻及現(xiàn)狀,仍存在以下問題,一是無法校驗項目申報資料真實性,缺乏有效工具;二是形式審查單憑個人經(jīng)驗判斷,人工審核工作量大;三是虛假申報引發(fā)的項目管理風險依然隱性存在,亟需采取有效手段防范風險。
本系統(tǒng)設計思路是結(jié)合孵化載體資質(zhì)認定項目管理工作過程中存在的風險特征,圍繞填報的工商信息及知識產(chǎn)權(quán)信息與第三方數(shù)據(jù)庫提供的接口進行校驗匹配,達到判斷在孵企業(yè)真實性的效果。
系統(tǒng)設計在標準方面,依托國家電子政務建設的各種信息技術(shù)標準(環(huán)境、技術(shù)、信息、安全、信息交換標準等),針對不同層面的使用者的應用水平,充分考慮系統(tǒng)的易用性。在可擴展方面,兼顧二次開發(fā)的需要及支持未來可能出現(xiàn)擴展的需要,系統(tǒng)采用開放的可擴充模塊結(jié)構(gòu),保證以后可以方便地升級和不斷增加新功能、增加容量、以及在同一平臺上擴充其他業(yè)務應用功能。在安全方面,采用安全保密技術(shù)進行用戶身份認證,應用系統(tǒng)的登錄、流轉(zhuǎn)等功能模塊中,操作方式應簡單快捷。應具備完善的日志管理等功能,能夠追蹤記錄每次操作情況,并對非法操作進行告警。
3.1.1 架構(gòu)設計
申報資料校驗系統(tǒng)架構(gòu)分為5 層,包括應用層、業(yè)務層、管理層、執(zhí)行模型、資源層(見圖1)。可以直接在平臺上使用,無需下載軟件或者小程序,可內(nèi)嵌到各種系統(tǒng)中,使用方便靈活,大大提高形式審查的準確率及審查效率,對形式審查及項目評審起到重要的輔助作用。

圖1 申報資料校驗系統(tǒng)架構(gòu)
3.1.2 流程設計
工商信息及知識產(chǎn)權(quán)信息導入后,先從暫存庫數(shù)據(jù)校驗信息,若暫存庫無對應的數(shù)據(jù)可校驗,則通過第三方接口進行校驗,通過校驗后顯示出對應的校驗結(jié)果(見圖2)。

圖2 校驗流程
3.1.3 校驗內(nèi)容
申報資料校驗系統(tǒng)根據(jù)不同項目/需求方的要求可設計不同字段的校驗,本次校驗字段如下.
(1)工商信息可校驗的字段包括:企業(yè)名稱、統(tǒng)一社會信用代碼、成立時間、注冊地址、注冊資本、所屬行業(yè)、企業(yè)類型、登記機關(guān)。
(2)知識產(chǎn)權(quán)信息可校驗的字段,具體如表1所示。

表1 知識產(chǎn)權(quán)信息校驗字段
3.1.4 校驗模型設計
申報資料校驗系統(tǒng)包括6 大模型,在數(shù)據(jù)標準化方面,涉及到大量的數(shù)據(jù)錄入和采集工作,需對數(shù)據(jù)進行清洗及標準化,設計了數(shù)據(jù)清洗模型。在應對網(wǎng)絡延時、接口數(shù)量過多及校驗數(shù)據(jù)量較大方面,設計了緩存處理模型、接口聚合與探查邏輯模型、防過載或高并發(fā)模型。在校驗實施邏輯方面,設計了中文分詞計算關(guān)鍵相似度模型及分詞學習模型,提高模糊判斷的準確率。
(1)數(shù)據(jù)清洗模型。通過刪除、更正數(shù)據(jù)中錯誤、不完整、格式有誤或多余的數(shù)據(jù),使數(shù)據(jù)具備邏輯上的準確性,保障來自各個數(shù)據(jù)源的數(shù)據(jù)的一致性。在異常值以及噪聲的處理方面,主要是創(chuàng)建清洗應用庫和清洗規(guī)則,主要對錄入的數(shù)據(jù)源創(chuàng)建清洗規(guī)則、清洗運行時間以及創(chuàng)建和修改清洗后數(shù)據(jù)結(jié)構(gòu)(見圖3)。如工商信息的成立時間采用自動化標準格式,會對2020.10.21、2020 年10 月21 日和2020/10/21 等類型進行轉(zhuǎn)化為2020-10-21 格式。知識產(chǎn)權(quán)編號采用多條件綜合判斷,在匹配前先過濾填寫與接口數(shù)據(jù)中的空格、所有字母和小數(shù)點及后面數(shù)字/字母、特殊符號,包含“ ()();;,,.&-《》{}”。

圖3 數(shù)據(jù)清洗模型
(2)緩存處理模型。由于系統(tǒng)需調(diào)用第三方接口,而第三方接口存在網(wǎng)絡延時、服務不用等不可控因素,系統(tǒng)采用較主流的Redis+數(shù)據(jù)庫結(jié)合的緩存技術(shù)(見圖4)。

圖4 工商信息緩存處理模型
(3)接口聚合與探查邏輯模型。知識產(chǎn)權(quán)校驗的類型主要分為商標、發(fā)明專利、實用新型、商標、軟著等類型,需校驗的字段較多,各類型的接口分散在不同的第三方數(shù)據(jù)商,實施校驗的邏輯也較為復雜。為確保準確性,需要聚合不同的第三方接口,再進行分類、整理、梳理邏輯,并進行二次開發(fā)滿足校驗需求。此外,還需實現(xiàn)企業(yè)知識產(chǎn)權(quán)內(nèi)容探查邏輯。因單次調(diào)用第三方數(shù)據(jù)商接口進行校驗時,部分第三方數(shù)據(jù)商提供的數(shù)據(jù)有條數(shù)限制,每次調(diào)用均只返回指定條數(shù)的數(shù)據(jù)(如10 條)。如某個企業(yè)的知識產(chǎn)權(quán)數(shù)據(jù)有50 條,需調(diào)用約5 次第三方接口才能完成校驗,為提升用戶使用體驗和降低成本系統(tǒng)運營成本,結(jié)合緩存技術(shù),設計了知識產(chǎn)權(quán)探查邏輯進行處理,即合理的使用緩存和主動調(diào)用接口策略(見圖5)。

圖5 知識產(chǎn)權(quán)信息校驗模型
(4)防過載或高并發(fā)模型。由于每條校驗數(shù)據(jù)都要訪問一次接口,這存在數(shù)據(jù)請求和處理的過程,若導入校驗數(shù)據(jù)太多(大于200 條),會造成數(shù)據(jù)延遲、瀏覽器報錯或服務器卡機的情況,為了解決實際用戶操作和大批量數(shù)據(jù)校驗卡機的問題,優(yōu)化了相關(guān)執(zhí)行判斷。具體如下:第一步,數(shù)據(jù)導入后,先判斷前序任務是否有正在匹配中的數(shù)據(jù),無前序任務則直接進入下一步,若顯示“待匹配”需等待前序任務匹配完后再進入下一步;第二步,判斷導入模板的校驗數(shù)量是否大于50 條數(shù)據(jù),若導入模板數(shù)據(jù)少于或等于50 條,則導入后顯示校驗結(jié)果頁,若導入模板數(shù)據(jù)大于50 條,則導入后跳轉(zhuǎn)到校驗記錄頁,顯示數(shù)據(jù)“匹配中”,再進入下一步;第三步,數(shù)據(jù)校驗采用定時器+異步處理方式,每分鐘向第三方接口發(fā)送50 條數(shù)據(jù)請求并校驗,直到數(shù)據(jù)校驗完畢,校驗記錄才顯示“已匹配”,并可查看匹配結(jié)果。
若同時上傳多個大于50 條的模板,系統(tǒng)有隊列校驗過程狀態(tài),未開始校驗的模板顯示“待匹配”,未處理完模板顯示“匹配中”,匹配完畢模板顯示“已匹配”;工商信息校驗和知識產(chǎn)權(quán)校驗并行校驗,可以同時校驗,不相互影響(見圖6)。

圖6 知識產(chǎn)權(quán)信息校驗模型
(5)基于中文分詞計算關(guān)鍵相似度模型。以工商信息的企業(yè)注冊地址文本內(nèi)容為例,用戶實際填報的內(nèi)容、格式無法有效統(tǒng)一,本系統(tǒng)使用了分詞技術(shù)并結(jié)合計算關(guān)鍵詞相似度來有效提升校驗的準確性。如系統(tǒng)期望填報的企業(yè)注冊地址內(nèi)容標準格式為“*省*市*區(qū)*路*號”,實際填報基本為“*市*路*園區(qū)*號”,與期望存在較大出入,為保障快速、精確校驗企業(yè)注冊地址,采用中文分詞技術(shù)后再進行相似度算法進行校驗比對。對填報的企業(yè)注冊地址和通過第三方數(shù)據(jù)接口獲取的企業(yè)地址分別進行中文分詞。Ca 為用戶填報內(nèi)容,Cb 為第三方接口數(shù)據(jù)。根據(jù)用戶填報的企業(yè)注冊地址文本內(nèi)容Ca 與通過第三方接口獲得的企業(yè)注冊地址文本內(nèi)容Cb,分別使用JieBa 分詞組件工具對文本內(nèi)容采取前向查找模式進行切分,得到詞串集合Sa、Sb。
用戶填報內(nèi)容:

用戶填報內(nèi)容切詞分組:

第三方接口內(nèi)容:

第三方接口內(nèi)容切詞分組:

通過計算方法,計算出用戶填報內(nèi)容切詞分組后與第三方接口內(nèi)容切詞分組后的相似度模型,為切詞分組后的Sa 詞串,為切詞分組后的Sb 詞串,計算相似度差值越小,內(nèi)容越接近,可判斷為相似度越高,計算方法為:

(6)分詞學習模型。在校驗系統(tǒng)中實現(xiàn)詞庫智能學習,將申報資料中的語句轉(zhuǎn)化成語料庫中的詞,當有新文本信息導入時,針對文本中出現(xiàn)的新詞進行智能學習,同時將新詞通過字符串分詞算法抽取出來,添加至暫存庫詞典中。該算法能夠經(jīng)過語料訓練從而分出“新詞”,即過往數(shù)據(jù)中沒有收錄到的詞。只要它的出現(xiàn)次數(shù)超過一定的閾值,就能被識別,以便之后在分詞過程中能抽取出來,實時更新語料庫,完成智能學習功能。分詞學習模型改進了傳統(tǒng)字符串分詞中的詞典結(jié)構(gòu),提高了分詞過程中的匹配速度,提高了分詞效率,為校驗提供了快速、準確的查詢對比方法。分詞學習模型主要采用正向和逆向匹配算法。
正向匹配分詞算法處理流程步驟如下:
1)數(shù)據(jù)清洗標點符號預處理,并把每段文字提取出單獨存放,預處理完的結(jié)果存為單個分詞輸入文件。
2)按順序讀出分詞輸入文件中的一段文字,記一段文字為Sn,分詞結(jié)果為Kn(n=1,2…),全部讀取完畢時,算法結(jié)束。
3)待切分的中文字串為Sn=C0C1C2…Cn,當前正在匹配字為Ci(0<=i<=n,i初始為O),j=i。首先根據(jù)Ci 為開頭的詞條樹,然后沿著樹結(jié)點逐層匹配,直到出現(xiàn)以下3 種情況之一:找不到匹配節(jié)點、找到可以成詞的節(jié)點、i 等于n。
4)此時,Ci 最小匹配,切分出的結(jié)果為Ki=CjC1C2…Ci。若i等于n,此段文字分詞結(jié)束,轉(zhuǎn)步驟2)。若i小于n,i=i+l,轉(zhuǎn)步驟3)。
逆向匹配算法處理流程步驟如下:
當進行逆向逐字匹配時,只要使用上文所述倒轉(zhuǎn)詞典中的詞條,對算法稍作改動即可。由后向前對文本進行匹配。
1)與正向算法一致。
2)與正向算法一致。
3)待切分的中文字串為Sn=C0C1C2…Cn,當前正在匹配字為Ci(0<=i<=n,i初始為n),j=i。首先根據(jù)Ci 為開頭的詞條樹,然后沿著樹節(jié)點逐層匹配,直到出現(xiàn)以下3 種情況之一:找不到匹配節(jié)點、到達樹的葉子節(jié)點、i等于0。
4)此時,C0 為最大匹配,切分出的結(jié)果為Ki=CjC1C2…Ci。若i等于0,此段文字分詞結(jié)束,轉(zhuǎn)步驟2)。若i大于0,i=i-1,轉(zhuǎn)步驟3)。
當工商信息及知識產(chǎn)權(quán)信息導入校驗系統(tǒng)后,經(jīng)過內(nèi)部的分詞算法,對導入的信息進行分詞處理,通過對文本中的已錄詞和未學習詞進行識別,完成分詞了解,最終根據(jù)校驗系統(tǒng)要求將語句相同率和相同語句標示,輸出對比結(jié)果。
3.1.5 校驗邏輯
(1)工商信息。以企業(yè)的名稱作為主鍵,第一步先通過“企業(yè)名稱”進行校驗,如校驗無誤,進入第二步;如校驗有誤,無法調(diào)出接口信息,顯示“企業(yè)名稱有誤”。第二步同時對統(tǒng)一社會信用代碼、成立時間、注冊地址、注冊資本、企業(yè)類型、登記機關(guān)的信息進行校驗。如發(fā)生錯誤則提示錯誤的類型,并提示出錄入與第三方數(shù)據(jù)比對校驗的詳細內(nèi)容,方便用戶快速定位找出問題并解決(見圖7)。

圖7 工商信息校驗邏輯
(2)知識產(chǎn)權(quán)信息。知識產(chǎn)權(quán)信息校驗按照以下校驗順序進行校驗:企業(yè)名稱->知識產(chǎn)權(quán)類型->知識產(chǎn)權(quán)編號->知識產(chǎn)權(quán)名稱->知識產(chǎn)權(quán)狀態(tài)。以企業(yè)的名稱作為主鍵,第一步對企業(yè)名稱進行校驗,如校驗無誤,進入第二步;如校驗有誤,無法調(diào)出接口信息,顯示“無知識產(chǎn)權(quán)數(shù)據(jù)”。第二步校驗知識產(chǎn)權(quán)類型,如校驗無誤,進入第三步;如果校驗有誤,無法調(diào)出接口信息,同樣顯示“無知識產(chǎn)權(quán)數(shù)據(jù)”;第三步依次對知識產(chǎn)權(quán)編號、知識產(chǎn)權(quán)名稱、知識產(chǎn)權(quán)狀態(tài)進行校驗。如發(fā)生錯誤則提示錯誤的類型,系統(tǒng)提示出錯類型和錄入與比對校驗的詳細內(nèi)容,方便用戶快速定位找出問題并解決(見圖8)。其中,知識產(chǎn)權(quán)狀態(tài)在糾錯對比欄目中顯示正確的狀態(tài)與具體法律狀態(tài)描述。

圖8 知識產(chǎn)權(quán)信息校驗邏輯
因知識產(chǎn)權(quán)存在多種狀態(tài),會存在信息不對稱的問題,難以判斷真實性。特別是已申請未授權(quán)或已授權(quán)未拿到證書的仍屬于在途狀態(tài),故知識產(chǎn)權(quán)狀態(tài)采用法律狀態(tài)進行判斷,具體以第三方數(shù)據(jù)方反饋的參數(shù)狀態(tài)為依據(jù)。通過梳理分析,理清了公告號與申請?zhí)柕倪壿嬯P(guān)系,能準確判斷知識產(chǎn)權(quán)是否處于有效狀態(tài)。
最終梳理為三種狀態(tài),已擁有、已申請屬于有效狀態(tài),已失效屬于無效狀態(tài),如表2 所示。

表2 知識產(chǎn)權(quán)狀態(tài)判斷表

表2(續(xù))
(1)暫存庫模塊。該功能主要是避免短時間內(nèi)反復查詢或測試,造成數(shù)據(jù)數(shù)據(jù)冗余及影響統(tǒng)計分析的效果。在校驗數(shù)據(jù)過程中,先從暫存庫數(shù)據(jù)校驗信息,若暫存庫無對應的數(shù)據(jù)可校驗,則通過第三方接口進行校驗。調(diào)用第三方接口后,新數(shù)據(jù)會自動更新到暫存庫,供下次查詢使用;暫存庫數(shù)據(jù)設置為7 天的保留期限,7 天后數(shù)據(jù)將會自動刪除,保證數(shù)據(jù)實時性。
(2)相似度的容錯設置。實際填報信息與真實信息存在差異,可能是填錯或填漏一兩個字符,但并非虛假信息;為避免誤判填錯或填漏的信息,通過概率模型提升模糊判斷的準確率,形成容錯機制,容錯率可自行調(diào)節(jié),最低限度可設置為70%,即填報內(nèi)容與第三方數(shù)據(jù)匹配達到70%以上相同,視為真實信息;最高可調(diào)節(jié)為100%,即填報內(nèi)容需與第三方數(shù)據(jù)匹配,需絕對相同毫無偏差,才能視為真實。
(1)數(shù)據(jù)實時性高。通過與官方數(shù)據(jù)對比,實際與市場監(jiān)督管理部門及知識產(chǎn)權(quán)管理管理部門的數(shù)據(jù)延遲時間在10 天內(nèi)。
(2)可視化統(tǒng)計分析。通過對數(shù)據(jù)歸集和梳理,可形成工商信息及知識產(chǎn)權(quán)信息的數(shù)據(jù)簡報,可生成數(shù)據(jù)可視化界面如折線圖、柱形圖、餅形圖等,作為輔助評審決策的依據(jù)。
廣東省科學技術(shù)情報研究所創(chuàng)業(yè)孵化中心作為孵化載體認定項目管理的專業(yè)機構(gòu),研發(fā)及運用了申報資料校驗系統(tǒng),對2020 年度孵化載體資質(zhì)認定項目的申報資料采用了真實性校驗,主要是校驗申報填報在孵企業(yè)的工商信息和知識產(chǎn)權(quán)信息的真實性。校驗結(jié)果如下,對在孵企業(yè)工商信息進行真實校驗6 398 項,主要校驗在孵企業(yè)工商信息的真實性,正確率為85%;知識產(chǎn)權(quán)校驗總數(shù)13 624 項,主要是校驗知識產(chǎn)權(quán)(專利、商標、版權(quán))的真實性,校驗正確率為82%。具體內(nèi)容詳見表3。對系統(tǒng)校驗的結(jié)果進行20%以上的人工抽查,與官方網(wǎng)站數(shù)據(jù)對比工商信息及知識產(chǎn)權(quán)信息,判斷準確率達100%。

表3 工商信息及知識產(chǎn)權(quán)信息校驗結(jié)果統(tǒng)計 單位:項
通過加強事前對孵化載體申報資料的真實性校驗,提高了形式審查的準確率及審查效率,對判斷申報資料的真實性起到關(guān)鍵作用,隔絕了虛假的申報資料,有效地控制虛假申報進入評審環(huán)節(jié),使風險管理能力明顯改善,項目質(zhì)量明顯提高,運用新的技術(shù)手段化解審計風險,及時解決了審計部門對2019 年科技孵化育成體系專項資金提出的問題,避免管理風險循環(huán)發(fā)生,孵化載體資質(zhì)認定項目管理工作的經(jīng)驗值得借鑒及推廣示范。
本文基于孵化載體資質(zhì)認定管理工作的需求,只針對工商信息及知識產(chǎn)權(quán)信息的校驗方法及實踐進行研究,可校驗的維度仍然受限,后續(xù)將加快完善可校驗的類別,增加社保人數(shù)、上市企業(yè)、融資歷程、投資機構(gòu)、行政處罰、稅收違法、嚴重違法、論文、稅收情況、歐美日國際專利、ISO、獎勵、CMMI、植物新品種、國家級農(nóng)作物品種、國家一級中藥保護品種、國家新藥、集成電路布圖設計等企業(yè)常用資質(zhì)。例如社保人數(shù)的數(shù)據(jù),可向人社部門或數(shù)字廣東申請調(diào)用接口;論文可以從知網(wǎng)、萬方、維普等機構(gòu)獲取對應的數(shù)據(jù)接口,接入系統(tǒng)進行校驗。同時,還需保障第三方校驗數(shù)據(jù)源頭的充足性,以多方數(shù)據(jù)源作為校驗邏輯的依據(jù),避免發(fā)生誤判。
(1)引導專業(yè)機構(gòu)做好項目管理“守門人”。加強科技項目申報資料的事前審查,把好第一道關(guān)。借鑒本文研究內(nèi)容基礎上,要進一步加強專業(yè)機構(gòu)以風險防范為基礎的管理意識,以事加強前形式審查為重點,以有效的手段或工具為支撐,以校驗結(jié)果為保障,通過加強形式審查,防范審計風險。建議加強省新型研發(fā)機構(gòu)、省工程中心、重點實驗室、重點研發(fā)計劃等計劃項目的事前審查,對申報的佐證材料進行“應驗盡驗”,排除后顧之憂。
(2)加強項目風險預判及管理。應對項目風險需加強挖掘項目管理潛在的風險和引起這些風險的內(nèi)外部因素、項目風險的征兆與表現(xiàn)等,準確地分析和處理在科技項目中可能出現(xiàn)的風險,對項目風險應對措施計劃進行不斷更新與完善。當前和今后一個時期,要把防范審計風險作為一項緊迫的任務,切實抓好風險防范。建立一套符合科技項目管理自身情況的風險管理框架,最大限度地減少風險的發(fā)生概率和可能造成的不良影響,從而保證科技項目的順利實施。
(3)落實科學技術(shù)活動違規(guī)行為處理措施。為規(guī)范科學技術(shù)活動違規(guī)行為處理,營造風清氣正的良好科研氛圍,按照科學技術(shù)部令第19 號《科學技術(shù)活動違規(guī)行為處理暫行規(guī)定》,發(fā)現(xiàn)在科學技術(shù)活動的申報、評審、實施、驗收、監(jiān)督檢查和評估評價等活動中提供虛假材料,應對申報單位或相關(guān)責任人采取嚴格處罰措施。根據(jù)負面影響或財政資金損失的嚴重程度,禁止申報單位或相關(guān)責任人在一定期限內(nèi)承擔或參與財政性資金支持的科學技術(shù)活動;記入科研誠信嚴重失信行為數(shù)據(jù)庫。造成特別嚴重負面影響或財政資金損失,應采用頂格處罰,對違規(guī)單位和個人取消5年以上直至永久相關(guān)資格。