馮春雨,馮均科(博士生導(dǎo)師),鐘越華,王 鑫
當(dāng)前,我國正處于實現(xiàn)“兩個一百年”奮斗目標(biāo)的歷史交匯期。在中國共產(chǎn)黨的領(lǐng)導(dǎo)下,我國在政治、經(jīng)濟(jì)、文化和科技等方面取得了舉世矚目的偉大成就,但是也存在體制障礙、分配不公和環(huán)境污染等問題,國家機(jī)關(guān)、行政事業(yè)單位的治理不當(dāng)往往成為激發(fā)社會矛盾的導(dǎo)火索,由此引發(fā)大規(guī)模公共輿論事件。根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心在2021年9月15日發(fā)布的第48次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》的綜述部分,截至2021年6月,我國網(wǎng)民規(guī)模達(dá)10.11億,互聯(lián)網(wǎng)普及率達(dá)71.6%。網(wǎng)絡(luò)化時代社會輿情具有傳播迅速、表述隱匿、真?zhèn)坞y辨及內(nèi)容多樣等特征,這必然會讓審計證據(jù)的類型和來源受到影響并發(fā)生變化,迫使審計機(jī)關(guān)進(jìn)行改革和轉(zhuǎn)型,以期得到更為全面和精準(zhǔn)的審計結(jié)果。習(xí)近平總書記在2017年10月18日中國共產(chǎn)黨第十九次全國代表大會的報告中指出,“構(gòu)建黨統(tǒng)一指揮、全面覆蓋、權(quán)威高效的監(jiān)督體系,把黨內(nèi)監(jiān)督同國家機(jī)關(guān)監(jiān)督、民主監(jiān)督、司法監(jiān)督、群眾監(jiān)督、輿論監(jiān)督貫通起來,增強(qiáng)監(jiān)督合力”。實施大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲?,對被審計單位輿情?shù)據(jù)進(jìn)行審計分析正是將群眾監(jiān)督、輿論監(jiān)督和審計監(jiān)督貫通起來的有力舉措,有助于推動國家審計更好地服務(wù)于國家治理。
現(xiàn)行審計由于在眾多方面存在缺陷已不能滿足如今的審計需求,本文通過將現(xiàn)行審計和大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲嬤M(jìn)行對比(如表1所示)反襯出實施輿情導(dǎo)向?qū)徲嫷谋匾浴?/p>

表1 現(xiàn)行審計和大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲媽Ρ?/p>
現(xiàn)行審計在范圍上通常僅局限于對被審計單位財務(wù)和業(yè)務(wù)系統(tǒng)中的內(nèi)部數(shù)據(jù)和檔案數(shù)據(jù)進(jìn)行抽樣審計,這些數(shù)據(jù)由被審計單位生成、整理和傳遞。同時,數(shù)據(jù)來源單一和數(shù)據(jù)量有限等問題也意味著其不能全面地反映被審計單位情況。在實施時間上,現(xiàn)行審計主要為事后審計和分期審計,審計工作量通常集中于被審計單位經(jīng)濟(jì)業(yè)務(wù)結(jié)束之后。而審計監(jiān)督全覆蓋則要求實現(xiàn)審計領(lǐng)域全覆蓋、審計內(nèi)容全覆蓋以及審計周期全覆蓋,顯然,現(xiàn)行審計存在的審計證據(jù)搜集不全和審計結(jié)果反饋滯后等固有缺陷已經(jīng)成為阻礙審計監(jiān)督全覆蓋實現(xiàn)的重要因素。由于新聞、音頻流、視頻流、手機(jī)錄音和社交媒體評論可作為數(shù)據(jù)引入,新形式的審計證據(jù)隨之產(chǎn)生,因此大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嬤x擇將審計范圍延伸至輿情領(lǐng)域。輿情數(shù)據(jù)是由審計人員直接獲取的外部數(shù)據(jù),相較于內(nèi)部數(shù)據(jù)而言,其被篡改的可能性更低。同時,外部數(shù)據(jù)還有助于提供預(yù)測性和規(guī)范性分析所需的前瞻性信息,據(jù)此生成的審計證據(jù)是對現(xiàn)行審計證據(jù)的有力補(bǔ)充。大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嫴粌H能夠做到對現(xiàn)行審計領(lǐng)域和內(nèi)容的補(bǔ)充,通過多維度的審計分析來拓展審計監(jiān)督的廣度和深度,同時也可以分散審計工作量,推動審計由事后監(jiān)督向事前、事中和事后全過程實時漸進(jìn)式監(jiān)督轉(zhuǎn)變。
國家審計是具有揭示、抵御和預(yù)防功能的“免疫系統(tǒng)”。其中,揭示功能是審計與生俱來的基本功能之一,現(xiàn)行審計大都可以通過審查被審計單位的財務(wù)報告等會計資料來揭示財政財務(wù)收支在真實性和合法性等方面的問題,但是抵御功能和預(yù)防功能還有待進(jìn)一步完善。大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嬁梢詫崿F(xiàn)對完整輿情發(fā)展周期不同類型數(shù)據(jù)的全過程實時搜集、存儲和處理,這不僅貼合了及時預(yù)警的要求,還可以讓審計機(jī)關(guān)更好地從宏觀層面上了解被審計單位。除此之外,大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嬕髮Ρ粚徲媶挝贿M(jìn)行“雙向?qū)Ρ确治觥?,完成同一被審計單位不同時期輿情數(shù)據(jù)的縱向?qū)Ρ确治龊筒煌粚徲媶挝煌粫r期輿情數(shù)據(jù)的橫向?qū)Ρ确治觯軌虼_保實現(xiàn)全面的查錯糾弊,剖析問題出現(xiàn)的原因,進(jìn)而提出切實可行的建議,幫助被審計單位就查出的問題進(jìn)行改正,由此推進(jìn)審計抵御功能的實現(xiàn)。
1.審計實施前審計機(jī)關(guān)和被審計單位之間的信息不對稱。造成這種情況的主要原因在于數(shù)據(jù)的完整性、準(zhǔn)確性和真實性未得到有效保障。現(xiàn)行審計主要是憑借被審計單位提供的財務(wù)和業(yè)務(wù)數(shù)據(jù)來開展工作,獲取的信息并不全面并且被審計單位很可能會出于對自身利益的維護(hù)來掩蓋和隱藏真實信息而向?qū)徲嫏C(jī)關(guān)提供缺漏、不完整和虛假的數(shù)據(jù),所采取的“抽樣審計”方法也同樣可能會讓被審計單位在信息不對稱問題上“鉆空子”,誘導(dǎo)審計人員抽取正常信息,從而避開對問題信息的審查。針對這些問題,大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嬐黄屏爽F(xiàn)行審計的數(shù)據(jù)采集范圍并由審計人員自行采集被審計單位輿情數(shù)據(jù),同時將被審計單位提供的財務(wù)和業(yè)務(wù)數(shù)據(jù)中反映的問題和審計人員自行搜集的輿情數(shù)據(jù)中反映的問題進(jìn)行比對、驗證,規(guī)避以往對被審計單位提供材料依賴性過大而導(dǎo)致審計質(zhì)量較低和審計風(fēng)險較高的問題。
2.審計實施中審計機(jī)關(guān)、被審計單位和公眾之間的信息不對稱?,F(xiàn)行審計多是在審計機(jī)關(guān)和被審計單位兩方主體之間進(jìn)行,很少會考慮將公眾需求納入其中。一方面,公眾雖然知曉被審計單位隱藏的問題并存在相關(guān)意見,但卻苦于沒有合適的渠道向?qū)徲嫏C(jī)關(guān)反映和傳遞,只能被動地等待審計結(jié)果公告的發(fā)布;另一方面,公眾渴望更多地了解被審計單位,但目前審計結(jié)果公告的信息含量尚不能達(dá)到公眾期望。大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲媽δ軌蚍从彻娦枨蟮妮浨閿?shù)據(jù)進(jìn)行分析,可以將作為外部監(jiān)督力量的群眾監(jiān)督、輿論監(jiān)督和作為內(nèi)部監(jiān)督力量的審計監(jiān)督有效整合起來,形成多重監(jiān)督的保障,增強(qiáng)監(jiān)督合力。
3.審計實施后審計機(jī)關(guān)和被審計單位之間的信息不對稱?,F(xiàn)行審計“屢審屢犯、屢犯屢改”的惡性循環(huán)的持續(xù)存在在很大程度上是因為審計結(jié)果的反饋和運用不佳所致。大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嬐ㄟ^向被審計單位傳輸可視化輿情導(dǎo)向?qū)徲嫹治鰣蟾鎭韼椭嵘龑徲嫏C(jī)關(guān)和被審計單位之間的溝通效率,避免被審計單位對于審計機(jī)關(guān)提出的問題和建議理解不準(zhǔn)確進(jìn)而整改不到位的現(xiàn)象重復(fù)上演。
大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲嫷膶徢皽?zhǔn)備工作應(yīng)根據(jù)輿情導(dǎo)向?qū)徲嫷膶嶋H需求來單獨成立審計組和制訂審計計劃。第一步是分別組建輿情導(dǎo)向?qū)徲嬓〗M和現(xiàn)場審計小組。第二步是簽發(fā)審計通知書。由于被審計單位的輿情數(shù)據(jù)中可能會涉及工作秘密甚至國家機(jī)密,為了維護(hù)被審計單位的數(shù)據(jù)安全和信息權(quán)利,也為了方便后續(xù)的信息獲取和人員溝通,審前準(zhǔn)備的第二步就是簽發(fā)審計通知書,能夠使大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲媽嵤┲械臄?shù)據(jù)獲取擁有合法依據(jù)。第三步是進(jìn)行審前調(diào)查。除像其他大數(shù)據(jù)審計一樣去了解被審計單位的基本信息和開展信息系統(tǒng)審計之外,基于大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲嫷奶厥庑裕瑢徲嫏C(jī)關(guān)還要對被審計單位的大數(shù)據(jù)輿論環(huán)境進(jìn)行剖析,初步掌握被審計單位輿情數(shù)據(jù)來源和渠道的多少、信息量的大小以及不同類型信息的占比,基本了解被審計單位的政務(wù)公開程度、與新聞媒體的合作程度和輿論管理程度等。此外,由于大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嬓枰獙Χ鄦挝贿M(jìn)行數(shù)據(jù)采集,所以還應(yīng)事先調(diào)查各單位以往的配合程度,以便提前籌劃好應(yīng)對策略。最后一步是制訂有指向性的審計實施方案。其中除包括審計目標(biāo)和審計范圍等常規(guī)內(nèi)容之外,還特別要根據(jù)重要性水平來確定輿情數(shù)據(jù)的來源、渠道和精準(zhǔn)程度,明確數(shù)據(jù)采集范圍、采集方式和采集標(biāo)準(zhǔn)等,確定適宜采用的應(yīng)用程序、數(shù)據(jù)處理和分析技術(shù)。
由于被審計單位輿情信息來源廣泛,涉及網(wǎng)絡(luò)信息、媒體信息和舉報信息等,因此審計人員應(yīng)盡可能地拓寬信息獲取渠道,搜羅多種結(jié)構(gòu)和形式的數(shù)據(jù)。數(shù)據(jù)采集工作可選用線下紙質(zhì)材料和線上電子數(shù)據(jù)相結(jié)合的采集方式,如表2所示。

表2 大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲嫷臄?shù)據(jù)采集
其中,在采集線下紙質(zhì)材料時可以先利用掃描儀將報紙、雜志、書籍和舉報信等材料轉(zhuǎn)化為圖像文件,然后再通過ABBYY FineReader和漢王等常用OCR軟件將圖像文件識別為可被計算機(jī)讀取和編輯的電子文檔。而線上電子數(shù)據(jù)的采集則可在網(wǎng)頁數(shù)據(jù)采集器或者網(wǎng)絡(luò)爬蟲技術(shù)之間進(jìn)行選擇,抓取網(wǎng)站網(wǎng)頁、微博和微信等網(wǎng)絡(luò)輿情載體上的輿情信息。若審計機(jī)關(guān)中缺乏信息技術(shù)人才,則可以應(yīng)用樂思網(wǎng)絡(luò)信息采集系統(tǒng)和Octoparse等網(wǎng)頁數(shù)據(jù)采集器來抓取數(shù)據(jù),其易用性強(qiáng),不要求審計人員具備編程能力。而若審計機(jī)關(guān)擁有掌握大數(shù)據(jù)技術(shù)的復(fù)合型審計人才,鑒于網(wǎng)頁數(shù)據(jù)采集軟件效率低、靈活性差和收費高等弊端,審計機(jī)關(guān)應(yīng)首選組建自己的爬蟲團(tuán)隊來爬取網(wǎng)頁數(shù)據(jù)。首先明確爬取目的,確定要抓取數(shù)據(jù)的格式和范圍,然后再對數(shù)據(jù)所在網(wǎng)頁進(jìn)行結(jié)構(gòu)分析,利用Java和Python等語言編寫程序代碼來實現(xiàn)數(shù)據(jù)抓取。同時,審計人員還可依據(jù)審計需求使用不同類型的網(wǎng)絡(luò)爬蟲。日常審計業(yè)務(wù)可以采用最常見的通用網(wǎng)絡(luò)爬蟲最大范圍地對全網(wǎng)數(shù)據(jù)進(jìn)行爬取;在數(shù)據(jù)更新進(jìn)行二次采集時,利用增量式網(wǎng)絡(luò)爬蟲來爬取內(nèi)容變化網(wǎng)頁或新增網(wǎng)頁;由于審計任務(wù)的特殊性,若只需要對特定數(shù)據(jù)進(jìn)行采集,則可運用聚焦網(wǎng)絡(luò)爬蟲來爬取預(yù)定主題的網(wǎng)頁信息。
值得注意的是,大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嫼推渌愋蛯徲嬙跀?shù)據(jù)采集方面的最大差異莫過于舉報信息的采集,如表3所示。

表3 大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲嫷呐e報信息采集
其他類型審計的數(shù)據(jù)采集工作一般不會涉及舉報信息,而在大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嬛?,舉報信息則成為必備分析材料且獲取難度最大。一是因為我國設(shè)置了電話舉報、當(dāng)面舉報、信函舉報和網(wǎng)上舉報等多種舉報渠道,可采用不同的方法來獲取信息。針對信函舉報和網(wǎng)上舉報,利用上文提到的OCR技術(shù)和網(wǎng)絡(luò)爬蟲技術(shù)即可實現(xiàn);針對電話舉報,可采用語音識別技術(shù)將舉報通話錄音中的內(nèi)容轉(zhuǎn)換為計算機(jī)可讀的輸入;針對當(dāng)面舉報,審計人員除可通過與舉報接待人進(jìn)行訪談來獲取舉報內(nèi)容外,還應(yīng)向相關(guān)部門索取舉報證據(jù)材料以及舉報接待人筆錄,利用自然語言處理技術(shù)中的語音識別和OCR技術(shù)來實現(xiàn)信息錄入。二是舉報投訴受理部門包括檢察院、紀(jì)委和監(jiān)察部門等,因此審計機(jī)關(guān)應(yīng)事先制定好多部門協(xié)同和多方式采集的特殊解決方案來鏟除信息溝通障礙。同時,法律保障也是打破各單位之間信息壁壘的重要“法寶”。例如2021年10月新修訂的《審計法》在第四章第三十五條中新增:“國家政務(wù)信息系統(tǒng)和數(shù)據(jù)共享平臺應(yīng)當(dāng)按照規(guī)定向?qū)徲嫏C(jī)關(guān)開放?!边@給審計機(jī)關(guān)的數(shù)據(jù)收集提供了較大便利。三是由于舉報材料屬于國家機(jī)密,所以舉報受理部門通常都會依據(jù)有關(guān)保密規(guī)定來嚴(yán)格落實保密要求,這尤為增加了審計機(jī)關(guān)獲取舉報信息的難度。對此,審計署作為全國最高審計機(jī)關(guān),應(yīng)加強(qiáng)與各單位的溝通和協(xié)作,在不違背各單位信息保護(hù)規(guī)定的前提下為下層審計機(jī)關(guān)爭取更多的信息獲取權(quán)限。審計人員也應(yīng)增強(qiáng)保密意識,對在審計過程中知悉的國家秘密、工作秘密以及個人信息等予以嚴(yán)格保密,特別是還要做好信息系統(tǒng)安全、網(wǎng)絡(luò)安全和數(shù)據(jù)安全工作以防止信息泄露。
大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲媽嵤┻^程中要進(jìn)行兩次數(shù)據(jù)存儲。第一次數(shù)據(jù)存儲的對象是數(shù)據(jù)采集后得到的未經(jīng)處理的“臟數(shù)據(jù)”,這部分?jǐn)?shù)據(jù)并不會直接用于后續(xù)的數(shù)據(jù)分析,只需依據(jù)其類型的不同分別存儲到相應(yīng)的數(shù)據(jù)庫中。利用Google的GFS和開源的HDFS等分布式文件系統(tǒng)來存儲非結(jié)構(gòu)化數(shù)據(jù),利用Redis、HBase、MongoDB和Neo4J等NoSQL數(shù)據(jù)庫來存儲半結(jié)構(gòu)化數(shù)據(jù),利用MySQL等關(guān)系型數(shù)據(jù)庫來存儲結(jié)構(gòu)化數(shù)據(jù)。第二次數(shù)據(jù)存儲的對象則是利用ETL工具進(jìn)行數(shù)據(jù)抽取、數(shù)據(jù)清洗和數(shù)據(jù)加載之后得到的標(biāo)準(zhǔn)“干凈數(shù)據(jù)”。由于下一步這些數(shù)據(jù)將應(yīng)用于綜合分析,而相較于數(shù)據(jù)庫,數(shù)據(jù)倉庫具有容量大,方便數(shù)據(jù)查詢、挖掘和分析等優(yōu)點,所以審計機(jī)關(guān)應(yīng)選擇合適的ETL工具來輔助構(gòu)建自己的數(shù)據(jù)倉庫以用于存儲這部分?jǐn)?shù)據(jù)。常見ETL工具包括Kettle和Informatica等。然后再利用Python進(jìn)行文本分詞、去停用詞、特征選擇以及文本向量化等操作,為后續(xù)的數(shù)據(jù)綜合分析做好準(zhǔn)備。
數(shù)據(jù)存儲工作應(yīng)當(dāng)細(xì)化,在審計機(jī)關(guān)的層面上設(shè)置能夠存儲所有詳細(xì)數(shù)據(jù)的總數(shù)據(jù)倉庫,在審計機(jī)關(guān)各內(nèi)設(shè)機(jī)構(gòu)層面還應(yīng)根據(jù)不同的部門需求來設(shè)置從屬型數(shù)據(jù)集市,這有利于后期的數(shù)據(jù)應(yīng)用和共享。因為總數(shù)據(jù)倉庫的龐大數(shù)據(jù)量會降低查詢效率,而從屬型數(shù)據(jù)集市存儲的是來源于總數(shù)據(jù)倉庫中的重新組織后的概括和匯總數(shù)據(jù),方便數(shù)據(jù)的二次調(diào)取,能夠提升查詢速度。此外,出于對涉密信息的保護(hù),審計機(jī)關(guān)應(yīng)將低敏感度數(shù)據(jù)和高敏感度數(shù)據(jù)分開存儲??紤]到云存儲在安全性方面仍存在爭議,所以應(yīng)將高敏感度數(shù)據(jù)存儲于審計機(jī)關(guān)的本地數(shù)據(jù)庫并設(shè)置嚴(yán)格的身份認(rèn)證和訪問控制,以防泄露風(fēng)險,而可共享的低敏感度輿情數(shù)據(jù)則可依靠云服務(wù)供應(yīng)商提供的云存儲服務(wù)來實現(xiàn)云端存儲,推動各級單位和各部門之間的數(shù)據(jù)共享。
大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲嬎鸭降妮浨閿?shù)據(jù)具有來源渠道多和數(shù)據(jù)量大等特征,因而審計人員無需再因數(shù)據(jù)不足而苦惱,反而要為信息過載而擔(dān)憂。使用真實性不確定的大數(shù)據(jù)難以讓人心安,因為這挑戰(zhàn)了審計標(biāo)準(zhǔn)中對可靠、有力的審計證據(jù)的要求,因而進(jìn)行信息可靠性的核實以及數(shù)據(jù)質(zhì)量的檢驗開始成為審計人員一項新的挑戰(zhàn)。審計人員還應(yīng)針對辨別結(jié)果與被審計單位進(jìn)行溝通,根據(jù)被審計單位的反饋來最終確定將哪些數(shù)據(jù)應(yīng)用于審計分析之中。驗證信息的可靠程度可以從信息發(fā)布的作者、渠道、時效以及被審計單位是否進(jìn)行了輿論管理等方面加以考察。一般而言,由專家和資深媒體人士編寫的,發(fā)布于專業(yè)刊物和官方媒體上的,時效性強(qiáng)并且未經(jīng)人為操縱和調(diào)整的信息較為可靠。審計機(jī)關(guān)可將上述幾個維度作為評價標(biāo)準(zhǔn),利用大數(shù)據(jù)分析技術(shù)來對所搜集到的被審計單位輿情信息進(jìn)行判斷和歸類,保留真實和可靠信息用于數(shù)據(jù)分析,排除虛假和無效信息對分析結(jié)果準(zhǔn)確性的干擾。而對于數(shù)據(jù)質(zhì)量的檢驗則可以將準(zhǔn)確性、完整性、一致性、唯一性、適時性、有效性作為衡量指標(biāo),并對數(shù)據(jù)來源的安全性加以考慮,或者利用Data-Flux、Informatica和華矩數(shù)據(jù)診所等數(shù)據(jù)質(zhì)量評估工具來直接獲取數(shù)據(jù)質(zhì)量評估結(jié)果。
1.輿情主體及其社會網(wǎng)絡(luò)分析。從輿情導(dǎo)向?qū)徲嬁倲?shù)據(jù)倉庫中抽取有關(guān)輿情主體的數(shù)據(jù),構(gòu)建出每個輿情主體的用戶畫像標(biāo)簽體系,利用Ucinet和NetMiner等社會網(wǎng)絡(luò)分析工具來研判每一個輿情主體的社會網(wǎng)絡(luò)關(guān)系。通過觀察本輪輿情群體的特征來了解被審計單位在本輪“輿情危機(jī)”中主要是觸犯到了哪一部分群眾的利益,進(jìn)而可以在現(xiàn)場審計時有目的地實地走訪和調(diào)查這一部分群眾。實質(zhì)上,分析輿情主體及其社會網(wǎng)絡(luò)關(guān)系所得到的信息是舉報信息的延伸,因為現(xiàn)實中很多群眾并不傾向于利用舉報手段來維護(hù)自己的權(quán)益,這時就需要審計人員依據(jù)輿情導(dǎo)向?qū)徲嫷姆治龀晒麃磉M(jìn)行深入的群眾訪談,真正貫徹好審計為民的理念。
2.輿情主題分析。被審計單位輿情數(shù)據(jù)來源于線上、線下各種不同的輿情載體,所以文本類型的長度并不統(tǒng)一。因此,應(yīng)根據(jù)數(shù)據(jù)特性來選擇相應(yīng)的方法進(jìn)行核心輿情主題的發(fā)現(xiàn)和提取,采用LDA算法對長文本類型的數(shù)據(jù)進(jìn)行處理,而對短文本類型的數(shù)據(jù)則采用K-means算法。據(jù)此確定的核心輿情主題能夠充分地反映出群眾關(guān)切和不滿,或許能夠從側(cè)面揭示出被審計單位存在的問題。而在提取完核心輿情主題之后,審計人員還可以構(gòu)建基于核心輿情主題共線網(wǎng)絡(luò)的鏈路預(yù)測模塊來對關(guān)聯(lián)輿情主題進(jìn)行精準(zhǔn)預(yù)測,通過擴(kuò)大輿情審計的主題涉及范圍來增強(qiáng)現(xiàn)場審計中對被審計單位的審查力度,實現(xiàn)對被審計單位“地毯式”不留死角的全方位檢查。
3.輿情歸類分析。輿情歸類分析包括輿情發(fā)展階段分析、輿情嚴(yán)重程度分析和輿情緊急程度分析三個組成部分。通過構(gòu)建網(wǎng)絡(luò)輿情傳播的Logistic模型來分析得出網(wǎng)絡(luò)輿情傳播的關(guān)鍵時間節(jié)點以及輿情發(fā)展階段,再依據(jù)各輿情發(fā)展階段轉(zhuǎn)換時的時間變化特征來確定輿情緊急程度,為輿情預(yù)警工作的開展做好鋪墊。而輿情嚴(yán)重程度的分析則是制定現(xiàn)場審計實施方案的重要參考因素,被審計單位所面臨輿情的嚴(yán)重程度直接影響到現(xiàn)場審計的工作量,對于輕度輿情和中度輿情,審計小組在進(jìn)行現(xiàn)場審計時可以制定和選用常規(guī)化審計實施方案,而面對重大輿情和特重輿情時,則應(yīng)在匯集整個審計小組成員意見的基礎(chǔ)上,根據(jù)輿情特質(zhì)來精準(zhǔn)制定非常規(guī)化審計實施方案,增加必要的審計程序,以堅持審計謹(jǐn)慎性原則。
4.輿情情感分析。應(yīng)用文本傾向性分析技術(shù)來判斷輿情是屬于正面輿情還是負(fù)面輿情。審計人員應(yīng)尤為關(guān)注被審計單位的負(fù)面輿情,因為負(fù)面輿情往往更能揭露出被審計單位的風(fēng)險領(lǐng)域。本文參考王蘭成在MNPOS系統(tǒng)設(shè)計中對傾向性分析的應(yīng)用,采用機(jī)器學(xué)習(xí)算法對被審計單位的輿情信息進(jìn)行傾向性分析?;趪覍徲嬁腕w(國家機(jī)關(guān)、行政事業(yè)單位和國有企業(yè))通常面臨的輿論事件種類,在系統(tǒng)中設(shè)置七個類別(涉政策制定及執(zhí)行、涉財政財務(wù)及經(jīng)濟(jì)效益、涉公共權(quán)力、涉民生問題及公眾利益、涉人事任命及調(diào)動、涉社會安全和涉法涉訴),每個類別下的文本依據(jù)其內(nèi)容分為正面和負(fù)面兩類,然后再訓(xùn)練出兩個分類器,七個類別即可生成十四個分類器,并使用審計人員易于辨析的符號來標(biāo)注正面信息和負(fù)面信息。例如,在“涉政策制定及執(zhí)行”這一類別下訓(xùn)練出“正面涉政策制定及執(zhí)行”和“負(fù)面涉政策制定及執(zhí)行”兩個分類器。
審計機(jī)關(guān)應(yīng)運用大數(shù)據(jù)和人工智能技術(shù)對被審計單位輿情進(jìn)行實時監(jiān)測,從而實現(xiàn)輿情預(yù)警。有效發(fā)揮輿情監(jiān)測預(yù)警系統(tǒng)功能的關(guān)鍵是選取科學(xué)、合理的輿情預(yù)警指標(biāo),將前述從輿情發(fā)展階段分析、輿情嚴(yán)重程度分析、輿情緊急程度分析以及輿情情感分析中得到的輿情嚴(yán)重度、緊急度、發(fā)展速度、情感方向和涉及范圍等要素作為輿情預(yù)警指標(biāo)體系構(gòu)建的重要參考因素,并在計算出上述單個指標(biāo)值之后采取智能評定和專家評估相結(jié)合的方法來確定各指標(biāo)權(quán)重,系統(tǒng)最終自動輸出每個被審計單位每輪輿情的輿情預(yù)警指標(biāo)總值。審計人員事先在系統(tǒng)中設(shè)定好輿情警戒閾值,使得輿情預(yù)警指標(biāo)總值和輿情警戒閾值能夠?qū)崿F(xiàn)在系統(tǒng)中的實時自動比對,一旦超過了輿情警戒閾值,則系統(tǒng)自動報警。在此之后,采用德爾菲法和情境分析法等來判斷系統(tǒng)報警的異常數(shù)據(jù)中哪些為潛在風(fēng)險征兆,最終歸納、梳理成方便現(xiàn)場審計人員查閱和理解的預(yù)警提示信息。系統(tǒng)同時還可以依據(jù)外部狀況的變化和審計人員的需求來實現(xiàn)閾值的自動調(diào)整。通過設(shè)定高低不同的輿情警戒閾值來劃分輿情預(yù)警等級。若被審計單位沒有條件和能力自行設(shè)計輿情監(jiān)測預(yù)警系統(tǒng),則也可以通過購買清博輿情和識微商情等國內(nèi)成熟輿情監(jiān)控預(yù)警平臺的服務(wù)來實現(xiàn)預(yù)警目的。輿情自動預(yù)警功能對于現(xiàn)場審計工作具有重要的參考價值。當(dāng)有多個被審計單位等待審計機(jī)關(guān)進(jìn)行審計時,現(xiàn)場審計應(yīng)首先在出現(xiàn)預(yù)警提示的被審計單位中開展,且預(yù)警等級越高意味著緊迫性越強(qiáng),就應(yīng)放置在審計機(jī)關(guān)審計任務(wù)的前列。
“一圖勝千言”,審計人員應(yīng)通過使用Tableau Public和Power BI等工具對輿情導(dǎo)向?qū)徲嫹治鰣蟾孢M(jìn)行可視化處理。大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嫹治鰣蟾娌煌趥鹘y(tǒng)審計報告主要向被審計單位發(fā)表審計意見,其報告內(nèi)容包含輿情主體及其社會網(wǎng)絡(luò)分析、輿情主題分析、輿情歸類分析和輿情情感分析四個板塊。要實現(xiàn)分析結(jié)果的可視化,首先應(yīng)將初步輿情審計分析結(jié)果套用到審計分析報告標(biāo)準(zhǔn)模板中,形成格式統(tǒng)一、內(nèi)容系統(tǒng)的輿情導(dǎo)向?qū)徲嫹治鰣蟾?,然后再利用可視化工具將輿情?dǎo)向?qū)徲嫹治鰣蟾娴膬?nèi)容轉(zhuǎn)換成直觀、清晰并易于理解的圖形和圖表,只輔以必要的文字說明,從而幫助現(xiàn)場審計人員迅速定位重要的輿情數(shù)據(jù)信息以更快地發(fā)現(xiàn)審計疑點,最終生成可視化輿情導(dǎo)向?qū)徲嫹治鰣蟾?。之后,審計機(jī)關(guān)應(yīng)利用網(wǎng)絡(luò)把部署在審計機(jī)關(guān)輿情導(dǎo)向?qū)徲嫹治鱿到y(tǒng)中的預(yù)警提示信息和可視化輿情導(dǎo)向?qū)徲嫹治鰣蟾鎮(zhèn)鬏數(shù)浆F(xiàn)場審計小組的PC端或移動端。若輸送內(nèi)容具有保密要求,則可以采用加密專線方式進(jìn)行傳輸。在全部審計工作結(jié)束之后,還可以將剔除掉涉密和敏感信息后的可視化輿情導(dǎo)向?qū)徲嫹治鰣蟾胬镁W(wǎng)絡(luò)輸送至被審計單位,以幫助被審計單位更好地理解審計機(jī)關(guān)的整改建議。
大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲嫷牧鞒淌菄@審計署“總體分析、系統(tǒng)研究、發(fā)現(xiàn)疑點、分散核實、精確定位”數(shù)字化審計模式的作業(yè)目標(biāo)來設(shè)計的。大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嬝?fù)責(zé)的是“總體分析、系統(tǒng)研究、發(fā)現(xiàn)疑點”,而接下來的現(xiàn)場審計負(fù)責(zé)的則是“分散核實、精確定位”,所以審計機(jī)關(guān)必須認(rèn)識到大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嫼同F(xiàn)場審計之間并不是一種替代與被替代的關(guān)系,而是在相互銜接的基礎(chǔ)上形成的相輔相成關(guān)系。大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嬁赡軙驗閿?shù)據(jù)質(zhì)量等問題而出現(xiàn)漏洞,最終得到的也只是針對被審計單位輿情狀況而發(fā)現(xiàn)的一些可疑點和審計線索。審計人員應(yīng)根據(jù)數(shù)據(jù)得出結(jié)論,但同時還要依靠其經(jīng)驗和專業(yè)判斷。因此,大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嫴⒉荒苋〈F(xiàn)場審計。
首先,現(xiàn)場審計小組可以利用輿情導(dǎo)向?qū)徲嫹治鼋Y(jié)果來有針對性地制訂現(xiàn)場審計計劃。根據(jù)之前分析得到的被審計單位風(fēng)險類型和程度來確定審計范圍、重點審計領(lǐng)域和應(yīng)采取的審計程序,并將每次審計任務(wù)的重點審計領(lǐng)域和審計組成員的專長相匹配來進(jìn)行審計人員的選派和分工,實現(xiàn)審計資源的有效整合。其次,輿情導(dǎo)向?qū)徲嫹治鲋兴l(fā)現(xiàn)的被審計單位此次輿情的主題很可能暗藏著被審計單位存在的可疑點和風(fēng)險點,所以現(xiàn)場審計小組應(yīng)將其作為審計重點,進(jìn)行深入的實地調(diào)查,以此來確定被審計單位的問題。再次,現(xiàn)場審計小組可以通過發(fā)揮現(xiàn)場審計的優(yōu)勢來對輿情導(dǎo)向?qū)徲嬎鶡o法完成的審計工作進(jìn)行收尾。例如,派遣審計人員對輿情主體分析中確定的活躍輿情群體進(jìn)行實地訪談,將現(xiàn)場訪談形成的語音轉(zhuǎn)化為文本信息,然后利用自然語言處理技術(shù)自動分析文本內(nèi)容,提取關(guān)鍵點,分析公眾答復(fù)的矛盾之處、高頻詞和群眾關(guān)心事項,對輿情導(dǎo)向?qū)徲嫹治鼋Y(jié)果進(jìn)行深層挖掘,對被審計單位的問題追根溯源,并將在深入基層過程中收集到的新輿情信息反饋給輿情導(dǎo)向?qū)徲嬓〗M進(jìn)行二次輿情導(dǎo)向?qū)徲?。最后,現(xiàn)場審計小組還可以在審計過程中去核實輿情導(dǎo)向?qū)徲嫷贸龅闹黝}分析的精準(zhǔn)性和預(yù)警的準(zhǔn)確度并在工作結(jié)束后反饋給輿情導(dǎo)向?qū)徲嫿M,幫助其修正和完善輿情導(dǎo)向?qū)徲嫻ぷ髁鞒?,逐步形成輿情?dǎo)向?qū)徲嫻ぷ鞯拈L效機(jī)制。
現(xiàn)場審計對于輿情導(dǎo)向?qū)徲嫷耐七M(jìn)發(fā)揮著重要作用,應(yīng)將大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲嫲l(fā)現(xiàn)的審計線索經(jīng)過現(xiàn)場審計的核實和調(diào)查之后來確定最終的審計分析結(jié)果,具體如圖1所示。

圖1 大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲嫼同F(xiàn)場審計的相輔相成
綜上,大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲嫷牧鞒逃梢陨习藗€步驟組成(如圖2所示),可以通過構(gòu)建大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嫹治銎脚_來實現(xiàn)。

圖2 大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲嫷牧鞒?/p>
首先,應(yīng)改變審計人員的傳統(tǒng)觀念,樹立大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嬎季S。只有讓審計人員從思想和觀念上徹底意識到利用大數(shù)據(jù)技術(shù)對被審計單位輿情進(jìn)行分析的必要性,才能營造組織良好的學(xué)習(xí)氛圍,提高人員學(xué)習(xí)熱情和積極性。
其次,審計機(jī)關(guān)可以采取“外引內(nèi)培”的方式來打造一支綜合技能強(qiáng)硬的復(fù)合型審計隊伍。在“內(nèi)培”方面,審計機(jī)關(guān)應(yīng)根據(jù)每位工作者的職位和能力來分層次進(jìn)行大數(shù)據(jù)審計培訓(xùn):針對審計人員,應(yīng)注重培訓(xùn)其驗證信息和數(shù)據(jù)準(zhǔn)確性以及將大數(shù)據(jù)應(yīng)用于輿情導(dǎo)向?qū)徲媽嵺`的能力,提高其系統(tǒng)實操水平和大數(shù)據(jù)分析本領(lǐng),同時不可“一刀切”,對于有大數(shù)據(jù)應(yīng)用基礎(chǔ)且學(xué)習(xí)能力強(qiáng)的審計人員可直接啟動深層次學(xué)習(xí),而對于零基礎(chǔ)且學(xué)習(xí)能力弱的審計人員則應(yīng)在打牢基礎(chǔ)之后再逐步加深學(xué)習(xí)內(nèi)容;針對管理層人員,培訓(xùn)內(nèi)容應(yīng)聚焦于輿情導(dǎo)向?qū)徲嫮h(huán)境下組織和管理工作的應(yīng)對方面;針對技術(shù)人員,則應(yīng)著重指導(dǎo)配套基礎(chǔ)設(shè)置應(yīng)用和大數(shù)據(jù)技術(shù)更新等內(nèi)容。在“外引”方面:一是深入分析審計機(jī)關(guān)真正的人才需求,據(jù)此制訂人才引進(jìn)計劃。二是應(yīng)加強(qiáng)外部合作,與知名高校、科研機(jī)構(gòu)和新聞媒體等進(jìn)行人才引進(jìn)或聯(lián)合培養(yǎng),并建立起全國審計機(jī)關(guān)人才交流合作和理念互通機(jī)制,打通人才全方位自由流動的梗阻。在人才培養(yǎng)效益低于培養(yǎng)成本時,審計機(jī)關(guān)還可以在掌握工作主導(dǎo)權(quán)的情況下外包部分非核心業(yè)務(wù)或外購部分輔助服務(wù)。同時應(yīng)配置完善的人才激勵措施,推動薪酬分配、福利分享和職位晉升向復(fù)合型人才傾斜。
審計人員有限的時間和精力意味著其目前所擁有的信息技術(shù)知識儲備很難在短時間內(nèi)有重大改變,所以將審計流程的步驟進(jìn)行細(xì)分是一種較為切實可行的解決方案,可以幫助審計人員避免在向數(shù)字業(yè)務(wù)模式轉(zhuǎn)變時被審計任務(wù)的廣泛性和分散性所淹沒。在實施大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲嫷某跗陔A段可以將數(shù)據(jù)分析中復(fù)雜的高端工作交由專業(yè)技術(shù)人員去處理,審計人員只負(fù)責(zé)相對而言更基礎(chǔ)的低端和中端數(shù)據(jù)處理工作,兩者各司其職,分工明確。同時,步驟的細(xì)分不是只局限于審計機(jī)關(guān)或者審計團(tuán)隊內(nèi)部的成員之間,當(dāng)眾多審計人員都反映某個步驟的操作難度較大時,可以將這一步驟交由整個審計團(tuán)隊甚至整個審計機(jī)關(guān)來負(fù)責(zé),即根據(jù)流程中步驟的難易程度讓處于不同職位的審計人員、管理人員或者不同的審計團(tuán)隊甚至是不同的審計機(jī)關(guān)專攻一個自己最擅長、最感興趣的步驟進(jìn)行深入學(xué)習(xí),先保證每個審計機(jī)關(guān)、審計團(tuán)隊、審計人員擁有一部分開展輿情導(dǎo)向?qū)徲嬎匦璧幕局R和技能。這不僅能夠減輕人員學(xué)習(xí)壓力,增強(qiáng)其專業(yè)性,還可以加快大數(shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲嫷耐茝V進(jìn)度。當(dāng)然,后期隨著審計人員數(shù)據(jù)分析技能的不斷提升以及部門分工協(xié)作水平的增強(qiáng),應(yīng)逐步將整個輿情導(dǎo)向?qū)徲嬃鞒痰乃胁襟E交由一個審計機(jī)關(guān)或者審計團(tuán)隊來負(fù)責(zé),這才是在滿足經(jīng)濟(jì)性條件下推進(jìn)輿情導(dǎo)向?qū)徲嫵晒﹂_展的可行途徑。
大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嫴皇枪铝⑦M(jìn)行的,應(yīng)在實施過程中注重各主體之間的合作與配合,形成“上下聯(lián)動”與“左右協(xié)同”的良好局面,保障數(shù)據(jù)和經(jīng)驗的共享。
“上下聯(lián)動”是要加強(qiáng)國家審計署、省審計廳、市審計局和縣審計局四級主體之間的合作,審計署重在規(guī)劃,審計廳重在指導(dǎo)、監(jiān)督,審計局則重在實踐、應(yīng)用。其中,審計署為牽頭領(lǐng)導(dǎo)部門,把控宏觀層面問題,負(fù)責(zé)頂層設(shè)計和全局協(xié)調(diào);審計廳起到承上啟下的主心骨作用,把控中觀層面問題。其上接審計署領(lǐng)導(dǎo),將工作內(nèi)容細(xì)化,下引審計局應(yīng)用,將具體計劃落地,并在審計工作結(jié)束后將全省基層審計局梳理得到的反饋結(jié)果歸納總結(jié)后傳遞給審計署,為審計署下一步的總體規(guī)劃工作提供幫助。審計局為實踐部門,關(guān)注微觀層面的問題,在審計廳的支持和引導(dǎo)下配置好大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嬒到y(tǒng),打通輿情導(dǎo)向?qū)徲嫳O(jiān)督“最后一公里”,并將審計實施過程中的問題和實施結(jié)果反饋給審計廳。特別是在開展輿情導(dǎo)向?qū)徲嫷某跗?,并不是所有的審計機(jī)關(guān)都有條件來配置輿情導(dǎo)向?qū)徲嬒到y(tǒng),于是各審計機(jī)關(guān)之間的分工與協(xié)作就顯得尤為重要。上級審計機(jī)關(guān)可以事先收集并歸納好下級各審計機(jī)關(guān)輿情導(dǎo)向?qū)徲嬒到y(tǒng)的配置情況,將配置有輿情導(dǎo)向?qū)徲嬒到y(tǒng)的下級審計機(jī)關(guān)的服務(wù)供給和未配置輿情導(dǎo)向?qū)徲嬒到y(tǒng)的下級審計機(jī)關(guān)的服務(wù)需求相匹配,使審計服務(wù)供給方能遠(yuǎn)程協(xié)助審計服務(wù)需求方來開展大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嫛?/p>
“左右協(xié)同”則是促進(jìn)審計機(jī)關(guān)與相關(guān)政府部門之間(公安、監(jiān)察、司法和財政等部門)的高效溝通。2021年10月新修訂的《審計法》在第四章第四十一條中規(guī)定:“審計機(jī)關(guān)履行審計監(jiān)督職責(zé),可以提請公安、財政、自然資源、生態(tài)環(huán)境、海關(guān)、稅務(wù)、市場監(jiān)督管理等機(jī)關(guān)予以協(xié)助。有關(guān)機(jī)關(guān)應(yīng)當(dāng)依法予以配合?!贝髷?shù)據(jù)環(huán)境下輿情導(dǎo)向?qū)徲嫷某晒嵤┎荒苤粏渭兊匾揽繉徲嫏C(jī)關(guān),國家機(jī)關(guān)、行政事業(yè)單位甚至國有企業(yè)等多方主體也應(yīng)積極配合、密切協(xié)作。
在推進(jìn)“上下聯(lián)動”與“左右協(xié)同”的基礎(chǔ)上,為了避免信息的重復(fù)采集所導(dǎo)致的審計資源浪費,審計機(jī)關(guān)還應(yīng)著手建立大數(shù)據(jù)經(jīng)驗共享平臺,審計人員可以基于預(yù)先授予的訪問權(quán)限來登錄平臺,獲取所需材料。平臺的建立要求多方主體之間應(yīng)逐步放開數(shù)據(jù)接口,實現(xiàn)彼此之間大數(shù)據(jù)平臺的對接,并通過設(shè)置訪問限制、身份認(rèn)證、密碼登錄和加密傳輸?shù)确绞絹肀WC數(shù)據(jù)信息的安全,化解“數(shù)據(jù)孤島”問題。審計成果和經(jīng)驗的共享不應(yīng)拘泥于審計部門之間,還可輻射至權(quán)威媒體、高校及科研機(jī)構(gòu)。各審計機(jī)關(guān)和部門應(yīng)在每一次輿情導(dǎo)向?qū)徲嫻ぷ鹘Y(jié)束之后,鼓勵參與此次審計工作的審計人員和信息技術(shù)人員等各崗位工作者在經(jīng)驗共享平臺上撰寫工作經(jīng)驗和心得,提供可視化分析報告、審計流程參考和常規(guī)共性問題解決方案,為之后的審計工作提供借鑒。事后還可由專人負(fù)責(zé)梳理與歸納成系統(tǒng)、詳細(xì)和全面的案例分析報告及經(jīng)驗總結(jié)報告,幫助審計機(jī)關(guān)內(nèi)部其他部門和其他審計機(jī)關(guān)少走彎路。在權(quán)威媒體方面,經(jīng)驗共享平臺的建立能夠加強(qiáng)雙方的交流和溝通,新聞工作者可以將經(jīng)過多年積累形成的熱點抓取和信息搜集等方面的經(jīng)驗分享給審計機(jī)關(guān),并憑借自身的職業(yè)敏感性快速捕捉能反映被審計單位問題的輿論信息,幫助審計機(jī)關(guān)盡快揭露和鎖定被審計單位的“惡行”;在高校、科研機(jī)構(gòu)方面,則可將剔除掉涉密信息之后的案例分析報告和經(jīng)驗總結(jié)報告同時發(fā)送給高校及科研機(jī)構(gòu),借助專家和學(xué)者的力量來破解輿情導(dǎo)向?qū)徲媽嵤┻^程中的障礙,將專家研究成果和建議反饋給審計機(jī)關(guān)。
總之,大數(shù)據(jù)背景下“后輿情時代”的到來意味著審計機(jī)關(guān)應(yīng)基于對現(xiàn)行審計缺陷的修復(fù)來實施大數(shù)據(jù)環(huán)境下的輿情導(dǎo)向?qū)徲嫛N磥黼S著輿情導(dǎo)向?qū)徲嫷陌l(fā)展,其將進(jìn)一步起到驗證傳統(tǒng)審計結(jié)果的作用,揭示更多現(xiàn)行審計所無法察覺的規(guī)律性、趨勢性問題,而在機(jī)器學(xué)習(xí)和自然語言處理等人工智能技術(shù)的助力之下,審計的自動化程度也將逐漸提高。