單軍亭+單昱+單晨+瞿晶珠
摘 要 大數據是互聯網信息時代的發展趨勢,小數據是大數據的基礎,二者相輔相成,相得益彰。本文通過探討大數據與小數據之間的關系,建立內控測試例外事項數據庫的目的與意義,簡述用大數據思維建立例外事項Excel小數據庫的程序和方法,以及數據庫的使用方式。
關鍵詞 大數據 數據庫 建設程序
大數據思維是目前企業關注和熱議的話題,正在影響或改變傳統的企業模式。運用大數據新型技術從海量的數據庫中提取可用數據,通過對結構性和非結構性數據進行全面、關聯和快速分析,精準預測未來發展趨勢,已成為互聯網信息時代的共識和不爭的事實。大數據的運行,離不開數據資源的支持,沒有各類數據庫資源的匯集,大數據就無數據來源。因此,在大數據思維下建立相應的小數據庫,不僅是大數據有效運行的基礎,更是應用大數據新型技術的保障。
一、對數據、信息和數據庫的理解
百度百科和360百科均把數據(data)解釋為,數據是對客觀事物存在事實或觀察的結果和邏輯歸納,是表示客觀事物未被加工和處理、原汁原味的原始素材。數據是計算機信息技術的術語,是信息的表現形式和載體,可以是符號、文字、數字、語音、圖像、視頻等。信息是數據的內涵,數據是信息的表達。數據本身并無意義,只有對實體行為產生影響時才成為信息,數據和信息不可分離。①
筆者認為,數據是對各類事物誕生、發展和消亡等各個時序節點全過程運行軌跡,用各種各樣能被人和機器等認識、甄別和記憶,用不同的語言文字、影像圖形、符號標識等進行描述匯總和統計分析的一維或多維記錄。單個記錄的匯集可以形成一組或一個緯度,多個緯度的聚集便可形成一個庫。記錄數量按照“積水成淵、積土成山”規則,即可形成大、中、小等不同層級的庫。由于記錄的是各種類型的信息,通常這些信息又被稱為數據,所以這些信息數據記錄形成的庫就被稱為數據庫。
不言而喻,數據量小的是小數據庫,數據量大的是大數據庫(介于中間的是中控數據庫)。單個或多個小數據庫的匯集可以形成大數據庫。由此可知,小數據庫是大數據庫的基礎,大數據庫是小數據庫的集合,沒有小數據庫就形成不了大數據庫,沒有小數據就形成不了大數據。
二、大數據與小數據之間的關系
網絡技術的不斷進步和信息載體飛速發展,為大數據的崛起提供了機遇和平臺。數據庫是按照一定的數據結構,集成、記錄、存儲和管理數據資源的倉庫,結構性和非結構性信息層級分明,使用方便、操作簡單。
(一)大數據和小數據之間存在層級關系
數據庫可以分為三個層級:第一層級是集團層面,處于數據庫的頂層;第二層級是地區公司層面,處于數據庫的中層;第三層級是地區公司所屬層面,處于數據庫的底層。大數據是小數據的集合,集團層面可視同為大數據。小數據是業內不同部門各相關數據的集成,地區公司所屬層面可視同為小數據。小數據是大數據的基礎和來源,沒有小數據就沒有大數據;大數據是小數據的匯集,沒有大數據,小數據就沒有價值取向,二者相輔相成,相得益彰。
(二)大數據和小數據之間的數據取值不對稱
大數據的數據來源于小數據,而小數據是各行業部門投入大量的人、財、物資源,把長期積累的各類資源轉換成數據資源的結果,是企業內部勞動成果和辛勤付出的平臺和血汗,一般只限制在有權限的內部使用,不會輕易外傳。由于受考核指標的影響,不同層級的單位上報數據時,在考慮和權衡自身利弊的情況下,基本都會對關鍵指標進行加工和處理,對下真實可靠,對上卻受到懷疑。這種背景下的大數據,因其數據取值不對稱,就具有了一定的欺騙性。
(三)大數據和小數據的數據使用都有權限限制
大數據背景下,業內數據屬于內部資料,一般不會對外開放。業外人員要想獲得相應的數據,必須經過逐級審批,且有限制權限。比如,人事、財務、合同、采購和審計等部門的非內部人員想獲取相關數據,如同非內部人員想查看淘寶、微信、銀行或醫院等相關數據一樣,一般只能在對外開放的平臺上查看對外披露的數據,但這些數據都經過了加工和處理。要想收集到最原始的數據進行數據分析和預測,必須有相應的權限,并且經過允許。由此可知,大數據只是供內部有權限人員使用的平臺,外部想實現數據挖掘、采集、篩選和運算,用大數據分析和預測,基本無能為力。
三、建立內控測試例外事項數據庫的目的與意義
在大數據背景下,集團公司作為國有大型企業,已經建立了一系列的數據體系。由于受使用權限等影響,人事、財務、合同、采購和審計等部門的非內部專業人員一般無法獲取相應的數據資料。建立業內小型數據庫,能夠擴大非內部專業人員的使用范圍,為非專業人員提供一個通暢的查詢平臺。由于各業務之間存在一定的瓶頸,加上內部之間互相涉密,系統間使用的框架、平臺和接口不統一,限制了大數據分析者運用大數據算法進行挖掘和統計分析的能力。在此,筆者以本公司內控測試例外事項數據為例,簡述建立小型數據庫的目的和意義。
(一)梳理存在問題,方便查詢分析
按照內控手冊要求,公司每年至少開展一次內控測試,查找內控體系設計和運行中存在的問題,修訂失效控制,維護內控管理手冊。所屬單位完成例外事項整改任務后,大多數情況下都不會再去翻閱和查看,給日后使用帶來了不便。梳理內控測試例外事項,建立數據庫可以為后續的查詢分析提供方便。
(二)提醒關注事項,避免重復發生
內控測試例外事項數量是考核內控體系運行情況的一項指標,建立內控測試例外事項數據庫,可以提醒崗位人員及時關注相關事項,統計分析和查找存在問題的根源,有利于主管部門結合實際情況制定切實可行的防控措施,從而避免內控例外事項的重復發生。
(三)防范潛在風險,推進控制執行
內控測試例外事項的產生是未能按照控制要求執行的結果,內部控制的關鍵是控制對應的風險。產生例外事項說明控制措施執行不力或者失效,其對應風險造成的影響,雖然沒有立刻顯現,但確實存在,如不認真對待,潛在風險一旦爆發,后果和影響或不可估量。內控例外事項數據庫對應了風險防范和懲處重復發生措施,為全面提升內控執行力提供了依據和支持。endprint
四、數據庫建設的程序方法
搭建數據庫的方法多種多樣,有系統、有軟件、也有表單。如前所述,系統數據庫由于內部之間互相涉密,系統間使用的框架、平臺和接口不統一,限制了大數據分析者運用大數據算法進行挖掘和統計分析的能力。軟件建庫需要學習相關的專業技術,Access也要具備相應技能。相比之下,筆者認為還是Office Excel表單結構簡單、使用方便。這里,筆者以微軟Office Excel為例,簡述本公司內控測試例外事項結構性數據庫的建設程序和方法,其他不同類型小數據庫的建立,如人事、財務、合同、采購和審計等方法與此大同小異。
一是設計數據庫結構,整理統一表格。結合年度測試情況,根據需要歸類數據內容,把各年度例外事項測試層級、測試主題內容和領域名稱,例外事項問題及產生原因、問題根源,問題解決措施,重復發生例外事項懲處措施,提升內控執行力建議等統計分析內容,一并設計納入數據庫結構之中,形成統一的Excel表格,在征求意見的基礎上,修訂、完善數據庫結構,整理設計格式統一的內控測試例外事項數據庫。
二是下發統計分析通知,指導表格填寫。在公司網頁上發布關于開展內控測試例外事項分析工作的通知,明確分析期間、范圍、內容和上報時間。組織所屬單位開展例外事項統計分析業務培訓,指導業務骨干分項填寫相關內容,把建庫要求落實到基層對應部門,自下而上制定問題解決措施和重復發生例外事項懲處措施,經存在問題的對應部門簽字確認后,提交主管領導審核。
三是收集反饋資料,審查對應內容。例外事項統計分析業務主管部門相關人員在規定時間收集所屬單位上報的反饋資料,逐一審查對應內容,發現不符合要求等問題及時溝通并返回修訂,直至全部合格后,把例外事項統計分析表整理匯總為統一文檔。之后調整表格順序,編制鏈接庫文件目錄。
四是制作VBA窗體,測試運行效果。首先,打開Excel數據表,主界面如未顯示開發工具,可在Office按鈕主菜單下選擇Excel選項,之后選擇常用,然后選擇勾選開發工具;其次,在主界面點擊開發工具,之后選擇錄制宏,完成宏錄制后打開開發工具,左側點擊Visual Basic,在視圖中點擊工程資源編輯器,在對象下點擊This Workbook,然后雙擊并編程;第三,在主界面插入中選擇用戶窗體,出現窗體和控件工具箱,之后設計窗體,然后雙擊窗體在UserForm1編程;第四,完成編程后設計圖片和文字格式,在主界面運行欄中選擇運行子過程/用戶窗體,出現運行界面后,輸入用戶名和密碼,之后進入查詢導航,然后調試程序并完成測試。
非結構性數據庫的建設程序和方法與結構性數據庫基本相同,只是編程、表單引用等更加煩瑣和復雜。
五、數據庫的使用方式
為有效防范潛在風險,全面提升內控執行力,制作完成例外事項統計分析數據庫后,可及時在公司網頁上發布,所屬單位崗位人員進入查詢系統后,可進行查詢和分析。
綜上所述,在大數據思維下建立例外事項小數據庫(內控測試例外事項Excel統計分析小數據庫),是發展并應用大數據新型技術的前提和基礎,大數據和小數據相輔相成,相得益彰。
注釋:①百度百科、360百科。
(單軍亭單位為青海油田企管法規處(內控與風險管理處);單昱單位為中國石油大學(華東)儲運與建筑學院;單晨單位為青海油田井下作業公司試油測試大隊;瞿晶珠單位為青海油田社區管理中心物業一公司)
[作者簡介:單軍亭(1964—),男,本科,畢業于北京科技大學工商管理專業,云南大學經濟管理研究生結業,高級項目管理師,青海油田企管法規處(內控與風險管理處)業務部門負責人,研究方向:企業內部控制,綜合風險管理。單昱,中國石油大學(華東)儲運與建筑學院工程力學專業本科在讀。單晨,大專,石油工程專業。瞿晶珠,大專,計算機應用專業。]
參考文獻
[1] http://baike.so.com/doc/5387430-7565065.html[OL]. 360百科.
[2] http://baike.baidu.com/link?url=k40A0wYoiB74deIK8UI7sqpkm_xjBpQt4t6jxSj6AlF
ZZ-SOSrx_Y3OjMpvRZCslSGDFXaifIdpySL5MV2UY38CQmTYwqf3lAkl5kQNTYE7[OL].百度百科.
[3] 青山. Excel窗體設計制作方法[OL]. http://club.excelhome.net/forum.php?mod=viewthread&tid=137671&page=1&authorid=76888,2005-12-02.
[4] 單軍亭,單晨.淺談用大數據思維建立內控測試例外事項小數據庫[J].青海油田企業文化,2016(2):61-62.endprint