999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

企業股權關系數據價值挖掘的研究報告

2021-11-20 02:18:28陳力交通銀行股份有限公司
環球市場 2021年30期
關鍵詞:數據庫分析

陳力 交通銀行股份有限公司

企業股權數據中蘊含著巨大的業務價值,而充分利用該部分數據價值不僅需要合理的數據分析步驟,還需要相應的技術手段。從數據清洗、圖譜構造到最后的數據價值分析,一步步環環相扣,我們結合圖數據庫找到了一條挖掘企業股權數據價值的可行路徑,并以實際案例進行有效的實踐。

一、數據研究及方案制定

一般對于股權信息最基本的要求是有公司信息、股東信息以及股東持股比例,其中公司信息和股東信息包含的最小要素為企業名稱和組織機構代碼(或統一社會征信碼)。

股權關系我們可以看作是公司主體作為實體的關系信息,即我們如果把股權關系進行抽象,可以獲取的是代表公司主體的點,以及代表股權關系的邊。而這些點和邊最終組成了圖,也就形成了我們最終數據需要存儲的形式和展現的形式。

在此我們利用圖數據庫進行相關關系的分析與解析,并制定出數據實施方案,見圖1:

圖1

數據清洗旨在從原始的股權關系數據中提取中構造圖譜的關鍵信息;圖譜構造則是通過提取出的關鍵信息,抽象成點和邊的形式,以圖的方式存儲這些關鍵信息;價值分析,則基于構建的圖譜實現業務價值的提取分析。

二、數據清洗

(一)股東代碼空值填充

有部分股東代碼數值為空,因此我們需要補充這部分股東代碼,鑒于股東代碼在實際應用中僅起到區分不同股東的作用,因此我們采用簡易的編碼規則,即GD+5位序號的方式進行編碼,實際生產應用時可根據相應使用場景進行調整。

(二)最新數據切片構造

實際應用股權關系數據時,我們最為關心的是當前各家企業的股權關系,因此其中需要有效過濾掉歷史數據,而對于歷史數據的判斷,可通過以下兩步實施:

第一步,歷史數據的篩選,即同一公司代碼+股東代碼的組合,獲取最新更新日期更大、出資時間更晚的數據,最后一個公司代碼+股東代碼只保留一條數據記錄。

第二步,股權變更流程回溯,基于以下2個字段:最新更新日期、出資時間。將上述字段分別按照倒序排列,即優先排列最新更新日期最大的數據,然后優先排列出資時間更晚的數據,排除掉多余的數據直至該公司所有的股權持有比例之和不超過100%。

最后需要達到的數據目標為:1.一組公司代碼+股東代碼的組合對應一條數據記錄;2.每一個公司所有的股東持股比例不超過100%。

(三)持股比例空值填充

填充持股比例為空值的數據,思路如下:對于某一家公司,將已知的股東信息相加,而后將剩余的持股比例由未知持股比例的股東平均瓜分。

例如某公司的持股比例空值應當為100%去除已知持股比例數37.98%,若其有2家持股比例未知的公司,則另兩家持股比例為(100%-37.98%)/2=31.01%。

三、圖譜構造

在完成數據清洗之后,我們獲取了一份表格形式存儲的企業股權關系數據。但是以表為形式存儲對于股權關系分析的應用有以下局限:

1.數據可視化制作困難,無法完整地呈現某一家企業的上下游關聯關系,對于股權層層穿透的情況分析效率較低;

2.對于圖譜深度解析的需求,分析程序編寫困難,執行效率不足,該情況主要出現在企業風險傳播分析、高風險股權結構分析、高風險擔保結構分析的應用場景中。

在該背景下,我們引入圖數據庫,將傳統關系型數據庫中的數據,裝載到圖數據庫中,來提高我們數據分析過程中提到的上述瓶頸。

(一)圖數據庫介紹

圖數據庫中的“圖”,并不是指圖片,而是以圖這種數據結構存儲和查詢數據。

而市面上的圖數據庫有兩種,一種是原生圖數據庫,即數據存儲在自己本身的圖數據庫體系內;另一種是非原生圖數據庫,數據本身不存儲在圖數據庫的框架體系內,而是存儲在別的數據庫中(一般為關系型數據庫);而經過比較前者的效率更高[1]。

圖數據庫的性能評估包含兩個重要的因素,一個是圖存儲,還有一個是圖處理引擎。圖的存儲方式與傳統的關系型數據庫區別非常大,他是專門為存儲和管理圖而設計的,而圖處理引擎更是關系型數據庫所不具備的,這也是為什么圖數據庫在處理圖譜數據時效率更高的原因[2]。

(二)裝載方案

圖數據庫顧名思義就是將數據以“圖”的形式存儲在計算機中,而圖具有的最基本的要素就是邊和點,因此我們要將我們上一節清洗完的數據抽象成邊和點。

我們使用到的數據中“公司”和“股東”都可以歸類為標簽為“公司”的節點,由于是股權關系表,關系可以歸類為“股權”關系。“公司名稱”是節點的屬性,持股比例是“股權”關系的屬性。

(三)方案實施

將表格數據裝載入圖數據庫是一個比較關鍵的步驟,在裝載是需要制定合理的方案,保證數據裝載穩定且高效。因此我們使用批量加載的方法,同時用下列步驟進行數據導入:

第一步導入節點;

導入節點分批量導入和非批量導入,我們可以看一下兩者的區別:

非批量導入過程為,將一條數據寫入內存,然后將內存中的數據寫入磁盤,周而復始;批量導入的過程為,將多條數據寫入內存,而后批量將數據寫入磁盤。我們發現批量導入大大降低了磁盤讀寫的次數,因此會有效地提升數據加載效率。

而實際的過程中我們會將所有數據分成若干個小批次進行操作,這樣既可以減少磁盤讀寫的次數,同時也可以避免內存使用比例過高導致的性能下降。

第二步為關系關聯屬性(公司代碼)加上索引;

加入索引的重要原因是提升數據庫讀取效率,經過性能測試,在關聯屬性上建立索引和不建立索引,前者的效率比后者有極大的提升。

第三步導入關系數據;導入關系數據,我們同樣使用分小批次導入的方法來實現,來保證數據導入的效率。

四、數據價值分析

圖數據庫之于圖譜分析,其優勢除了在數據可視化上,還能充分挖掘企業間關系的業務價值。我們以以下兩個場景進行舉例:

(一)股權穿透分析

我們以某上市公司為例,下簡稱“A公司”,分析該主體如果發生負面事件,波及的范圍。以該節點為出發點,向下穿透5層,可獲得如圖2:

圖2

大圈中的“A公司”對外的股權非常復雜,牽涉的企業面積非常廣。所有涉及的企業都會或多或少因該企業的風險事件而受到負面影響。

傳統的關系型數據庫在搜索多層關系時,需要多次訪問數據庫表,為提升執行效率并且降低程序以外執行失敗的概率,會以數據庫事務的形式編寫,代碼編寫復雜度較高。圖數據庫的可視化功能也要比關系型數據庫更強,而在圖處理的能力上也較關系型數據庫更強。

(二)企業股權關聯分析

在進行業務分析時,我們經常會發現,兩家看似毫無關聯的企業,卻有著千絲萬縷的聯系。例如圖3左大圈中的“A公司”與右大圈中的“B公司”,這兩家公司,從名字上分析除了可以得出兩家公司都涉及相同的行業,似乎毫無關聯信息。但我們查詢一下這兩家企業的關聯關系,我們會發現,兩家企業有著一定的關聯,其股權關聯如圖3:

圖3

同時,可以根據股權關系中的持有份額比例,通過各條路徑的乘積之和來計算“A公司”對“B公司”的實際控制份額。

實現上述功能,通過關系型數據庫,我們不僅要多次訪問數據庫,同時還要使用遞歸,代碼實現難度比較大,而圖數據庫只需要執行指令,匹配起始節點與重點,即可自動搜索出所有的路徑,大大降低了程序編寫的難度,并且提升了執行效率。

圖3展示了圖據庫以表格結合數組的形式展示開始節點到結束節點的所有路徑,將這路徑中的權重值相乘最后再相加,我們即可獲得最后開始節點對結束節點的實際控制份額。

圖3我們能找到5條從A公司出發,B公司結束的路徑。

路徑1:

[{"percentage":50.0},{"percentage":40.0}]

路徑2:

[{"percentage":47.12},{"percentage":100.0},{"percentage":96.875},{"percentage":11.0}]

路徑3:

[{"percentage":47.12},{"percentage":50.0},{"percentage":40.0}]

路徑4:

[{"percentage":100.0},{"percentage":5.53},{"percentage":100.0},{"percentage":96.875},{"percentage":11.0}]

路徑5:

[{"percentage":100.0},{"percentage":5.53},{"percentage":50.0},{"percentage":40.0}]

最后我們根據計算各條路徑中持股比例的乘積,最后加總得知A公司對B公司的實際控制份額為36.14%。

五、總結

企業股權數據中蘊含著巨大的業務價值,而充分利用該部分數據價值不僅需要合理的數據分析步驟,還需要相應的技術手段。而圖數據庫在圖譜分析的過程中提升了效率,簡化了代碼,通過業務實施步驟的合理規劃,以及技術流水線的合理部署,提升數據分析能力,真正做到為業務賦能。

猜你喜歡
數據庫分析
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
電力系統及其自動化發展趨勢分析
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
中西醫結合治療抑郁癥100例分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 在线精品亚洲国产| 九九精品在线观看| 国产日韩精品一区在线不卡| 精品福利视频导航| 日韩精品无码不卡无码| 97超爽成人免费视频在线播放| 日韩欧美网址| 亚洲欧美日韩久久精品| 囯产av无码片毛片一级| 亚洲日韩AV无码精品| 深夜福利视频一区二区| 在线观看国产精品一区| 好吊色国产欧美日韩免费观看| 久久精品波多野结衣| 久久9966精品国产免费| 欧美日韩理论| 国产一区免费在线观看| 亚洲一级毛片免费观看| 97免费在线观看视频| 99视频只有精品| 国产亚洲视频在线观看| jizz在线观看| 国产SUV精品一区二区6| 亚洲色无码专线精品观看| 免费久久一级欧美特大黄| 女人18一级毛片免费观看| 亚洲首页在线观看| 久久网欧美| 噜噜噜久久| 激情影院内射美女| 欧美在线导航| 国产乱论视频| 在线免费观看AV| 国产在线观看人成激情视频| 国产无遮挡裸体免费视频| 99一级毛片| 欧美不卡视频一区发布| 亚洲精品国产精品乱码不卞| 婷婷综合在线观看丁香| 久久人午夜亚洲精品无码区| 54pao国产成人免费视频| 国产精品.com| 成人精品区| 狼友av永久网站免费观看| 午夜精品福利影院| 一本二本三本不卡无码| 2021无码专区人妻系列日韩| 九九久久99精品| 岛国精品一区免费视频在线观看| 无码 在线 在线| 国产免费久久精品99re不卡| 久久久无码人妻精品无码| 91探花国产综合在线精品| 美女内射视频WWW网站午夜| 欧美影院久久| 亚洲欧美一区二区三区麻豆| 国产96在线 | 国产原创第一页在线观看| 996免费视频国产在线播放| 欧美a级在线| 欧美福利在线观看| 日本不卡视频在线| 久久精品aⅴ无码中文字幕| 丁香婷婷激情网| 91丨九色丨首页在线播放| 国产成人一级| 在线观看亚洲天堂| a级毛片免费看| 亚洲色欲色欲www在线观看| 日韩色图在线观看| 国产精品.com| 激情六月丁香婷婷| 中文字幕精品一区二区三区视频| 国产精品一区不卡| 久996视频精品免费观看| 激情在线网| 免费人成视网站在线不卡| 亚洲不卡av中文在线| 玖玖免费视频在线观看| 美女免费黄网站| 超清人妻系列无码专区| 亚洲成人www|