999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于事件嵌套的財務報告知識推理研究

2020-11-06 07:15:36鄧原簡書娜滕劍侖
會計之友 2020年21期

鄧原 簡書娜 滕劍侖

【摘 要】 文本挖掘與信息提取是企業財務報告自動化處理的難點。文章提出事件嵌入方法,將財務報告文本信息轉化為機器可讀、可操作的規范化數據形式,并構建事件語義關系規則;為解決跨段落事件信息提取的問題,采用圖論方法,構建整篇文本特征,形成體現篇章-語義塊-句子-詞匯特征詞及其相互關系的語義感知方法,為大批量抽取財務報告文本信息提供了系統解決思路。文章還提供了實際應用場景,并予以驗證。

【關鍵詞】 事件嵌套; 企業財務報告; 文本語義分析; 語義感知

【中圖分類號】 F233? 【文獻標識碼】 A? 【文章編號】 1004-5937(2020)21-0127-04

一、引言

財務報告信息披露質量是企業利益相關者進行合理決策的重要保障。數字經濟時代,企業面臨的環境日益復雜,傳統會計信息處理方法即便按照新發生業務情況進行了部分調整,依然無法全面覆蓋當前經濟業務的方方面面,難以掌控和反映經濟業務的風險。以文本報告形式盡可能詳盡地呈現企業重要經濟事件內容,為利益相關者提供決策參考與判斷依據,是財務報告逐漸冗長的重要原因。然而,財務報告文本披露形式的多樣性和披露內容過于龐雜,使得財務信息的可操作性、可調用性、一致性無法得到充分保障。為此,發現更為智能的方法與技術,讓決策者迅速獲取文本信息中的關鍵內容,減少信息冗長的影響,成為當前財務報告信息處理的重要改革方向。本文提出事件嵌套方法,用于財務報告的信息提取,定義了文本段落語義塊和感知推理規則,據此建立信息與文本之間的映射關系,實現大規模財務報告文本語義的批量分析,并且,以上市公司股票價格變化為例,充分展示出財務報告語義分析方法對預測市場反應方面的有效性。

二、相關研究

研究者認為,公司應該重視自愿披露信息的可理解性,有助于公司更加規范地發展,更重要的是樹立企業良好的形象,幫助企業拓展自身價值。企業價值的不斷提升有賴于其通過信息的公開、透明和公平的披露方式[1-3]。在分析和檢驗大數據的過程中,學者進一步發現公司偏好利益為上,即相對于信息質量來說,企業更在意于自身在股市的價值表現和公眾的認同程度。因此,自愿信息披露時,企業更愿意披露利好的消息,隱匿那些有可能造成公司價值波動的信息[4]。隨著信息披露的不斷復雜化,財務報告利益相關者已經難以區分有利于自身決策的關鍵信息。研究者利用知識管理的方法,手工整理了前瞻性信息,識別不同的積極性信息和消極信息,在觀測市場波動后,研究表明,因披露方式不同,同樣的信息會帶來價格波動截然不同結果[5]。然而,隨著公司的業務日漸復雜,逐條分析的成本過高。

國內學者結合國內股票市場中上市公司的不確定前瞻信息開展了相應的研究。他們通過樣本分析得出不確定信息,尤其是那些利好的消息和引起利益相關者恐慌的消息是造成股市波動的主要原因之一[6]。針對我國股市發展時間較短,股市監控不盡完善的問題,提出了企業應加強對不確定信息和公司內部一些可能涉及內部控制信息和公司業務變動以及高層更迭等信息的披露,以便幫助投資者盡快做出自身認知能力基礎上的最優決策[7]。然而,股市中上市公司和利益相關者信息優勢差別較大,上市公司利益偏好加劇了信息披露以自身利益為導向的發展勢頭。為了防止上市公司損害利益相關者正當權益,盡快建立信息批量處理與分析方法已成為迫在眉睫的任務[8-9]。

上述研究表明,財務報告文本信息因其內容較為紛繁,信息噪聲較多,難以為企業利益相關者提供有利于決策的有用信息。雖然研究者也試圖通過人工整理的方式精確識別那些可能產生歧義的信息,但是研究者本身的偏好、認知特征、情緒干擾都將影響信息識別的準確性。雖然關于財務報告的定量數據分析和處理已開發出眾多軟件,但是仍無法處理海量且無序的定性數據,特別是占財務報告絕大篇幅的文本信息,必須尋找有效的信息識別與提取方法。為此,本文首先建立財務報告文本事件表達的統一范式,在語料標注和事件嵌套的基礎上,提出文本段落的語義推理方法,實現大規模批量提取事件信息與語義分類,以提供決策支持。最后采用實例進行展示。

三、財務報告文本的事件嵌套

(一)財務報告事件定義

財務報告反映了企業某個會計期間發生的各種經濟業務活動,其中可準確計量并予以確認的在財務報表中體現,而一些難以量化的經濟業務則需要通過自然語言表述的文本信息予以披露。經濟業務圍繞事件展開,方法構建上可采用自然語言處理方法,進行事件抽取,然而,針對財務報告的長文本特點,如何批量抽取事件信息是我們關注的重點。本文通過事件嵌入,提出以學習方法構建實踐特征的特征元組,進行大批量文本事件信息抽取,并在此基礎上分析事件類型、關系及其影響。

在進行事件關系推理之前,應對事件及其屬性的內部關系進行梳理。根據財務報告關于信息披露“準確、相關、真實”的基本原則,交易及事件的主體、發生時間、對應金額均采用較為規范的表述方式。但段落中關聯事件間的對應關系表達較為復雜。

參照文獻[10]的方法,定義財務報告文本事件Event表示模型e:

e=Ke∪Ae∪Re? ?(1)

其中,Ke={Arg0,Arg1,Pre,Time-Key},Ae={Place,Type,Cause,State,…},Re={LookUp,Token,…}

定義1:e由事件主要素集合(Ke)、事件輔助要素集合(Ae)和事件推理要素集合(Re)組成。

定義2:事件主要素集合(Ke)由主體、客體、謂語動詞、時間組成。

定義3:事件輔助要素集合(Ae)由發生地點、事件類型、事件原因、事件狀態構成。輔助事件是對事件的補充和完善,依賴于事件主要素的存在。

定義4:事件推理要素集合(Re)由標注類型為LookUp和Token的中間過程元素構成。主要為計算機抽取事件主輔要素提供識別與判斷信號,用于推導和確定事件主要素。這類要素不構成最終的事件結構化信息。

(二)財務報告事件語義關系定義

在事件統一表達的基礎上,還應形成事件分類與影響分析。參照文獻[11]的事件抽取框架定義,以及事件語義類別[12],定義了推理事件要素語義關系,如表1所示。

通過上述方法可將財務報告文本的事件嵌套,形成文本數據事件標注,實現事件信息的結構化表達。

四、財務報告文本事件語義分析

(一)財務報告結構抽取

在對財務文本進行事件嵌套后,考慮構建文本的段落與語義塊的映射關系,以描述完整的事件群。因此,采取圖論的方法,以詞為節點,位置關系為有向邊,將文本抽象為圖結構,將識別詞在文章中的位置(篇章-段落-句子)及其相互關系轉化為文本結構特征,保留財務報告結構與語義信息,以此對事件群進行語義分類,可形成單一事件向關聯事件群的映射。具體而言,就是形成以段落為單位事件群和句子為單位的單個事件的語義分析基礎。

在財務報告結構的圖譜表示中,篇章C={b1,b2,…,bn}。段落(語義塊)bn在進行分詞處理后,得到特征詞集S={s1,s2,…,sm}。

(二)財務報告結構圖與語義子圖構建

1.財務報告結構圖構建

Input:財務報告篇章C={b1,b2,…,bn}

Output:財務報告的特征詞集S={Sb1,Sb2,…,Sbn}

Sbn為語義塊bn的特征詞集,該特征詞集可映射成一個子圖g=(x,y)。x={x1,x2,…,xi}中xi代表特征詞。有向邊集y={y12,y13,…,yj k}中yj k(j,k=1,2,…,i且j≠k)表示共詞節點xj和xk之間的語序關系。

2.語義子圖構建

Input:Sbn={S1,S2,…,Sm}

Output:gbn={[x1,x2,y12],[x1,x3,y13],…,[xj,xk,yjk]}

至此,財務報告C抽象成圖G。在引入語序圖后,可借助語義相似度模型對其進行分類。例如,若標準語義塊對應的事件性質的分類集為{1,0,-1}即正面、中性、負面三個類別,則可借助上述子圖來進行最大公共子圖語義相似度計算。標準語義塊gs和新塊g'的最大公共子圖是越重合,相似度越高。語義相似度評價模型如式2所示:

SemanticSimilarity(g',gs)=■? (2)

其中,SemanticSimilarity(g',gs)為最大語義子圖,X(g)、Y(g)分別表示其中節點和邊的數量。maximum(X(g'),X(gs))表示兩個比較語義塊中節點最大值,maximum(Y(g'),Y(gs))則是兩者邊的最大值。語義相似度取值范圍[0,1],值越大意味著兩者越相似,取最大值確定其所屬類別。

五、應用

采用前述方法,得到了財務報告文本的事件信息標注數據和篇章結構圖。接下來將展示依賴語義感知的事件分類與推理及其應用。

財務報告的事件類型如投融資、盈利變更、股權變更等事件對預測企業未來表現至關重要,其文本段落是對單個事件或事件群的描述,識別事件的觸發詞并分析其屬性類別具有顯著的應用價值,如觸發詞“重組通過”標識具有正面意義,“重組”對應無法判斷即中性的事件,“重組中止”對應負面屬性。那么,如何推理文本段落的語義類型則成為文本分析的關鍵。參照文獻[13],采用“三輸入一輸出”方式構建推理規則,其中輸入為事件語義分類結果,輸出則為系統對財務報告文本中核心事件的評價:

Result→{[X1]×[X2]×[X3],Xi∈{1,0,-1}}

其中,X為事件,Result為推理結果。規則由不同的輸入(事件)/輸出(后果)構成,即由n個輸入事件變量,每個變量都有z項屬性,可能的輸出變量具有r種結果,則規則數為r×nz。因此,“三輸入一輸出”模式下包含81條(3×33)規則。采用沖突解決機制,得到以下規則庫,這些規則可以對于財務報告中的核心事件快速地做出結論,表2列示了部分規則。

以《?觹?觹?觹?觹股份有限公司2017年年度報告》為例進行分析。財務報告完整結構樹中“篇章9(重要事項)-段落2(報告期內公司收購資產的簡要情況及進程)-句子”給出了語義塊:

X1:2016年9月28日公司與?觹?觹?觹汽車運輸集團簽訂了《合作協議書》

X2:2016年10月10日與?觹?觹?觹汽車運輸集團簽訂了《資產轉讓協議書》

X3:2016年11月11日與?觹?觹?觹奔騰高速客運有限公司簽訂了《資產轉讓協議書》

系統對觸發詞自動標記為“1”,并做語義分類。如用戶提出分析請求,知識庫將能依據Rule27,給出“1”(1×1×1)的結論。經驗證,財務報告發布后30天內企業股價上升了15%以上,同期上證指數卻處于下跌狀態。

綜上,以自然語言處理事件抽取框架為基礎,定義了財務報告文本事件類型與屬性的表達框架,對時間信息、金額信息、對象信息等文本標注;以財務報告中文本篇章—段落—句子—詞匯的結構化表達為起點,構建財務報告文本段落語義感知模型,在數據表達上實現事件嵌套,將非結構化文本信息轉化成結構化信息。通過實例展示文本事件信息語義基元的構建過程,實現了文本段落語義塊感知的方法,為大規模財務報告文本自動分析提供了系統的解決路徑。

在不斷完善既有語料庫的基礎上,初步完成財務報告文本結構的規范性表達,提出了段落語義感知的推理方法。后續研究中,將結合企業所屬行業、概念板塊對企業財務報告自然語言表達特征進行梳理,提高語義感知推理的精確度。同時,結合財務管理、金融和企業管理等專業領域,提取財務報告文本語義塊與領域知識的映射關系,進一步拓展語義感知推理方法的應用范圍。

【參考文獻】

[1] BUSHMAN R,SMITH A.Financial accounting information and corporate governance[J].Journal of Accounting and Economics,2001,32:237-334.

[2] MADHAVAN A.Consolidation,fragmentation,and the disclosure of trading information[J].Review of Financial Studies,1995,8(3):579-603.

[3] LANGBERG N,SIVARAMAKRISHNAN K.Voluntary disclosures and analyst feedback[J].Journal of Accounting Research,2010,48(3):603-646.

[4] MAXIMILIAN A M,EDWARD J R,THORSTEN S.Recognition versus disclosure of fair values[J].The Accounting Review,2015,90(6):2411-2447.

[5] LI F.The information content of forward-looking statements in corporate filings:a na?觙ve bayesian machine learning approach[J].Journal of Accounting Research,2010,48(5):1049-1101.

[6] 李常青,王毅輝,張鳳展.上市公司“管理層討論與分析”披露質量影響因素研究[J].經濟管理,2008(4):29-34.

[7] 薛爽,肖澤忠,潘妙麗.管理層討論與分析是否提供了有用信息——基于虧損上市公司的實證探索[J].管理世界,2010(5):130-140.

[8] 張繼勛,周冉,孫鵬.內部控制披露、審計意見、投資者的風險感知和投資決策:一項實驗證據[J].會計研究,2011(9):66-73.

[9] 楊清香,俞麟,宋麗.內部控制信息披露與市場反應研究——來自中國滬市上市公司的經驗證據[J].南開管理評論,2012(1):123-130.

[10] 李培峰,周國棟,朱巧明.基于語義的中文事件觸發詞抽取聯合模型[J].軟件學報,2016,27(2):280-294.

[11] DING X,ZHANG Y,LIU T,et al.Deep learning for event-driven stock prediction[C]//International Conference on Artificial Intelligence.AAAI Press,2015.

[12] WEI LU,DAN ROTH.Automatic event extraction with structured preference modeling[C].Proc.of the 50th Annual Meeting of the Association for Computational Linguistics,2012:835-844.

[13] 羅明,黃海量.基于詞匯—語義模式的金融事件信息抽取方法[J].計算機應用,2018(1):84-90.

主站蜘蛛池模板: 在线欧美国产| 精品天海翼一区二区| 免费看a级毛片| 精品国产自在现线看久久| 国产高清无码第一十页在线观看| 日本精品中文字幕在线不卡 | 亚洲综合色婷婷| 国产亚洲视频在线观看| 五月婷婷丁香综合| 日韩欧美中文字幕一本| 动漫精品啪啪一区二区三区| 九色在线视频导航91| 色噜噜中文网| 搞黄网站免费观看| 国产91高跟丝袜| 亚洲人视频在线观看| 国产欧美日韩免费| а∨天堂一区中文字幕| 欧美中文字幕在线视频| 亚洲成人黄色在线观看| 91色老久久精品偷偷蜜臀| 国产91麻豆视频| 香蕉视频在线精品| 亚洲国产精品一区二区高清无码久久 | 性色在线视频精品| 国国产a国产片免费麻豆| 免费一级毛片| 久久国产精品电影| 99手机在线视频| 国产成人亚洲日韩欧美电影| 国产又色又刺激高潮免费看| 精品久久蜜桃| 亚洲制服丝袜第一页| 国产一区二区精品福利| 天天综合网色中文字幕| 无码AV日韩一二三区| 色老二精品视频在线观看| 中文天堂在线视频| 欧美精品高清| 亚洲欧美成aⅴ人在线观看| 国产亚洲精品精品精品| 国产午夜精品一区二区三区软件| 国产喷水视频| 国产精品毛片一区视频播| 亚洲国产天堂久久综合226114| 乱色熟女综合一区二区| 中文一级毛片| 亚洲欧美成人在线视频| 97色伦色在线综合视频| 91极品美女高潮叫床在线观看| 久久美女精品| 91色国产在线| 日韩精品毛片人妻AV不卡| 日韩精品一区二区三区视频免费看| 91麻豆国产视频| 另类重口100页在线播放| 2021天堂在线亚洲精品专区| 亚洲婷婷六月| 国产另类乱子伦精品免费女| 一本色道久久88| 综合色亚洲| 久久 午夜福利 张柏芝| 一级毛片在线播放免费| 欧美日本二区| 国产精品主播| 又污又黄又无遮挡网站| 国产香蕉在线视频| 亚洲欧美一区二区三区图片| 亚洲欧美日韩天堂| 色噜噜在线观看| 久久国产精品嫖妓| 中文字幕无码中文字幕有码在线| 色综合中文综合网| 欧美午夜在线播放| 91丨九色丨首页在线播放 | 国产精品区视频中文字幕| 久久一级电影| 精品国产福利在线| 中文字幕有乳无码| 国产91九色在线播放| 影音先锋亚洲无码| 一本久道久综合久久鬼色|