




















[摘要] 隨著數(shù)字化時(shí)代的到來(lái),數(shù)據(jù)資產(chǎn)成為企業(yè)價(jià)值創(chuàng)造的關(guān)鍵因素。本研究采用了定量分析的方法,首先利用文本分析技術(shù)中的TF-IDF方法來(lái)量化上市公司的數(shù)據(jù)資產(chǎn)規(guī)模,然后通過(guò)對(duì)比分析數(shù)據(jù)資產(chǎn)規(guī)模與企業(yè)財(cái)務(wù)指標(biāo)之間的關(guān)系,評(píng)估數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效的影響。研究發(fā)現(xiàn),數(shù)據(jù)資產(chǎn)與企業(yè)績(jī)效之間存在顯著的正向關(guān)系,而這一正向促進(jìn)關(guān)系是通過(guò)企業(yè)創(chuàng)新能力中介效應(yīng)實(shí)現(xiàn)的。本文研究不僅在學(xué)術(shù)上為理解數(shù)據(jù)資產(chǎn)對(duì)企業(yè)財(cái)務(wù)績(jī)效影響提供了新的視角和實(shí)證證據(jù),也為實(shí)踐者在如何有效管理和利用數(shù)據(jù)資產(chǎn)以提升企業(yè)價(jià)值和績(jī)效提供了指導(dǎo)。
[關(guān)鍵詞] 數(shù)據(jù)資產(chǎn);企業(yè)績(jī)效;文本分析;TF-IDF
[中圖分類(lèi)號(hào)] F249.2" [文獻(xiàn)標(biāo)識(shí)碼]A" "[文章編號(hào)]1000-4211(2025)01-0008-23
一、引言
在數(shù)字經(jīng)濟(jì)時(shí)代背景下,數(shù)據(jù)資產(chǎn)已經(jīng)成為企業(yè)增強(qiáng)競(jìng)爭(zhēng)力、提升價(jià)值創(chuàng)造能力的關(guān)鍵資源。隨著信息技術(shù)的飛速發(fā)展,企業(yè)獲取、處理和分析數(shù)據(jù)的能力日益增強(qiáng),使得數(shù)據(jù)資產(chǎn)在促進(jìn)業(yè)務(wù)創(chuàng)新、優(yōu)化運(yùn)營(yíng)效率、提高決策質(zhì)量等方面發(fā)揮著越來(lái)越重要的作用。財(cái)政部于2023年8月發(fā)布的《企業(yè)數(shù)據(jù)資源相關(guān)會(huì)計(jì)處理暫行規(guī)定》是對(duì)這一趨勢(shì)的正式回應(yīng)(國(guó)務(wù)院公報(bào),2023)。該規(guī)定自2024年1月1日起正式施行,明確要求上市公司需在財(cái)務(wù)報(bào)表中披露按企業(yè)會(huì)計(jì)準(zhǔn)則確認(rèn)為無(wú)形資產(chǎn)或存貨等資產(chǎn)類(lèi)別的數(shù)據(jù)資源。這一政策變動(dòng)標(biāo)志著數(shù)據(jù)資產(chǎn)在企業(yè)財(cái)務(wù)管理和會(huì)計(jì)準(zhǔn)則中的重要地位正式得到認(rèn)可和強(qiáng)化,同時(shí)也提出了新的挑戰(zhàn):如何在財(cái)務(wù)報(bào)表中準(zhǔn)確衡量和披露數(shù)據(jù)資產(chǎn)。
在新規(guī)定發(fā)布之前,大多數(shù)企業(yè)對(duì)數(shù)據(jù)資產(chǎn)的報(bào)告基于自愿原則,僅有少數(shù)視數(shù)據(jù)資產(chǎn)為核心競(jìng)爭(zhēng)力的企業(yè)在其財(cái)務(wù)報(bào)告中提及相關(guān)信息。提高一個(gè)新類(lèi)目披露的規(guī)范性、合理性以及最終會(huì)計(jì)制度的制定往往需要從該制度所依存的法律環(huán)境、制度形式、制度內(nèi)容等諸多方面進(jìn)行考察(劉玉廷等,2001)。這種狀況反映出,在全面實(shí)施新規(guī)定之前,尋找一種合適的方式來(lái)衡量企業(yè)的數(shù)據(jù)資產(chǎn)具有重要的研究?jī)r(jià)值和實(shí)踐意義。
從理論和實(shí)踐的角度看,數(shù)據(jù)資產(chǎn)的衡量和評(píng)估面臨著多重挑戰(zhàn)。首先,數(shù)據(jù)資產(chǎn)與傳統(tǒng)的物理資產(chǎn)在性質(zhì)上存在顯著差異,而即使將其認(rèn)定為無(wú)形資產(chǎn)也會(huì)和傳統(tǒng)的無(wú)形資產(chǎn)有所不同,如易復(fù)制性高、價(jià)值隨時(shí)間變化等特點(diǎn),這些特性使得傳統(tǒng)的資產(chǎn)評(píng)估方法難以直接應(yīng)用于數(shù)據(jù)資產(chǎn)。朱繼軍等(2024)認(rèn)為數(shù)據(jù)資產(chǎn)的價(jià)值會(huì)因?yàn)樘幚砗头治鲲@著變化,很有可能造成資產(chǎn)虛增和漏報(bào)。其次,數(shù)據(jù)資產(chǎn)的價(jià)值往往與其使用方式和使用環(huán)境密切相關(guān),即相同的數(shù)據(jù)在不同的應(yīng)用場(chǎng)景中可能具有截然不同的價(jià)值。此外,數(shù)據(jù)資產(chǎn)的價(jià)值實(shí)現(xiàn)過(guò)程涉及數(shù)據(jù)的收集、存儲(chǔ)、處理、分析和應(yīng)用等多個(gè)環(huán)節(jié),每個(gè)環(huán)節(jié)的效率和效果都會(huì)直接影響到數(shù)據(jù)資產(chǎn)的最終價(jià)值。
基于以上背景,本研究提出采用文本分析方法來(lái)衡量數(shù)據(jù)資產(chǎn)的價(jià)值。文本分析,尤其是基于自然語(yǔ)言處理(NLP)的技術(shù),能夠從大量非結(jié)構(gòu)化的文本數(shù)據(jù)中提取有價(jià)值的信息和知識(shí),為數(shù)據(jù)資產(chǎn)的價(jià)值評(píng)估提供了新的可能性。特別是,通過(guò)運(yùn)用TF-IDF(Term Frequency-Inverse Document Frequency)等文本挖掘技術(shù),可以有效地量化數(shù)據(jù)資產(chǎn)中的關(guān)鍵信息,并評(píng)估其對(duì)企業(yè)績(jī)效的潛在影響。此外,結(jié)合機(jī)器學(xué)習(xí)等先進(jìn)的數(shù)據(jù)分析技術(shù),可以進(jìn)一步深化對(duì)數(shù)據(jù)資產(chǎn)價(jià)值形成機(jī)制的理解,為企業(yè)提供更為精準(zhǔn)的數(shù)據(jù)資產(chǎn)管理和利用策略。
二、文獻(xiàn)綜述與指標(biāo)構(gòu)建
(一)文獻(xiàn)綜述
在中國(guó)經(jīng)濟(jì)高速發(fā)展的背景下,數(shù)據(jù)已經(jīng)成為創(chuàng)新和競(jìng)爭(zhēng)的新引擎。隨著“互聯(lián)網(wǎng)+”戰(zhàn)略的實(shí)施和數(shù)字化轉(zhuǎn)型的加速,數(shù)據(jù)資產(chǎn)的概念應(yīng)運(yùn)而生,逐漸成為企業(yè)最重要的無(wú)形資產(chǎn)之一。在傳統(tǒng)的資產(chǎn)分類(lèi)中,物質(zhì)資產(chǎn)長(zhǎng)期占據(jù)主導(dǎo)地位,然而,在數(shù)字經(jīng)濟(jì)的浪潮中,數(shù)據(jù)資產(chǎn)因其獨(dú)特的價(jià)值創(chuàng)造能力受到了政府、企業(yè)以及投資者的廣泛關(guān)注。在此背景下,企業(yè)需要重新審視和優(yōu)化其數(shù)據(jù)資產(chǎn)的管理策略,確保數(shù)據(jù)資產(chǎn)的有效利用和合規(guī)披露,以抓住數(shù)字經(jīng)濟(jì)時(shí)代的新機(jī)遇。同時(shí),這一變化也為研究者提供了新的研究方向,即探討數(shù)據(jù)資產(chǎn)管理和利用對(duì)企業(yè)績(jī)效及其在資本市場(chǎng)上表現(xiàn)的影響,從而為理解數(shù)據(jù)資產(chǎn)的經(jīng)濟(jì)價(jià)值和管理實(shí)踐提供新的視角和實(shí)證證據(jù)。因此,本文從數(shù)據(jù)資產(chǎn)的定義和形成、數(shù)據(jù)資產(chǎn)的衡量方法和數(shù)據(jù)資產(chǎn)的三個(gè)角度梳理相關(guān)文獻(xiàn)。
1.數(shù)據(jù)資產(chǎn)的定義和形成
對(duì)于數(shù)據(jù)資產(chǎn)的定義,目前學(xué)術(shù)界已經(jīng)有了很廣泛的討論,不同的學(xué)者從不同的角度闡述了什么樣的資產(chǎn)可以認(rèn)作數(shù)據(jù)資產(chǎn)。許憲春等(2022)認(rèn)為,數(shù)據(jù)資產(chǎn)是指擁有應(yīng)用場(chǎng)景且在生產(chǎn)過(guò)程中被反復(fù)或連續(xù)使用一年以上的數(shù)據(jù)。能被視作資產(chǎn)的數(shù)據(jù),一定是生產(chǎn)資產(chǎn),相應(yīng)的支出會(huì)作為固定資本形成直接對(duì) GDP 產(chǎn)生影響,從而反映出數(shù)據(jù)作為關(guān)鍵生產(chǎn)要素對(duì)經(jīng)濟(jì)增長(zhǎng)的貢獻(xiàn)。關(guān)于數(shù)據(jù)資產(chǎn)形成過(guò)程的研究有很多,比如美國(guó)經(jīng)濟(jì)分析局研究員Rassier資產(chǎn)的界定和形成過(guò)程進(jìn)行了詳細(xì)闡述,他認(rèn)為數(shù)據(jù)資產(chǎn)的形成一般需要經(jīng)過(guò)數(shù)據(jù)收集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理和數(shù)據(jù)應(yīng)用。中外關(guān)于數(shù)字資產(chǎn)的研究也有不同程度的進(jìn)展,中西方數(shù)據(jù)價(jià)值化的研究存在差異,而朱秀梅等(2023)統(tǒng)計(jì)梳理了在2022年關(guān)于數(shù)據(jù)價(jià)值化的250篇的英文文獻(xiàn)和117篇中文文獻(xiàn),這也表明數(shù)據(jù)資產(chǎn)已經(jīng)成為學(xué)術(shù)研究熱門(mén)的話題。當(dāng)然在數(shù)據(jù)資產(chǎn)形成中,研究數(shù)據(jù)生產(chǎn)過(guò)程中的“數(shù)據(jù)價(jià)值鏈”,為中國(guó)企業(yè)數(shù)據(jù)資產(chǎn)的統(tǒng)計(jì)和核算提供了理論依據(jù)和方法支撐也是非常有意義的(許憲春等,2022)。其次,羅玫等(2023)認(rèn)為要解決數(shù)據(jù)資產(chǎn)問(wèn)題,除了首先關(guān)注數(shù)據(jù)自身特征對(duì)確認(rèn)原則和計(jì)量方法的影響之外,更要?jiǎng)?chuàng)新出資產(chǎn)負(fù)債表理論的研究觀念及研究范式以適應(yīng)新的經(jīng)濟(jì)發(fā)展階段。當(dāng)然,隨著消費(fèi)者大數(shù)據(jù)在商業(yè)界中越來(lái)越多地被使用,會(huì)計(jì)準(zhǔn)則可能需要進(jìn)行修訂以充分展示一個(gè)組織的真實(shí)估值。審計(jì)人員將需要保證客戶(hù)的內(nèi)部控制能夠充分防止其消費(fèi)者數(shù)據(jù)集中的不準(zhǔn)確或重復(fù)條目,這對(duì)于提供準(zhǔn)確的估值至關(guān)重要,因?yàn)橹貜?fù)的數(shù)據(jù)條目可能會(huì)夸大用于決定企業(yè)消費(fèi)者數(shù)據(jù)估值的估值(Boehrns B E.2021)。馬克衛(wèi)等(2023)對(duì)各種數(shù)據(jù)資產(chǎn)估值方法的比較,包括基礎(chǔ)的成本法公允價(jià)值法貼現(xiàn)法,另外還額外比較了實(shí)物期權(quán)法、成分分析、博弈法、廣告收入法、支付意愿法、機(jī)器學(xué)習(xí)法未來(lái)應(yīng)用在數(shù)據(jù)資產(chǎn)估值的可行性分析。Moody等(1999)分別比較了數(shù)據(jù)價(jià)值衡量的方法,從不同的角度闡述了效用評(píng)價(jià)法、市場(chǎng)價(jià)值法和歷史成本法在進(jìn)行數(shù)據(jù)信息價(jià)值衡量適用的情形。李紅光等(2023)研究了數(shù)據(jù)資產(chǎn)化過(guò)程中的資產(chǎn)形成機(jī)制、價(jià)格形成機(jī)制和信用形成機(jī)制,提出數(shù)據(jù)資產(chǎn)在信息增信和風(fēng)險(xiǎn)補(bǔ)償增信方面均可為數(shù)據(jù)要素型企業(yè)提供新機(jī)制。龔強(qiáng)等(2022)基于不完全契約理論,對(duì)數(shù)據(jù)交易的機(jī)制設(shè)計(jì)問(wèn)題進(jìn)行系統(tǒng)理論分析。研究發(fā)現(xiàn),數(shù)據(jù)的“可用不可見(jiàn)”是突破“數(shù)據(jù)流通”與“數(shù)據(jù)安全”悖論的關(guān)鍵。“可用不可見(jiàn)”不僅是數(shù)據(jù)交易技術(shù)的變革,更是交易模式的創(chuàng)新。相比于數(shù)據(jù)所有權(quán)交易,數(shù)據(jù)使用權(quán)交易能夠更有效地提升數(shù)據(jù)采集激勵(lì),實(shí)現(xiàn)數(shù)據(jù)要素的高水平積累,充分發(fā)揮數(shù)據(jù)價(jià)值,從而佐證數(shù)據(jù)資產(chǎn)入表的合理性以及其對(duì)經(jīng)濟(jì)高質(zhì)量發(fā)展的作用。數(shù)據(jù)在處理中尤其要注意特別是重要數(shù)據(jù)、敏感數(shù)據(jù)的出境流動(dòng)時(shí),有很大的可能性會(huì)產(chǎn)生合規(guī)性風(fēng)險(xiǎn)(滕明明,2024)。
2.數(shù)據(jù)資產(chǎn)的衡量方法
研究數(shù)據(jù)資產(chǎn)是衡量方法非常具有前景的研究方向,文本分析就是一種非常好的能夠鑒別特征的方法(Figueiredo F,et al.2011)。而與數(shù)據(jù)資產(chǎn)聯(lián)系最為密切且研究較為成熟的是數(shù)字化。如Huixiang等(2022)采用文本挖掘方法從企業(yè)年報(bào)中提取與數(shù)字化相關(guān)的關(guān)鍵詞,并根據(jù)提取結(jié)果建立堅(jiān)實(shí)的數(shù)字化指標(biāo)。Srinivasan等(2023)基于數(shù)字詞匯披露構(gòu)建一個(gè)數(shù)字術(shù)語(yǔ)詞庫(kù),根據(jù)數(shù)字活動(dòng)的代理變量提及次數(shù)進(jìn)行分組得到量化分?jǐn)?shù)(0/1/2/3/4)。武常岐等(2022)基于上市公司年報(bào)文本進(jìn)行文本分析和詞頻統(tǒng)計(jì),詞頻作為衡量企業(yè)數(shù)字化轉(zhuǎn)型水平的代理指標(biāo),對(duì)詞典涵蓋的詞語(yǔ)進(jìn)行搜索、匹配和詞頻計(jì)數(shù)構(gòu)建企業(yè)數(shù)字化轉(zhuǎn)型的指標(biāo),研究了其對(duì)企業(yè)高質(zhì)量發(fā)展的促進(jìn)作用。Lu等(2023)通過(guò)問(wèn)卷調(diào)查的方法獲得數(shù)據(jù)的相關(guān)變量,發(fā)現(xiàn)其與托賓Q之間存在顯著的正相關(guān)關(guān)系。劉景江等(2023)將機(jī)器學(xué)習(xí)與傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)相結(jié)合有助于做出更加精準(zhǔn)的因果推斷,機(jī)器學(xué)習(xí)能夠在模式發(fā)現(xiàn)這一理論構(gòu)建的關(guān)鍵步驟中發(fā)揮重要作用。Li(2010)用機(jī)器學(xué)習(xí)的方法對(duì)于公司公告中的文本進(jìn)行分析,發(fā)現(xiàn)文本內(nèi)容和公司收益呈正相關(guān)。李健等(2023)通過(guò)主觀搜集關(guān)鍵詞的方式,根據(jù)詞在年報(bào)中出現(xiàn)的詞頻量化企業(yè)數(shù)據(jù)資產(chǎn),考察了數(shù)據(jù)資產(chǎn)對(duì)創(chuàng)新投入的影響及其機(jī)制。王勇等(2022)從流量博弈的視角出發(fā),基于電子商務(wù)平臺(tái)得出了流量數(shù)據(jù)的最優(yōu)定價(jià),揭示了商品基本屬性、流量轉(zhuǎn)化率以及成本等因素對(duì)最優(yōu)數(shù)據(jù)定價(jià)的影響機(jī)制。徐翔等(2023)以研發(fā)競(jìng)爭(zhēng)作為研究視角,研究了數(shù)據(jù)要素如何影響企業(yè)創(chuàng)新,其在研究過(guò)程中用到以行業(yè)分類(lèi)作為依據(jù)劃分,很好地區(qū)分出數(shù)字經(jīng)濟(jì)型企業(yè)并得出良好的回歸結(jié)果。
3.數(shù)據(jù)資產(chǎn)的相關(guān)研究
目前,國(guó)內(nèi)外已經(jīng)有較多關(guān)于以數(shù)據(jù)資產(chǎn)作為核心解釋變量進(jìn)行研究。Wamba等(2017)認(rèn)為數(shù)據(jù)資源會(huì)影響公司未來(lái)的盈利能力,并通過(guò)促進(jìn)更準(zhǔn)確地反映數(shù)據(jù)資產(chǎn)價(jià)值來(lái)提高財(cái)務(wù)報(bào)告的質(zhì)量;Feng等(2022)討論了亞馬遜、臉書(shū)、騰訊和沃爾瑪如何利用大數(shù)據(jù)為自己的業(yè)務(wù)創(chuàng)造價(jià)值,然后討論了為什么將大數(shù)據(jù)視為無(wú)形資產(chǎn)是有意義的;陸岷峰等(2023)指出企業(yè)數(shù)據(jù)資產(chǎn)有助于提升企業(yè)的產(chǎn)能利用率。機(jī)制檢驗(yàn)分析發(fā)現(xiàn),提高產(chǎn)品市場(chǎng)份額、抑制管理層跟風(fēng)投資、提升資源配置效率、助力企業(yè)轉(zhuǎn)型升級(jí)是企業(yè)數(shù)據(jù)資產(chǎn)提升企業(yè)產(chǎn)能利用率的重要途徑。進(jìn)一步研究發(fā)現(xiàn),企業(yè)數(shù)據(jù)資產(chǎn)還能通過(guò)提升企業(yè)產(chǎn)能利用率來(lái)改善企業(yè)業(yè)績(jī)和提升企業(yè)未來(lái)價(jià)值。路征等(2023)發(fā)現(xiàn)企業(yè)數(shù)據(jù)資產(chǎn)能夠顯著促進(jìn)自身發(fā)展水平的提高,這一結(jié)論在考慮內(nèi)生性問(wèn)題以及一系列穩(wěn)健性檢驗(yàn)后仍然成立,促進(jìn)作用是通過(guò)降低信息不對(duì)稱(chēng)程度、降低交易成本和提高企業(yè)創(chuàng)新能力三種路徑實(shí)現(xiàn)的。數(shù)據(jù)資產(chǎn)對(duì)企業(yè)發(fā)展的促進(jìn)作用在小規(guī)模企業(yè)和非國(guó)有企業(yè)、高新技術(shù)企業(yè)和制造業(yè)、建設(shè)有大數(shù)據(jù)交易平臺(tái)的地區(qū)和經(jīng)濟(jì)政策不確定性較低的地區(qū)中效果相對(duì)更明顯。劉濤雄等(2023)基于數(shù)據(jù)價(jià)值鏈的視角,使用成本法和增值法估算價(jià)值層面的數(shù)據(jù)資本形成額與數(shù)據(jù)資本對(duì)經(jīng)濟(jì)增長(zhǎng)的產(chǎn)出彈性和對(duì)經(jīng)濟(jì)增長(zhǎng)率的貢獻(xiàn)均明顯超過(guò)之前階段,已成為中國(guó)經(jīng)濟(jì)增長(zhǎng)重要?jiǎng)幽苤弧@钊5龋?023)則是從數(shù)據(jù)產(chǎn)權(quán)的角度闡述了其對(duì)數(shù)據(jù)共享帶來(lái)的促進(jìn)作用。危雁麟等(2022)通過(guò)運(yùn)用Word2Vec神經(jīng)網(wǎng)絡(luò)模型構(gòu)建文本詞典以挖掘年報(bào)中的文本信息,發(fā)現(xiàn)數(shù)據(jù)資產(chǎn)信息披露會(huì)對(duì)分析師預(yù)測(cè)準(zhǔn)確度產(chǎn)生影響。無(wú)論是從財(cái)務(wù)報(bào)告還是對(duì)宏觀經(jīng)濟(jì)發(fā)展促進(jìn)來(lái)說(shuō),數(shù)據(jù)資產(chǎn)的研究非常有必要,數(shù)據(jù)作為核心要素總是在各個(gè)層面上發(fā)揮著重大的作用。
三、實(shí)證研究
(一)樣本選擇與數(shù)據(jù)來(lái)源
1.樣本選擇
本研究旨在深入探討數(shù)據(jù)資產(chǎn)對(duì)上市公司財(cái)務(wù)績(jī)效的影響。為了實(shí)現(xiàn)這一目標(biāo),本文采用了來(lái)自Wind數(shù)據(jù)庫(kù)和國(guó)泰安數(shù)據(jù)庫(kù)的數(shù)據(jù)資源,獲取了2014—2022年間A股上市公司的財(cái)務(wù)數(shù)據(jù)以及相關(guān)企業(yè)信息,以構(gòu)建分析所需的模型變量。這一時(shí)間跨度涵蓋了中國(guó)經(jīng)濟(jì)快速發(fā)展和數(shù)字化轉(zhuǎn)型加速的關(guān)鍵階段,為研究提供了豐富而有價(jià)值的數(shù)據(jù)基礎(chǔ)。在數(shù)據(jù)收集過(guò)程中,特別關(guān)注了上市公司年報(bào)中的管理討論與分析(MDamp;A)部分,通過(guò)精細(xì)的文本分析技術(shù),從中摘取與數(shù)據(jù)資產(chǎn)相關(guān)的關(guān)鍵詞及其出現(xiàn)的頻次。這種方法旨在量化上市公司在數(shù)據(jù)資產(chǎn)管理和利用方面的關(guān)注程度和實(shí)踐深度,從而為評(píng)估數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效影響提供直接證據(jù)。由于研究期間內(nèi)部分公司可能會(huì)新上市或退市,同時(shí)也存在部分企業(yè)的相關(guān)數(shù)據(jù)不完整或缺失,因此,本研究采用了“短板數(shù)據(jù)”處理方法,即只選取在2014—2022年期間連續(xù)完整記錄的數(shù)據(jù),以保證模型分析的準(zhǔn)確性和可靠性。經(jīng)過(guò)這一篩選過(guò)程,本文最終得到了4911家上市企業(yè)的數(shù)據(jù)樣本,共計(jì)近30000個(gè)樣本數(shù)據(jù)點(diǎn),這為本研究的實(shí)證分析提供了堅(jiān)實(shí)的數(shù)據(jù)支持。通過(guò)運(yùn)用先進(jìn)的統(tǒng)計(jì)和計(jì)量經(jīng)濟(jì)學(xué)方法對(duì)這些數(shù)據(jù)進(jìn)行深入分析,本研究旨在揭示數(shù)據(jù)資產(chǎn)與企業(yè)財(cái)務(wù)績(jī)效之間的內(nèi)在聯(lián)系和影響機(jī)制。研究成果不僅期望為學(xué)術(shù)界提供新的理論見(jiàn)解,而且旨在為企業(yè)管理者、投資者和政策制定者在數(shù)據(jù)資產(chǎn)管理和評(píng)估方面提供實(shí)證基礎(chǔ)和決策參考。此外,本研究的方法論和發(fā)現(xiàn)也將為未來(lái)在數(shù)據(jù)資產(chǎn)價(jià)值量化和利用效率提升方面的研究奠定基礎(chǔ),對(duì)推動(dòng)數(shù)字經(jīng)濟(jì)的健康發(fā)展具有重要意義。
2.關(guān)鍵詞統(tǒng)計(jì)分析
在當(dāng)代經(jīng)濟(jì)環(huán)境下,數(shù)字化轉(zhuǎn)型已成為推動(dòng)企業(yè)持續(xù)增長(zhǎng)和競(jìng)爭(zhēng)力提升的關(guān)鍵因素。在這一背景下,數(shù)據(jù),作為數(shù)字化時(shí)代的核心資產(chǎn),其在企業(yè)戰(zhàn)略決策、運(yùn)營(yíng)優(yōu)化以及市場(chǎng)定位中的作用愈發(fā)凸顯。企業(yè)通過(guò)收集、分析和應(yīng)用大數(shù)據(jù),能夠獲得關(guān)鍵的商業(yè)洞察,推動(dòng)產(chǎn)品創(chuàng)新,優(yōu)化客戶(hù)體驗(yàn),提高運(yùn)營(yíng)效率。隨之而來(lái),數(shù)據(jù)資產(chǎn)的管理和利用成了企業(yè)管理層和研究者關(guān)注的焦點(diǎn)。
在進(jìn)行企業(yè)數(shù)據(jù)資產(chǎn)評(píng)估的研究中,本文首先采集了2014—2022年間所有A股上市公司年報(bào)的PDF文件。這些文件通過(guò)Python編程語(yǔ)言和pdfplumber工具的應(yīng)用被高效讀取,特別是聚焦于年報(bào)中的“管理層討論與分析”(MDamp;A)部分。本研究采取的方法如下:首先,構(gòu)建一個(gè)涵蓋數(shù)據(jù)資產(chǎn)相關(guān)詞匯的詞典,隨后統(tǒng)計(jì)這些詞匯在各個(gè)A股上市公司年報(bào)MDamp;A部分的出現(xiàn)次數(shù)。為了控制不同公司年報(bào)披露文本長(zhǎng)度的變異,本研究采用了詞典詞匯出現(xiàn)頻率與文檔總詞數(shù)之比作為衡量數(shù)據(jù)資產(chǎn)的關(guān)鍵指標(biāo),為后續(xù)模型提供解釋變量。
在數(shù)據(jù)資產(chǎn)相關(guān)詞匯的選取方面,手動(dòng)收集和基于文獻(xiàn)閱讀的方法存在較大主觀性,這種主觀性可能導(dǎo)致選取的詞匯實(shí)際上在企業(yè)年報(bào)中并不常見(jiàn)。為了克服這一問(wèn)題,本研究采用了基于TF-IDF(Term Frequency-Inverse Document Frequency)方法提取年報(bào)關(guān)鍵詞的技術(shù)。TF-IDF是一種在信息檢索和文本挖掘中廣泛使用的加權(quán)技術(shù),有效地反映了詞語(yǔ)在一篇文檔中的重要程度。TF-IDF通過(guò)計(jì)算詞語(yǔ)頻率和逆文檔頻率的乘積,既反映了詞語(yǔ)在特定文檔中的重要性,也調(diào)整了詞語(yǔ)在語(yǔ)料庫(kù)中的普遍重要性,從而為避免基于主觀偏見(jiàn)的詞匯選擇提供了一種客觀的方法論。具體計(jì)算方法如式(1)所示:
TF(Term Frequency):衡量一個(gè)詞在文檔中出現(xiàn)的頻率,計(jì)算方式是詞在文檔中出現(xiàn)的次數(shù)除以文檔的總詞數(shù)。
(1)
IDF(Inverse Document Frequency):衡量一個(gè)詞在整個(gè)文檔集中的重要性,計(jì)算方式是總文檔數(shù)除以包含該詞的文檔數(shù)的對(duì)數(shù),如式(2)所示:
(2)
最終的TF-IDF值是TF和IDF的乘積如式(3)所示:
(3)
它的目標(biāo)是評(píng)估一個(gè)詞對(duì)于一個(gè)文檔集或語(yǔ)料庫(kù)中的特定文檔的重要性,TF-IDF的作用是突出在一個(gè)文檔中頻繁出現(xiàn)、但在整個(gè)文檔集中較為罕見(jiàn)的詞語(yǔ),認(rèn)為這些詞對(duì)于該文檔的內(nèi)容具有重要性,這對(duì)于信息檢索、文本分類(lèi)等任務(wù)非常有用,通過(guò)這種方式,得到對(duì)應(yīng)文本所有詞匯的TF-IDF值從大到小排序,取前150個(gè)詞匯作為文本關(guān)鍵詞。
接下來(lái)問(wèn)題就是確認(rèn)選取數(shù)據(jù)資產(chǎn)特征詞獲取的文本,本文通過(guò)在Wind數(shù)據(jù)庫(kù)研報(bào)平臺(tái)以“數(shù)據(jù)資產(chǎn)”作為關(guān)鍵詞搜索研報(bào),可以得到所有證券公司以及其他金融機(jī)構(gòu)發(fā)布的所有關(guān)于數(shù)據(jù)資產(chǎn)研報(bào)。每一份研報(bào)中會(huì)提及和數(shù)據(jù)資產(chǎn)高度相關(guān)的企業(yè),通過(guò)手動(dòng)收集的方式獲取144家A股上市公司,再用python代碼實(shí)現(xiàn)摘取這144家企業(yè)2022年年報(bào)MDamp;A部分,合并為一個(gè)文檔,以此作為獲得數(shù)據(jù)資產(chǎn)特征詞的基礎(chǔ)文本。
另外,企業(yè)數(shù)字化相關(guān)的研究已經(jīng)有很多,其中很大一部分都是基于文本分析的方式來(lái)衡量企業(yè)的數(shù)字化程度。本文在選取企業(yè)數(shù)據(jù)資產(chǎn)衡量指標(biāo)的時(shí)候也借鑒該方法作為指標(biāo)衡量的核心方法。數(shù)字經(jīng)濟(jì)型企業(yè)在一定程度上會(huì)擁有更多的數(shù)據(jù)資產(chǎn),兩者內(nèi)在有極其密切的關(guān)聯(lián),數(shù)字化的過(guò)程中會(huì)形成一定數(shù)量的數(shù)據(jù)資產(chǎn),而數(shù)據(jù)資產(chǎn)的形成過(guò)程中也會(huì)涉及一定的數(shù)字化。因此,除了用TF-IDF的方法得到和數(shù)字資產(chǎn)相關(guān)特征詞,也用同樣的方法得到數(shù)字經(jīng)濟(jì)型企業(yè)的特征詞。我們按照證監(jiān)會(huì)2012年發(fā)布的《上市公司行業(yè)分類(lèi)指引》,將屬于信息傳輸或軟件和信息技術(shù)服務(wù)業(yè)或計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)的企業(yè)認(rèn)定為數(shù)字經(jīng)濟(jì)型企業(yè)(徐翔等,2023)。按照這種方法得到894家企業(yè),也用上述同樣的方式摘取年報(bào)MDamp;A部分合并為一個(gè)文檔,得到獲得數(shù)據(jù)經(jīng)濟(jì)型企業(yè)特征詞的基礎(chǔ)文本。接下來(lái),就可以用Python代碼實(shí)現(xiàn)兩類(lèi)文本特征詞的TF-IDF值的排序。為了深入理解數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效的具體影響,本文將重點(diǎn)關(guān)注上市公司年報(bào)中數(shù)據(jù)資產(chǎn)的表述和披露情況,以此作為分析數(shù)據(jù)資產(chǎn)在企業(yè)中重要性的窗口,具體操作方法見(jiàn)附錄。統(tǒng)計(jì)完所有公司年報(bào)MDamp;A關(guān)鍵詞出現(xiàn)次數(shù),總體統(tǒng)計(jì)結(jié)果如圖1所示。近年來(lái),隨著信息技術(shù)的迅速發(fā)展和大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)資產(chǎn)已成為企業(yè)價(jià)值鏈中的重要組成部分。數(shù)據(jù)資產(chǎn)的重要性不僅體現(xiàn)在其對(duì)企業(yè)內(nèi)部決策的影響,也體現(xiàn)在企業(yè)外部溝通如財(cái)務(wù)報(bào)告中的體現(xiàn)。
從2014—2022年的統(tǒng)計(jì)數(shù)據(jù)來(lái)看,統(tǒng)計(jì)的上市公司數(shù)量從2,071家增加到4,983家,約為2.5倍,而數(shù)據(jù)資產(chǎn)關(guān)鍵詞的出現(xiàn)次數(shù)卻有顯著增加,從2014年的36,031次增加到2022年的335,221次,短短九年之間數(shù)據(jù)資產(chǎn)關(guān)鍵詞的統(tǒng)計(jì)次數(shù)增加變化近十倍,數(shù)據(jù)資產(chǎn)重視程度大幅度提升。從圖中可以發(fā)現(xiàn),在社會(huì)發(fā)展的背景下,數(shù)據(jù)資產(chǎn)變化可以分為三個(gè)階段。2014—2016年,企業(yè)對(duì)數(shù)據(jù)資產(chǎn)的認(rèn)識(shí)尚處于初級(jí)階段。盡管互聯(lián)網(wǎng)已廣泛應(yīng)用于企業(yè)的日常運(yùn)營(yíng),數(shù)據(jù)資產(chǎn)的概念和價(jià)值卻未得到充分的認(rèn)識(shí)和利用。統(tǒng)計(jì)數(shù)據(jù)顯示,在這段時(shí)間內(nèi),數(shù)據(jù)資產(chǎn)關(guān)鍵詞的平均出現(xiàn)次數(shù)從17.4增加到19.2,這一變化雖然緩慢,卻預(yù)示著企業(yè)開(kāi)始逐漸重視數(shù)據(jù)的潛力。自2017年起,隨著大數(shù)據(jù)和人工智能等技術(shù)的推廣,企業(yè)開(kāi)始意識(shí)到數(shù)據(jù)資產(chǎn)對(duì)于競(jìng)爭(zhēng)優(yōu)勢(shì)的重要性。數(shù)據(jù)資產(chǎn)關(guān)鍵詞的平均出現(xiàn)次數(shù)穩(wěn)步增長(zhǎng),從21.3增加到30.9。這一變化反映了企業(yè)在這一時(shí)期加大了對(duì)數(shù)據(jù)資產(chǎn)的投入和管理,同時(shí)也凸顯企業(yè)在年報(bào)中提及數(shù)據(jù)資產(chǎn)的趨勢(shì)越來(lái)越明顯。而在2021年和2022年,數(shù)據(jù)資產(chǎn)關(guān)鍵詞總詞數(shù)和平均出現(xiàn)次數(shù)出現(xiàn)了飛躍性的增長(zhǎng),分別達(dá)到了總數(shù)33萬(wàn)和平均每家上市公司67.3次,這一躍升不僅反映了數(shù)據(jù)資產(chǎn)在企業(yè)中的戰(zhàn)略地位,也反映了社會(huì)對(duì)數(shù)據(jù)保護(hù)、數(shù)據(jù)交易和數(shù)據(jù)驅(qū)動(dòng)決策的高度關(guān)注。
在社會(huì)發(fā)展的背景下,數(shù)據(jù)資產(chǎn)的增長(zhǎng)不僅是技術(shù)進(jìn)步的結(jié)果,也是企業(yè)適應(yīng)市場(chǎng)變化、追求可持續(xù)發(fā)展的體現(xiàn)。數(shù)據(jù)資產(chǎn)的交易和分享為創(chuàng)新提供了新的途徑,推動(dòng)了新業(yè)務(wù)模式的發(fā)展。在此過(guò)程中,企業(yè)面臨的挑戰(zhàn)也日益顯現(xiàn)。如何確保數(shù)據(jù)的安全和隱私、如何衡量數(shù)據(jù)資產(chǎn)的價(jià)值,以及如何在保護(hù)數(shù)據(jù)原創(chuàng)性的同時(shí)促進(jìn)其流通,都是當(dāng)前企業(yè)亟須解決的問(wèn)題。隨著社會(huì)對(duì)數(shù)據(jù)資產(chǎn)的關(guān)注不斷增加,相關(guān)的法律法規(guī)也在不斷完善,這對(duì)企業(yè)來(lái)說(shuō)既是機(jī)遇也是挑戰(zhàn)。在未來(lái),隨著數(shù)據(jù)資產(chǎn)管理技術(shù)的進(jìn)一步發(fā)展和數(shù)據(jù)資產(chǎn)價(jià)值的充分挖掘,企業(yè)將更加依賴(lài)數(shù)據(jù)資產(chǎn)來(lái)推動(dòng)創(chuàng)新,提高競(jìng)爭(zhēng)力,實(shí)現(xiàn)可持續(xù)發(fā)展。
(二)定義變量與模型構(gòu)建
文本研究的內(nèi)容是基于文本分析的數(shù)據(jù)資產(chǎn)對(duì)上市公司企業(yè)績(jī)效的影響,模型構(gòu)建首先需要定義好能夠代表企業(yè)績(jī)效的指標(biāo)作為被解釋變量,以及在上文中研究方案中得到的上市公司衡量數(shù)據(jù)資產(chǎn)的特征關(guān)鍵詞的出現(xiàn)頻率,再根據(jù)研究的內(nèi)容選取控制變量。基于以上,構(gòu)建如下實(shí)證模型探究企業(yè)數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效的影響:
(4)
(4)式中,代表各個(gè)公司在不同年份對(duì)應(yīng)的權(quán)益回報(bào)率,是上文構(gòu)建的各個(gè)企業(yè)的數(shù)據(jù)資產(chǎn)衡量指標(biāo)關(guān)鍵詞出現(xiàn)的頻率,代表的是一系列控制變量,參考王永進(jìn)等(2016)和周鳳秀等(2017)的研究選取控制變量,包括企業(yè)規(guī)模、資本勞動(dòng)比、人口勞動(dòng)力和總收入,其中人口勞動(dòng)力和總收入取自然對(duì)數(shù),回歸過(guò)程中控制了企業(yè)和時(shí)間固定效應(yīng)。變量定義如下表所示:
(三)實(shí)證分析
1.變量描述性統(tǒng)計(jì)
各研究變量的描述性統(tǒng)計(jì)如下表所示。由表2可知:權(quán)益回報(bào)率(roe)作為衡量企業(yè)利用自有資本盈利能力的關(guān)鍵指標(biāo),平均值為5.79%,標(biāo)準(zhǔn)差為15.48%,反映了企業(yè)之間盈利能力的顯著差異。這種差異可能源于行業(yè)特性、企業(yè)規(guī)模、經(jīng)營(yíng)策略和市場(chǎng)定位的不同。尤其是最小值-81.23%到最大值39.20%的范圍,揭示了某些行業(yè)或企業(yè)可能面臨的高風(fēng)險(xiǎn)或特殊經(jīng)營(yíng)條件;特征詞頻(gl)和特征詞數(shù)(ln_tzcs)作為衡量企業(yè)年報(bào)信息披露質(zhì)量的指標(biāo),反映了企業(yè)透明度和信息披露習(xí)慣的行業(yè)差異。平均特征詞頻為0.64%,而特征詞數(shù)對(duì)數(shù)轉(zhuǎn)換的平均值為2.855,這可能指示不同企業(yè)在戰(zhàn)略溝通和信息披露方面采取了不同的策略。在監(jiān)管要求嚴(yán)格或投資者關(guān)注度高的行業(yè),特征詞的使用可能更為頻繁。企業(yè)規(guī)模(size)和資本勞動(dòng)比(k2l)反映了企業(yè)的規(guī)模經(jīng)濟(jì)和資本集約程度。企業(yè)規(guī)模對(duì)數(shù)的平均值為13.0253,資本勞動(dòng)比的平均值為3.3562,這揭示了大型企業(yè)可能更能有效利用資本和勞動(dòng)資源。在人力成本高昂或技術(shù)進(jìn)步迅速的行業(yè),資本勞動(dòng)比高的企業(yè)可能享有競(jìng)爭(zhēng)優(yōu)勢(shì)。是否國(guó)有控股(soe)的平均值為0.3261,表明在樣本中,約三分之一的企業(yè)為國(guó)有控股。國(guó)有企業(yè)與私營(yíng)企業(yè)在經(jīng)營(yíng)策略、資本獲取和市場(chǎng)反應(yīng)速度上可能存在本質(zhì)差異,這些差異在競(jìng)爭(zhēng)激烈或轉(zhuǎn)型期的行業(yè)中尤為明顯。
2.實(shí)證回歸分析
為研究上市公司數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效的影響,按照前文設(shè)定的模型(1)進(jìn)行估計(jì),為了避免由于極端情況下異常值對(duì)實(shí)證結(jié)果的影響,后續(xù)所有模型在回歸前,參考吳超鵬等(2019)的做法,對(duì)異常值即觀測(cè)值超過(guò)或小于均值三倍標(biāo)準(zhǔn)差范圍的變量,進(jìn)行了上下1%(即99%分位和1%分位)的winsor2縮尾處理。特征詞出現(xiàn)頻率在控制變量下對(duì)企業(yè)權(quán)益回報(bào)率roe回歸結(jié)果如表3所示:
由表3的回歸結(jié)果可以得到,以特征關(guān)鍵詞作為衡量標(biāo)準(zhǔn)的數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效存在顯著性影響,在未控制變量時(shí)估計(jì)系數(shù)為1.218,表示在1%的顯著性水平下,數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效存在顯著的正相關(guān);控制變量后,特征詞頻的估計(jì)系數(shù)為0.88,表示在1%的顯著性水平下,數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效存在顯著的正相關(guān)。其經(jīng)濟(jì)學(xué)含義上來(lái)說(shuō),特征詞頻每提升一個(gè)單位,企業(yè)績(jī)效就提高0.88個(gè)單位。結(jié)合描述性統(tǒng)計(jì)的結(jié)果來(lái)看,也就是特征詞頻每變動(dòng)一個(gè)標(biāo)準(zhǔn)差,企業(yè)績(jī)效roe就會(huì)變動(dòng)0.7%,相較于企業(yè)績(jī)效roe的平均值5.79%而言,將會(huì)產(chǎn)生均值12%的變動(dòng)。這一結(jié)果能夠表明基于年報(bào)披露信息的過(guò)程中,在保證其他控制變量的情況下,特征關(guān)鍵詞披露越多,即數(shù)據(jù)資產(chǎn)更為密集型的企業(yè),其企業(yè)績(jī)效表現(xiàn)更優(yōu),也就是說(shuō)企業(yè)數(shù)據(jù)資產(chǎn)水平會(huì)明顯對(duì)其企業(yè)績(jī)效產(chǎn)生正向影響。對(duì)于(3)(4)列回歸結(jié)果來(lái)看,通過(guò)對(duì)城市和企業(yè)進(jìn)行聚類(lèi),顯著性會(huì)有所差異,兩者標(biāo)準(zhǔn)誤都有不同程度變大,說(shuō)明數(shù)據(jù)資產(chǎn)在以這兩個(gè)標(biāo)準(zhǔn)進(jìn)行聚類(lèi)時(shí),對(duì)企業(yè)績(jī)效的影響存在不同程度的差異。當(dāng)以城市聚類(lèi)時(shí),顯著性降低但也能夠在5%的顯著性水平下,數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效存在顯著的正相關(guān),顯著性降低說(shuō)明不同城市的經(jīng)濟(jì)發(fā)展水平、產(chǎn)業(yè)政策和市場(chǎng)環(huán)境對(duì)企業(yè)的數(shù)據(jù)資產(chǎn)建設(shè)和利用產(chǎn)生影響,一些城市可能提供更多關(guān)于數(shù)據(jù)安全、數(shù)據(jù)交換的政策支持,促進(jìn)了企業(yè)數(shù)據(jù)資產(chǎn)的增值。在聚類(lèi)分析中顯著性的降低揭示了地域因素對(duì)數(shù)據(jù)資產(chǎn)利用效率和企業(yè)績(jī)效的潛在影響;而對(duì)于企業(yè)聚類(lèi)來(lái)看,在5%的顯著性水平下,數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效存在顯著的正相關(guān),顯著性略有降低說(shuō)明可能不同企業(yè)內(nèi)部的管理實(shí)踐、戰(zhàn)略方向和組織文化存在差異導(dǎo)致數(shù)據(jù)資產(chǎn)利用不同,這也反映了企業(yè)間在數(shù)據(jù)資產(chǎn)的收集、處理和應(yīng)用方面存在差異。第(5)個(gè)回歸模型是將自變量換成特征詞數(shù)的對(duì)數(shù)值,也在1%的顯著性水平下,數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效存在顯著的正相關(guān)。因此,數(shù)據(jù)資產(chǎn)會(huì)顯著影響企業(yè)績(jī)效。
3.穩(wěn)健性檢驗(yàn)
穩(wěn)健性檢驗(yàn)在經(jīng)濟(jì)學(xué)和金融學(xué)研究中扮演著重要角色,通過(guò)在不同條件下重復(fù)分析,穩(wěn)健性檢驗(yàn)幫助研究者確認(rèn)原始研究發(fā)現(xiàn)的可靠性。如果研究結(jié)果在多種情況下保持一致,那么這些發(fā)現(xiàn)就可以被認(rèn)為是穩(wěn)健的。本文采用替換關(guān)鍵變量的方式來(lái)驗(yàn)證穩(wěn)健性,分別為替換被解釋變量和替換解釋變量。替換關(guān)鍵變量之后重新對(duì)模型進(jìn)行回歸從而檢驗(yàn)其穩(wěn)健性。
(1)替換被解釋變量
除了roe能夠很好地衡量企業(yè)績(jī)效,市盈率(張慶亮等,2007)和托賓Q(朱焱等,2013)都能夠從特定角度衡量企業(yè)績(jī)效,它們反映的是企業(yè)績(jī)效的不同方面。市盈率更多地反映了市場(chǎng)對(duì)企業(yè)當(dāng)前和未來(lái)盈利能力的評(píng)估,而托賓的Q則反映了企業(yè)的增長(zhǎng)潛力和投資價(jià)值。因此,這兩個(gè)指標(biāo)可以提供企業(yè)績(jī)效的有用信息,為了避免市盈率會(huì)有很大的范圍,從極低到極高。取對(duì)數(shù)可以減少數(shù)據(jù)的偏斜性,使其更接近正態(tài)分布。回歸結(jié)果如表4所示:
用托賓Q和對(duì)市盈率代替特征詞頻進(jìn)行回歸,同時(shí)也做了將自變量gl換成ln_tzcs后的回歸。通過(guò)回歸結(jié)果可以看出,數(shù)據(jù)資產(chǎn)關(guān)鍵詞出現(xiàn)頻率的增加與市盈率的自然對(duì)數(shù)呈顯著的負(fù)相關(guān)關(guān)系。換句話說(shuō),隨著數(shù)據(jù)資產(chǎn)關(guān)鍵詞出現(xiàn)的頻率增加,公司的市盈率傾向于下降,這也能說(shuō)明隨著公司在其財(cái)務(wù)報(bào)告中更頻繁地提及數(shù)據(jù)資產(chǎn),這可能反映了企業(yè)對(duì)數(shù)據(jù)資產(chǎn)管理和風(fēng)險(xiǎn)的高度重視。這種增加的透明度可能使投資者更加明確意識(shí)到與數(shù)據(jù)資產(chǎn)相關(guān)的潛在風(fēng)險(xiǎn),如數(shù)據(jù)安全、隱私保護(hù)以及數(shù)據(jù)管理的合規(guī)要求等。因此,投資者可能會(huì)以更為謹(jǐn)慎的估值來(lái)反映這些風(fēng)險(xiǎn),導(dǎo)致市盈率下降。數(shù)據(jù)資產(chǎn)關(guān)鍵詞出現(xiàn)頻率增加與公司市盈率傾向于下降之間的關(guān)系表明,投資者和市場(chǎng)正在對(duì)數(shù)據(jù)資產(chǎn)及其對(duì)企業(yè)長(zhǎng)期績(jī)效影響進(jìn)行復(fù)雜的評(píng)估。這一現(xiàn)象突顯了對(duì)數(shù)據(jù)資產(chǎn)管理和戰(zhàn)略利用的深入理解對(duì)于正確評(píng)估企業(yè)價(jià)值的重要性;而數(shù)據(jù)資產(chǎn)關(guān)鍵詞出現(xiàn)頻率與托賓的Q之間存在正相關(guān)關(guān)系。二者的回歸至少都在5%的水平下是顯著的,均通過(guò)了顯著性檢驗(yàn)。
(2)替換核心解釋變量
由于數(shù)據(jù)資產(chǎn)密集型企業(yè)特征關(guān)鍵詞中有很多屬于數(shù)字型企業(yè)的關(guān)鍵詞,為了驗(yàn)證本文研究結(jié)果的穩(wěn)健性,剔除和數(shù)字型企業(yè)相關(guān)詞匯,選取其中和數(shù)據(jù)資產(chǎn)高度相關(guān)的詞匯,重新統(tǒng)計(jì)近30000個(gè)樣本MDamp;A部分的關(guān)鍵詞,從而完成替換解釋變量。選取的數(shù)據(jù)資產(chǎn)核心關(guān)鍵如表5所示,這類(lèi)詞匯更加集中涉及了數(shù)據(jù)資產(chǎn)形成過(guò)程中數(shù)據(jù)采集與整理、數(shù)據(jù)儲(chǔ)存與管理、數(shù)據(jù)處理與分析、數(shù)據(jù)安全與保護(hù)的環(huán)節(jié)。
再根據(jù)表5所得的詞匯重新統(tǒng)計(jì)每個(gè)年報(bào)MDamp;A部分詞頻得到gl2和ln_tzcs2變量,按照式(4)的回歸模型進(jìn)行回歸,回歸結(jié)果如表6所示。從表中可以得出,在不添加控制變量的(1)列中,回歸結(jié)果在1%的水平下是顯著的,第(2)列中添加控制變量后,系數(shù)有所減小,但其顯著性不變,相較于表3中的第(2)列,系數(shù)變?yōu)閷⒔瓉?lái)的兩倍,說(shuō)明在替換核心解釋變量之后,使得關(guān)鍵詞更加符合數(shù)據(jù)資產(chǎn)類(lèi)型的關(guān)鍵詞,回歸系數(shù)變?yōu)樵瓉?lái)的兩倍也能反映出數(shù)據(jù)資產(chǎn)對(duì)以roe作為衡量指標(biāo)的企業(yè)績(jī)效有顯著的正向作用。在第(3)(4)列中,按照企業(yè)和城市進(jìn)行聚類(lèi),雖然聚類(lèi)標(biāo)準(zhǔn)誤有所增大,但也能保證在1%的顯著水平下說(shuō)明數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效的影響是顯著的,同時(shí)在對(duì)統(tǒng)計(jì)的特征詞數(shù)取對(duì)數(shù)后作為解釋變量得到的回歸結(jié)果也是顯著的。因此,更加能夠代表數(shù)據(jù)資產(chǎn)的關(guān)鍵詞出來(lái)的統(tǒng)計(jì)結(jié)果做出的回歸表明了數(shù)據(jù)資產(chǎn)在作為一個(gè)新興的生產(chǎn)要素對(duì)企業(yè)績(jī)效的影響是更為顯著和深遠(yuǎn)的。這進(jìn)一步證明了數(shù)據(jù)資產(chǎn)作為企業(yè)資源配置的重要組成部分,對(duì)于提高企業(yè)的經(jīng)營(yíng)績(jī)效具有關(guān)鍵性的影響。特別是,在當(dāng)今數(shù)據(jù)驅(qū)動(dòng)的經(jīng)濟(jì)環(huán)境下,數(shù)據(jù)資產(chǎn)的有效管理和利用顯得尤為重要。本研究通過(guò)精細(xì)化的方法重新定義和量化了數(shù)據(jù)資產(chǎn)相關(guān)的核心詞匯,從而更準(zhǔn)確地捕捉了數(shù)據(jù)資產(chǎn)與企業(yè)績(jī)效之間的關(guān)系。
綜合上述替換核心解釋變量之后重新對(duì)模型回歸的回歸結(jié)果來(lái)看,本文建立的回歸模型有很好的穩(wěn)健性,可以認(rèn)為回歸結(jié)果是準(zhǔn)確可靠的。
4.異質(zhì)性檢驗(yàn)
為了揭示不同群體間的差異并且提高模型的解釋能力,本文對(duì)模型進(jìn)行異質(zhì)性檢驗(yàn)。異質(zhì)性檢驗(yàn)通過(guò)以下兩種分類(lèi)標(biāo)準(zhǔn)對(duì)樣本進(jìn)行分組回歸,回歸結(jié)果如表7所示。
(1)按照地理位置分成東部、中部和西部
中國(guó)的東部、中部、西部地區(qū)在經(jīng)濟(jì)發(fā)展水平上存在顯著差異。參考梁榜等(2019)的做法將樣本劃分為東部、中部、西部。東部地區(qū)通常經(jīng)濟(jì)更加發(fā)達(dá),擁有更成熟的市場(chǎng)環(huán)境、更高的人均收入水平和更完善的基礎(chǔ)設(shè)施。相比之下,中部和西部地區(qū)在這些方面可能相對(duì)落后,這種差異可能影響企業(yè)利用數(shù)據(jù)資產(chǎn)的能力和方式。同時(shí),不同地區(qū)受到的政策支持和市場(chǎng)環(huán)境也有所不同,不同地區(qū)企業(yè)在數(shù)據(jù)資產(chǎn)建設(shè)和應(yīng)用方面的策略可能存在差異。東部地區(qū)由于市場(chǎng)更為成熟,競(jìng)爭(zhēng)也更為激烈,企業(yè)可能更早地開(kāi)始積累和利用數(shù)據(jù)資產(chǎn)來(lái)獲取競(jìng)爭(zhēng)優(yōu)勢(shì)。
(2)按照控股人性質(zhì)分為國(guó)有和非國(guó)有
國(guó)有企業(yè)和非國(guó)有企業(yè)在資源獲取與配置效率上存在顯著差異。參考吳超鵬等(2016)在研究技術(shù)創(chuàng)新和企業(yè)績(jī)效將樣本分成國(guó)有和非國(guó)有的做法,國(guó)有企業(yè)可能更容易獲得政府的資金支持和政策傾斜,而非國(guó)有企業(yè)則需要在更為開(kāi)放和競(jìng)爭(zhēng)激烈的市場(chǎng)環(huán)境中生存,這對(duì)數(shù)據(jù)資產(chǎn)的建設(shè)和應(yīng)用策略產(chǎn)生影響。同時(shí)國(guó)有企業(yè)通常具有穩(wěn)定的管理機(jī)制,但可能在某些情況下缺乏足夠的創(chuàng)新動(dòng)力和靈活性。非國(guó)有企業(yè)在追求效率和創(chuàng)新方面可能更為積極,更傾向于利用數(shù)據(jù)資產(chǎn)來(lái)提升競(jìng)爭(zhēng)力。再者,國(guó)有企業(yè)和非國(guó)有企業(yè)在市場(chǎng)定位和業(yè)務(wù)模式上可能有所不同,這影響了它們對(duì)數(shù)據(jù)資產(chǎn)的需求和利用方式。非國(guó)有企業(yè)可能更側(cè)重于通過(guò)數(shù)據(jù)資產(chǎn)驅(qū)動(dòng)業(yè)務(wù)創(chuàng)新和模式創(chuàng)新,而國(guó)有企業(yè)可能更注重?cái)?shù)據(jù)資產(chǎn)在提升管理效率和服務(wù)質(zhì)量方面的作用。
根據(jù)表7回歸結(jié)果所示,以地區(qū)劃分依據(jù)來(lái)看,中部地區(qū)的回歸系數(shù)最高(2.729),且在1%的顯著性水平上顯著,表明在中部地區(qū),數(shù)據(jù)資產(chǎn)的關(guān)鍵詞出現(xiàn)頻率與企業(yè)績(jī)效之間的正相關(guān)關(guān)系最為強(qiáng)烈。這可能意味著中部地區(qū)的企業(yè)能夠更有效地利用數(shù)據(jù)資產(chǎn)來(lái)提升其績(jī)效;東部地區(qū)的回歸系數(shù)最小(0.527),但在10%的顯著性水平上顯著,這表明在經(jīng)濟(jì)較為發(fā)達(dá)的東部地區(qū),企業(yè)雖然經(jīng)濟(jì)更加發(fā)達(dá),數(shù)據(jù)資產(chǎn)的應(yīng)用也更為廣泛,但由于東部地區(qū)企業(yè)的基數(shù)較大,行業(yè)競(jìng)爭(zhēng)激烈,數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效的邊際影響可能相對(duì)較小,這可能是東部地區(qū)顯著性低于中部地區(qū)的原因之一,這也和梁榜等(2019)的回歸結(jié)果東部地區(qū)顯著性不好的結(jié)果一致。西部地區(qū)的不顯著反映了該地區(qū)在數(shù)據(jù)資產(chǎn)的應(yīng)用和管理方面還存在較大的提升空間。西部地區(qū)可能由于基礎(chǔ)設(shè)施、人才和技術(shù)應(yīng)用方面的限制,使得數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效的正面影響不如中部和東部地區(qū)顯著。
以控股人性質(zhì)劃分來(lái)看,在非國(guó)有企業(yè)中,數(shù)據(jù)資產(chǎn)的關(guān)鍵詞出現(xiàn)頻率與企業(yè)績(jī)效之間存在正相關(guān)關(guān)系,且在統(tǒng)計(jì)上顯著,但顯著性水平相對(duì)較低。這表明在非國(guó)有企業(yè)中,數(shù)據(jù)資產(chǎn)的積累和應(yīng)用對(duì)提升企業(yè)績(jī)效有一定的正面影響。然而,這種影響相對(duì)較為溫和,可能是由于非國(guó)有企業(yè)在數(shù)據(jù)資產(chǎn)的利用效率、技術(shù)應(yīng)用能力或資源獲取方面相對(duì)國(guó)有企業(yè)存在一定的限制。而在國(guó)有企業(yè)中,數(shù)據(jù)資產(chǎn)的關(guān)鍵詞出現(xiàn)頻率與企業(yè)績(jī)效之間的正相關(guān)關(guān)系更為顯著且系數(shù)較高,表明在國(guó)有企業(yè)中,數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效的正向影響更加明顯。這可能反映了國(guó)有企業(yè)在資源配置、技術(shù)投入以及政策支持等方面的優(yōu)勢(shì),使得它們能夠更有效地利用數(shù)據(jù)資產(chǎn)來(lái)提升績(jī)效。此外,國(guó)有企業(yè)可能因其規(guī)模和行業(yè)地位而更容易獲得數(shù)據(jù)資產(chǎn)相關(guān)的技術(shù)和人才資源,進(jìn)一步增強(qiáng)了數(shù)據(jù)資產(chǎn)對(duì)績(jī)效的積極影響。
四、結(jié)論與建議
(一)主要結(jié)論
在2014—2022年間,上市公司數(shù)量和數(shù)據(jù)資產(chǎn)關(guān)鍵詞的出現(xiàn)次數(shù)的顯著增長(zhǎng)反映了市場(chǎng)對(duì)數(shù)據(jù)資產(chǎn)重視程度的大幅提升,企業(yè)對(duì)數(shù)據(jù)資產(chǎn)的認(rèn)識(shí)經(jīng)歷了從初步認(rèn)識(shí)到深入理解的轉(zhuǎn)變,標(biāo)志著數(shù)據(jù)資產(chǎn)在企業(yè)戰(zhàn)略中的地位日益重要。隨著技術(shù)進(jìn)步和市場(chǎng)需求的演變,數(shù)據(jù)資產(chǎn)成為推動(dòng)企業(yè)創(chuàng)新、提高競(jìng)爭(zhēng)力和實(shí)現(xiàn)可持續(xù)發(fā)展的關(guān)鍵資源。面臨數(shù)據(jù)安全和隱私保護(hù)的挑戰(zhàn),企業(yè)需適應(yīng)不斷完善的法律法規(guī)環(huán)境,合理評(píng)估和利用數(shù)據(jù)資產(chǎn),以促進(jìn)其在新經(jīng)濟(jì)形勢(shì)下的發(fā)展。
通過(guò)回歸分析,探討了數(shù)據(jù)資產(chǎn)對(duì)上市公司績(jī)效的影響,并得出了數(shù)據(jù)資產(chǎn)顯著提高企業(yè)績(jī)效的結(jié)論。在不同的模型設(shè)定下,數(shù)據(jù)資產(chǎn)的特征關(guān)鍵詞出現(xiàn)頻率與企業(yè)績(jī)效之間均顯示出正向的顯著關(guān)系。這一發(fā)現(xiàn)表明,隨著數(shù)據(jù)資產(chǎn)的增加,企業(yè)的績(jī)效水平也相應(yīng)提高,數(shù)據(jù)資產(chǎn)披露每提升一個(gè)單位,企業(yè)績(jī)效就提高0.88個(gè)單位。結(jié)合描述性統(tǒng)計(jì)的結(jié)果來(lái)看,數(shù)據(jù)資產(chǎn)每變動(dòng)一個(gè)標(biāo)準(zhǔn)差,企業(yè)績(jī)效roe就會(huì)變動(dòng)0.7%,相較于企業(yè)績(jī)效roe的平均值5.79%而言,將會(huì)產(chǎn)生均值12%的變動(dòng)。這表明在保證其他控制變量的情況下,數(shù)據(jù)資產(chǎn)披露越多,其企業(yè)績(jī)效表現(xiàn)更優(yōu)。此外,通過(guò)對(duì)行業(yè)、城市和企業(yè)進(jìn)行聚類(lèi)分析,研究發(fā)現(xiàn)數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效的影響在不同聚類(lèi)中存在異質(zhì)性。這表明行業(yè)特性、地域差異和企業(yè)內(nèi)部管理實(shí)踐等因素都會(huì)影響數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效的具體影響程度。這些發(fā)現(xiàn)強(qiáng)調(diào)了在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)應(yīng)加強(qiáng)數(shù)據(jù)資產(chǎn)的管理與利用,同時(shí)考慮行業(yè)特性、地域差異和內(nèi)部管理實(shí)踐等因素,以充分挖掘數(shù)據(jù)資產(chǎn)的潛力,進(jìn)而提升企業(yè)績(jī)效。
(二)相關(guān)建議
強(qiáng)化數(shù)據(jù)資產(chǎn)管理與戰(zhàn)略融合:企業(yè)應(yīng)將數(shù)據(jù)資產(chǎn)視為核心戰(zhàn)略資源,通過(guò)高級(jí)管理層的積極參與和支持,將數(shù)據(jù)資產(chǎn)管理融入企業(yè)文化和日常運(yùn)營(yíng)中。建議企業(yè)建立專(zhuān)門(mén)的數(shù)據(jù)管理部門(mén),負(fù)責(zé)數(shù)據(jù)資產(chǎn)的收集、整理和分析工作,同時(shí)加強(qiáng)數(shù)據(jù)安全和隱私保護(hù)措施。為了適應(yīng)快速變化的市場(chǎng)和技術(shù)環(huán)境,企業(yè)還應(yīng)定期評(píng)估其數(shù)據(jù)資產(chǎn)策略,確保其與企業(yè)的長(zhǎng)期目標(biāo)和市場(chǎng)需求保持一致。此外,通過(guò)培訓(xùn)和教育,提高全員對(duì)數(shù)據(jù)資產(chǎn)重要性的認(rèn)識(shí)和理解,可以進(jìn)一步增強(qiáng)企業(yè)內(nèi)部對(duì)數(shù)據(jù)驅(qū)動(dòng)決策的支持。
針對(duì)地區(qū)特性和行業(yè)差異制定定制化策略:考慮到不同地區(qū)和行業(yè)對(duì)數(shù)據(jù)資產(chǎn)利用的差異性,企業(yè)應(yīng)根據(jù)自身所在地區(qū)的經(jīng)濟(jì)環(huán)境、政策支持和市場(chǎng)需求,以及所處行業(yè)的特性,制定更為精準(zhǔn)的數(shù)據(jù)資產(chǎn)利用策略。對(duì)于中部地區(qū)的企業(yè),鑒于其對(duì)數(shù)據(jù)資產(chǎn)的敏感性和潛在的政策優(yōu)勢(shì),應(yīng)著力于提高數(shù)據(jù)資產(chǎn)的收集和分析能力,同時(shí)積極尋求政府支持和合作機(jī)會(huì),以加速數(shù)據(jù)資產(chǎn)的有效利用。對(duì)于東部地區(qū)的企業(yè),應(yīng)關(guān)注提高數(shù)據(jù)資產(chǎn)利用的質(zhì)量和效率,通過(guò)技術(shù)創(chuàng)新和模式創(chuàng)新,探索數(shù)據(jù)資產(chǎn)的更深層次應(yīng)用,以在競(jìng)爭(zhēng)激烈的市場(chǎng)中獲得優(yōu)勢(shì)。西部地區(qū)的企業(yè)則應(yīng)注重基礎(chǔ)設(shè)施和人才的建設(shè),通過(guò)技術(shù)引進(jìn)和人才培養(yǎng),提高數(shù)據(jù)管理和分析能力,開(kāi)發(fā)數(shù)據(jù)資產(chǎn)的潛在價(jià)值。
提升非國(guó)有企業(yè)的數(shù)據(jù)資產(chǎn)利用效率:雖然國(guó)有企業(yè)在數(shù)據(jù)資產(chǎn)利用上具有一定優(yōu)勢(shì),但非國(guó)有企業(yè)同樣擁有通過(guò)提高數(shù)據(jù)資產(chǎn)管理和利用效率來(lái)提升績(jī)效的潛力。建議非國(guó)有企業(yè)加大對(duì)數(shù)據(jù)技術(shù)的投入,例如采用云計(jì)算、大數(shù)據(jù)分析和人工智能等先進(jìn)技術(shù),以提高數(shù)據(jù)處理和分析的能力。此外,非國(guó)有企業(yè)應(yīng)積極尋求與政府、高校和研究機(jī)構(gòu)的合作,通過(guò)共享資源和知識(shí),加速數(shù)據(jù)資產(chǎn)的應(yīng)用和創(chuàng)新。同時(shí),非國(guó)有企業(yè)還應(yīng)注重提升組織內(nèi)部的數(shù)據(jù)文化,通過(guò)培訓(xùn)和激勵(lì)機(jī)制,鼓勵(lì)員工參與到數(shù)據(jù)資產(chǎn)的管理和利用中,以提高整個(gè)組織的數(shù)據(jù)敏感性和利用效率。
參考文獻(xiàn):
[1]Boehrns, B.E. Accounting Implications Derived From Consumer Big Data[J]. 2021.
[2]Chen, W. and Srinivasan, S. Going Digital: Implications for Firm Value and Performance[J]. Review of Accounting Studies, 2023: 1-47.
[3]Feng, X., Maoyue, X. and Lingjuan, Z. Recognition and Evaluation of Data as Intangible Assets[J].SAGE Open,2022,12(2):
[4]Figueiredo, F., Rocha, L. and Couto, T. Word Co-occurrence Features for Text Classification[J].Information Systems,2011,36(5):843-858.
[5]Huixiang, Z., Hangxin, R. and Qiong, Z. The Financial Effect of Firm Digitalization: Evidence from China[J].Technological Forecasting Social Change,2022,183
[6]Li, F. The Information Content of Forward-looking Statements in Corporate Filings—A naive Bayesian Machine Learning Approach[J]. Journal of Accounting Research, 2010, 48(5): 1049-1102.
[7]Lu, Z. and Li, H. Does Environmental Information Disclosure Affect gGreen Innovation?[J]. Economic Analysis and Policy, 2023, 80: 47-59.
[8]Moody, D.L. and Walsh, P. Measuring the Value Of Information-An Asset Valuation Approach[C]//ECIS. 1999: 496-512.
[9]Rassier, D.G., Kornfeld, R.J. and Strassner, E.H. Treatment of Data in National Accounts[J]. BEA Advisory Committee. Burau of Economic Analysis, 2019.
[10]Sparck Jones, K. A Statistical Interpretation of Term sSpecificity and Its Application in Retrieval[J]. Journal of Documentation, 1972, 28(1): 11-21.
[11]Wamba, F.S., Gunasekaran, A. and Akter, S. Big Data Analytics and Firm Performance: Effects of Dynamic Capabilities[J].Journal of Business Research,2017,70356-365.
[12]財(cái)政部關(guān)于印發(fā)《企業(yè)數(shù)據(jù)資源相關(guān)會(huì)計(jì)處理暫行規(guī)定》的通知[J]. 中華人民共和國(guó)國(guó)務(wù)院公報(bào), 2023(28): 20-24.
[13]龔強(qiáng), 班銘媛, 劉沖. 數(shù)據(jù)交易之悖論與突破:不完全契約視角[J]. 經(jīng)濟(jì)研究, 2022,57(07): 172-188.
[14]李紅光, 王磊, 李穎. 數(shù)據(jù)資產(chǎn)化視角下企業(yè)增信機(jī)制研究——基于深圳的實(shí)踐探索[J]. 價(jià)格理論與實(shí)踐, 2023,(04): 33-37.
[15]李健, 董小凡, 張金林等. 數(shù)據(jù)資產(chǎn)對(duì)企業(yè)創(chuàng)新投入的影響研究[J/OL]. 外國(guó)經(jīng)濟(jì)與管理, 1-16[2023-12-03].
[16]李三希, 王泰茗, 劉小魯. 數(shù)據(jù)投資、數(shù)據(jù)共享與數(shù)據(jù)產(chǎn)權(quán)分配[J]. 經(jīng)濟(jì)研究, 2023,58(07): 139-155.
[17]梁榜, 張建華. 數(shù)字普惠金融發(fā)展能激勵(lì)創(chuàng)新嗎?——來(lái)自中國(guó)城市和中小企業(yè)的證據(jù)[J]. 當(dāng)代經(jīng)濟(jì)科學(xué), 2019,41(05): 74-86.
[18]劉景江, 鄭暢然, 洪永淼. 機(jī)器學(xué)習(xí)如何賦能管理學(xué)研究?——國(guó)內(nèi)外前沿綜述和未來(lái)展望[J]. 管理世界, 2023,39(09): 191-216.
[19]劉濤雄, 戎珂, 張亞迪. 數(shù)據(jù)資本估算及對(duì)中國(guó)經(jīng)濟(jì)增長(zhǎng)的貢獻(xiàn)——基于數(shù)據(jù)價(jià)值鏈的視角[J]. 中國(guó)社會(huì)科學(xué), 2023,(10): 44-64+205.
[20]劉玉廷. 《企業(yè)會(huì)計(jì)制度》的中國(guó)特色及與國(guó)際慣例的協(xié)調(diào)[J]. 會(huì)計(jì)研究, 2001(03):3-8+65.
[21]陸岷峰, 王穩(wěn)華, 朱震. 數(shù)據(jù)資產(chǎn)如何賦能企業(yè)高質(zhì)量發(fā)展——基于產(chǎn)能利用率視角的經(jīng)驗(yàn)證據(jù)[J]. 上海商學(xué)院學(xué)報(bào), 2023,24(04): 22-41.
[22]路征, 周婷, 王理等. 數(shù)據(jù)資產(chǎn)與企業(yè)發(fā)展——來(lái)自中國(guó)上市公司的經(jīng)驗(yàn)證據(jù)[J]. 產(chǎn)業(yè)經(jīng)濟(jì)研究, 2023(04): 128-142.
[23]羅玫, 李金璞, 湯珂. 企業(yè)數(shù)據(jù)資產(chǎn)化:會(huì)計(jì)確認(rèn)與價(jià)值評(píng)估[J]. 清華大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版), 2023,38(05): 195-209+226.
[24]馬克衛(wèi), 王碩, 苑杰. 數(shù)據(jù)資產(chǎn)核算應(yīng)用研究:理論與實(shí)踐[J]. 中南財(cái)經(jīng)政法大學(xué)學(xué)報(bào), 2023(05): 149-160.
[25]滕明明. 數(shù)據(jù)要素流動(dòng)與數(shù)據(jù)資產(chǎn)入表:關(guān)系、風(fēng)險(xiǎn)與對(duì)策[J]. 國(guó)際商務(wù)財(cái)會(huì), 2024, (13): 30-33.
[26]王永進(jìn), 劉燦雷. 國(guó)有企業(yè)上游壟斷阻礙了中國(guó)的經(jīng)濟(jì)增長(zhǎng)?——基于制造業(yè)數(shù)據(jù)的微觀考察[J]. 管理世界, 2016(06): 10-21+187.
[27]王勇, 劉樂(lè)易, 遲熙等. 流量博弈與流量數(shù)據(jù)的最優(yōu)定價(jià)——基于電子商務(wù)平臺(tái)的視角[J]. 管理世界, 2022,38(08): 116-132.
[28]危雁麟, 張俊瑞, 汪方軍等. 數(shù)據(jù)資產(chǎn)信息披露與分析師盈余預(yù)測(cè)關(guān)系研究——基于文本分析的經(jīng)驗(yàn)證據(jù)[J]. 管理工程報(bào), 2022,36(05): 130-141.
[29]吳超鵬, 唐菂. 知識(shí)產(chǎn)權(quán)保護(hù)執(zhí)法力度、技術(shù)創(chuàng)新與企業(yè)績(jī)效——來(lái)自中國(guó)上市公司的證據(jù)[J]. 經(jīng)濟(jì)研究, 2016,51(11): 125-139.
[30]武常岐, 張昆賢, 周欣雨等. 數(shù)字化轉(zhuǎn)型、競(jìng)爭(zhēng)戰(zhàn)略選擇與企業(yè)高質(zhì)量發(fā)展——基于機(jī)器學(xué)習(xí)與文本分析的證據(jù)[J]. 經(jīng)濟(jì)管理, 2022,44(04): 5-22.
[31]徐翔, 趙墨非, 李濤等. 數(shù)據(jù)要素與企業(yè)創(chuàng)新:基于研發(fā)競(jìng)爭(zhēng)的視角[J]. 經(jīng)濟(jì)研究, 2023,58(02): 39-56.
[32]許帥, 邵帥, 何賢杰. 業(yè)績(jī)說(shuō)明會(huì)前瞻性信息對(duì)分析師盈余預(yù)測(cè)準(zhǔn)確性的影響——信口雌黃還是言而有征[J/OL]. 中國(guó)管理科學(xué), 1-15[2023-12-03]. https://doi.org/10.16381/j.cnki.issn1003-207x.2022.0771.
[33]許憲春, 張鐘文, 亞茹. 數(shù)據(jù)資產(chǎn)統(tǒng)計(jì)與核算問(wèn)題研究[J]. 管理世界, 2022,38(02): 16-30+2.
[34]張慶亮, 孫景同. 我國(guó)產(chǎn)融結(jié)合有效性的企業(yè)績(jī)效分析[J]. 中國(guó)工業(yè)經(jīng)濟(jì), 2007(07): 96-102.
[35]周鳳秀, 張建華. 貿(mào)易自由化、融資約束與企業(yè)創(chuàng)新——來(lái)自中國(guó)制造業(yè)企業(yè)的經(jīng)驗(yàn)研究[J]. 當(dāng)代財(cái)經(jīng), 2017(06): 100-108.
[36]朱繼軍, 劉洋, 許志勇. 數(shù)據(jù)資源資產(chǎn)化入表風(fēng)險(xiǎn)探討[J]. 財(cái)會(huì)通訊, 2024,(13): 91-96.
[37]朱秀梅, 林曉玥, 王天東等. 數(shù)據(jù)價(jià)值化:研究評(píng)述與展望[J].外國(guó)經(jīng)濟(jì)與管理, 2023,45(12): 3-17.
[38]朱焱, 張孟昌. 企業(yè)管理團(tuán)隊(duì)人力資本、研發(fā)投入與企業(yè)績(jī)效的實(shí)證研究[J]. 會(huì)計(jì)研究, 2013(11): 45-52+96.
附錄:數(shù)據(jù)資產(chǎn)衡量指標(biāo)構(gòu)建方法
為了深入探索數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效的潛在影響,本研究首先開(kāi)發(fā)了一個(gè)企業(yè)數(shù)據(jù)資產(chǎn)衡量指標(biāo)。考慮到現(xiàn)有的財(cái)務(wù)報(bào)告體系中缺乏專(zhuān)門(mén)針對(duì)數(shù)據(jù)資產(chǎn)的分類(lèi)和明細(xì),本研究采納了一種基于文本分析的方法論。在數(shù)字化經(jīng)濟(jì)的背景下,企業(yè)不斷涉及數(shù)據(jù)的收集、處理、存儲(chǔ),以及交易等多個(gè)環(huán)節(jié),這些環(huán)節(jié)累積貢獻(xiàn)于數(shù)據(jù)資產(chǎn)的形成,并在企業(yè)的年度報(bào)告中得到相應(yīng)的體現(xiàn)。因此,本研究提出一個(gè)假設(shè):企業(yè)年報(bào)中與數(shù)據(jù)資產(chǎn)相關(guān)的關(guān)鍵詞出現(xiàn)的頻次越高,表明該企業(yè)所擁有的數(shù)據(jù)資產(chǎn)越為豐富和深入。基于此,年報(bào)中數(shù)據(jù)資產(chǎn)相關(guān)關(guān)鍵詞的提及頻率成為一種衡量企業(yè)數(shù)據(jù)資產(chǎn)水平的有效指標(biāo),旨在為后續(xù)的實(shí)證分析提供一個(gè)量化的基礎(chǔ)。
進(jìn)一步地,本研究將上述衡量得出的數(shù)據(jù)資產(chǎn)指標(biāo)作為主要的解釋變量,用于分析其對(duì)企業(yè)績(jī)效的具體影響。企業(yè)績(jī)效的衡量采用了一系列綜合性指標(biāo),如權(quán)益回報(bào)率(代表企業(yè)財(cái)務(wù)績(jī)效),市盈率(反映市場(chǎng)對(duì)企業(yè)盈利能力的評(píng)價(jià))、以及托賓Q值(指示市場(chǎng)對(duì)公司投資價(jià)值的認(rèn)可程度)。通過(guò)這些多維度的衡量指標(biāo),本研究旨在全面評(píng)估數(shù)據(jù)資產(chǎn)對(duì)企業(yè)績(jī)效的影響。同時(shí),為了確保回歸分析結(jié)果的準(zhǔn)確性和可靠性,研究中還將考慮引入一系列與企業(yè)績(jī)效密切相關(guān)的控制變量,以剔除其他潛在干擾因素的影響。本研究的目的在于通過(guò)精細(xì)化的實(shí)證分析,揭示數(shù)據(jù)資產(chǎn)如何作為現(xiàn)代企業(yè)競(jìng)爭(zhēng)力的一個(gè)關(guān)鍵因素,對(duì)企業(yè)的盈利能力、市場(chǎng)評(píng)價(jià)和投資價(jià)值產(chǎn)生影響,從而為理解數(shù)據(jù)資產(chǎn)在加速企業(yè)創(chuàng)新和提升績(jī)效方面的作用提供新的理論和實(shí)踐證據(jù)。
(一)年報(bào)關(guān)鍵詞提取技術(shù)
在進(jìn)行企業(yè)數(shù)據(jù)資產(chǎn)評(píng)估的研究中,本文首先采集了2014—2022年間所有A股上市公司年報(bào)的PDF文件。這些文件通過(guò)Python編程語(yǔ)言和pdfplumber工具的應(yīng)用被高效讀取,特別是聚焦于年報(bào)中的“管理層討論與分析”(MDamp;A)部分。據(jù)許帥(2023)所述,基于年報(bào)MDamp;A部分進(jìn)行文本分析是當(dāng)前學(xué)術(shù)界廣泛采用的一種方法。不僅是數(shù)字化程度的分析,情感分析等多維度的研究也常常以此為基礎(chǔ)。因此,本研究亦選擇以企業(yè)年報(bào)的MDamp;A部分作為文本分析的主要來(lái)源。
在具體的文本分析過(guò)程中,傳統(tǒng)方法多基于報(bào)告中的文字信息來(lái)提取研究所需的數(shù)據(jù)。針對(duì)企業(yè)數(shù)字化轉(zhuǎn)型的相關(guān)研究,廣泛的做法是通過(guò)預(yù)先收集和設(shè)定與數(shù)字化轉(zhuǎn)型相關(guān)的詞匯構(gòu)建詞典,隨后統(tǒng)計(jì)這些詞匯在年報(bào)中出現(xiàn)的次數(shù),或者根據(jù)詞典詞匯的出現(xiàn)與否來(lái)設(shè)定衡量指標(biāo)。例如,若年報(bào)中出現(xiàn)與數(shù)字化轉(zhuǎn)型相關(guān)的詞匯,則記為1;反之,未出現(xiàn)則記為0。這種方法在處理極少數(shù)關(guān)鍵詞時(shí)頗為適用。然而,隨著互聯(lián)網(wǎng)時(shí)代的進(jìn)展,幾乎不可能找到完全未提及該類(lèi)詞匯的公司。因此,部分學(xué)者對(duì)此方法進(jìn)行了改良,提出將每個(gè)詞匯視作0或1的變量,通過(guò)是否出現(xiàn)來(lái)區(qū)分,進(jìn)而進(jìn)行匯總分析,以應(yīng)對(duì)詞匯過(guò)多導(dǎo)致的分類(lèi)困境。
進(jìn)一步地,也有研究者通過(guò)閱讀文獻(xiàn)的方式構(gòu)建詞典,利用總詞頻作為衡量數(shù)字化轉(zhuǎn)型程度的指標(biāo)。這種方法尤其適用于在數(shù)據(jù)密集型時(shí)代背景下,新出現(xiàn)的與數(shù)字化轉(zhuǎn)型相關(guān)的詞匯越來(lái)越多的情形。本研究采取的方法如下:首先,構(gòu)建一個(gè)涵蓋數(shù)據(jù)資產(chǎn)相關(guān)詞匯的詞典,隨后統(tǒng)計(jì)這些詞匯在各個(gè)A股上市公司年報(bào)MDamp;A部分的出現(xiàn)次數(shù)。為了控制不同公司年報(bào)披露文本長(zhǎng)度的變異,本研究采用了詞典詞匯出現(xiàn)頻率與文檔總詞數(shù)之比作為衡量數(shù)據(jù)資產(chǎn)的關(guān)鍵指標(biāo),為后續(xù)模型提供解釋變量。
在數(shù)據(jù)資產(chǎn)相關(guān)詞匯的選取方面,手動(dòng)收集和基于文獻(xiàn)閱讀的方法存在較大主觀性,這種主觀性可能導(dǎo)致選取的詞匯實(shí)際上在企業(yè)年報(bào)中并不常見(jiàn)。為了克服這一問(wèn)題,本研究采用了基于TF-IDF(Term Frequency-Inverse Document Frequency)方法提取年報(bào)關(guān)鍵詞的技術(shù)。TF-IDF是一種在信息檢索和文本挖掘中廣泛使用的加權(quán)技術(shù),有效地反映了詞語(yǔ)在一篇文檔中的重要程度。該方法由Karen Sp?rck Jones在1972年提出,并在其后的文章中進(jìn)行了系統(tǒng)闡述和推廣,因此她在TF-IDF發(fā)展史上作出的貢獻(xiàn)被廣泛認(rèn)可。TF-IDF通過(guò)計(jì)算詞語(yǔ)頻率和逆文檔頻率的乘積,既反映了詞語(yǔ)在特定文檔中的重要性,也調(diào)整了詞語(yǔ)在語(yǔ)料庫(kù)中的普遍重要性,從而為避免基于主觀偏見(jiàn)的詞匯選擇提供了一種客觀的方法論。具體計(jì)算方法如式(1)所示:
TF(Term Frequency):衡量一個(gè)詞在文檔中出現(xiàn)的頻率,計(jì)算方式是詞在文檔中出現(xiàn)的次數(shù)除以文檔的總詞數(shù)。
(1)
IDF(Inverse Document Frequency):衡量一個(gè)詞在整個(gè)文檔集中的重要性,計(jì)算方式是總文檔數(shù)除以包含該詞的文檔數(shù)的對(duì)數(shù),如式(2)所示:
(2)
最終的TF-IDF值是TF和IDF的乘積如式(3)所示:
(3)
它的目標(biāo)是評(píng)估一個(gè)詞對(duì)于一個(gè)文檔集或語(yǔ)料庫(kù)中的特定文檔的重要性,TF-IDF的作用是突出在一個(gè)文檔中頻繁出現(xiàn)、但在整個(gè)文檔集中較為罕見(jiàn)的詞語(yǔ),認(rèn)為這些詞對(duì)于該文檔的內(nèi)容具有重要性,這對(duì)于信息檢索、文本分類(lèi)等任務(wù)非常有用,通過(guò)這種方式,得到對(duì)應(yīng)文本所有詞匯的TF-IDF值從大到小排序,取前150個(gè)詞匯作為文本關(guān)鍵詞。
接下來(lái)問(wèn)題就是確認(rèn)選取數(shù)據(jù)資產(chǎn)特征詞獲取的文本,本文通過(guò)在Wind數(shù)據(jù)庫(kù)研報(bào)平臺(tái)以“數(shù)據(jù)資產(chǎn)”作為關(guān)鍵詞搜索研報(bào),可以得到所有證券公司以及其他金融機(jī)構(gòu)發(fā)布的所有關(guān)于數(shù)據(jù)資產(chǎn)研報(bào),每一份研報(bào)中會(huì)提及和數(shù)據(jù)資產(chǎn)高度相關(guān)的企業(yè),通過(guò)手動(dòng)收集的方式獲取144家A股上市公司,再用python代碼實(shí)現(xiàn)摘取這144家企業(yè)2022年年報(bào)MDamp;A部分,合并為一個(gè)文檔,以此作為獲得數(shù)據(jù)資產(chǎn)特征詞的基礎(chǔ)文本。
另外,企業(yè)數(shù)字化相關(guān)的研究已經(jīng)有很多,其中很多都是基于文本分析的方式來(lái)衡量企業(yè)的數(shù)字化程度,本文在選取企業(yè)數(shù)據(jù)資產(chǎn)衡量指標(biāo)的時(shí)候也借鑒該方法作為指標(biāo)衡量的核心方法,數(shù)字經(jīng)濟(jì)型企業(yè)在一定程度上會(huì)擁有更多的數(shù)據(jù)資產(chǎn),兩者內(nèi)在有極其密切的關(guān)聯(lián),數(shù)字化的過(guò)程中會(huì)形成一定數(shù)量的數(shù)據(jù)資產(chǎn),而數(shù)據(jù)資產(chǎn)的形成過(guò)程中也會(huì)涉及一定的數(shù)字化。因此,除了用TF-IDF的方法得到和數(shù)字資產(chǎn)相關(guān)特征詞,也用同樣的方法得到數(shù)字經(jīng)濟(jì)型企業(yè)的特征詞,我們按照證監(jiān)會(huì)2012年發(fā)布的《上市公司行業(yè)分類(lèi)指引》,屬于信息傳輸或軟件和信息技術(shù)服務(wù)業(yè)或計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)的,作為數(shù)字經(jīng)濟(jì)型企業(yè)(徐翔等,2023),按照這種方法得到894家企業(yè),也用上述同樣的方式摘取年報(bào)MDamp;A部分合并為一個(gè)文檔,得到獲得數(shù)據(jù)經(jīng)濟(jì)型企業(yè)特征詞的基礎(chǔ)文本。接下來(lái)就可以用Python代碼實(shí)現(xiàn)兩類(lèi)文本特征詞的TF-IDF值的排序,具體操作方式如下。
(二)數(shù)據(jù)資產(chǎn)關(guān)鍵詞
首先,對(duì)2022年5014家上市公司年報(bào)MDamp;A部分每個(gè)文檔進(jìn)行文本清洗。去除所有非中文字符,其中包括標(biāo)點(diǎn)符號(hào)、數(shù)字以及字母之后使用jieba進(jìn)行分詞。在分詞過(guò)程中,停用詞使用的是中國(guó)人民大學(xué)中文停用詞表、哈工大停用詞表、百度停用詞表和四川大學(xué)機(jī)器智能實(shí)驗(yàn)室停用詞庫(kù),共計(jì)2314個(gè)停用詞。 在此基礎(chǔ)上,添加了由150個(gè)詞匯兩兩有序組合再去除如“深度云”等無(wú)意義的詞后共計(jì)12652個(gè)詞,作為預(yù)設(shè)詞典。由此到如云服務(wù)、深度計(jì)算等詞匯時(shí)直接將該詞作為一個(gè)詞語(yǔ)而不被分開(kāi)。通過(guò)這種方式,得到表現(xiàn)更好的分詞結(jié)果,隨后用python代碼中的sklearn、vector等第三方庫(kù)的調(diào)用就可以計(jì)算出每個(gè)詞的TF-IDF值并實(shí)現(xiàn)可視化如圖1和圖2所示,分別為數(shù)據(jù)密集型企業(yè)特征關(guān)鍵詞和數(shù)字經(jīng)濟(jì)型企業(yè)特征關(guān)鍵詞的按照TF-IDF值排序可視化。
在去除尾部TF-IDF值偏小且和兩類(lèi)企業(yè)均無(wú)關(guān)的詞匯后,得到的特征詞如圖3所示,數(shù)據(jù)資產(chǎn)特征詞和數(shù)字經(jīng)濟(jì)型企業(yè)特征詞中前150排序的TF-IDF值對(duì)應(yīng)的詞存在高度重疊。這也佐證了數(shù)據(jù)資產(chǎn)形成和數(shù)字化高度相關(guān),也為用數(shù)字化的衡量方法運(yùn)用在數(shù)據(jù)資產(chǎn)衡量提供依據(jù)。但是在重疊的詞語(yǔ)中,我們發(fā)現(xiàn)有一類(lèi)詞的TF-IDF值是數(shù)據(jù)型大于數(shù)字型,也就是說(shuō)這一類(lèi)詞在數(shù)據(jù)資產(chǎn)密集型企業(yè)中的屬性特征更明顯,這也符合最開(kāi)始選取的144家企業(yè)和894家企業(yè)的本身特征的差異,一類(lèi)是證券公司研報(bào)中高度關(guān)注的和數(shù)據(jù)資產(chǎn)相關(guān)的企業(yè),另一類(lèi)是較為粗糙的以《上市公司行業(yè)分類(lèi)指引》作為分類(lèi)標(biāo)準(zhǔn)得到的數(shù)字經(jīng)濟(jì)型企業(yè)。樣本分類(lèi)的初始依據(jù)也就導(dǎo)致雖然二者特征詞存在高度重疊,但同樣出現(xiàn)在兩類(lèi)的詞中,更多的詞TF-IDF值所屬于數(shù)據(jù)資產(chǎn)密集型企業(yè)更大。
接下來(lái),選取圖1所示兩類(lèi)特征詞中數(shù)據(jù)資產(chǎn)密集型企業(yè)特征詞與數(shù)字經(jīng)濟(jì)型企業(yè)特征詞非交集詞匯以及交集詞匯中TF-IDF值更高的詞匯,通過(guò)簡(jiǎn)單篩選后,以此作為最終衡量數(shù)據(jù)資產(chǎn)密集型企業(yè)的關(guān)鍵特征詞典共計(jì)93個(gè)詞匯如表1所示。
根據(jù)獲得的93個(gè)特征詞,分別統(tǒng)計(jì)2014—2022年A股上市公司年報(bào)MDamp;A部分特征詞出現(xiàn)的總次數(shù),再得到對(duì)應(yīng)的總頻率,同時(shí)從Wind數(shù)據(jù)庫(kù)和國(guó)泰安數(shù)據(jù)庫(kù)中獲得同樣2014年—2022年A股上市公司每個(gè)企業(yè)的凈資產(chǎn)回報(bào)率(ROA)和其他若干個(gè)指標(biāo),其中包括上市年份,企業(yè)規(guī)模、員工總?cè)藬?shù)、年收入等。通過(guò)python代碼以股票代碼作為依據(jù)進(jìn)行數(shù)據(jù)匹配,得到對(duì)應(yīng)年份、企業(yè)股票代碼、特征詞頻率、ROA以及模型中需要的其他變量,至此已經(jīng)獲得后續(xù)實(shí)證部分解釋變量特征詞頻率和被解釋變ROA,由于統(tǒng)計(jì)數(shù)據(jù)是從2014—2022年,全面的數(shù)據(jù)足夠在后續(xù)做回歸分析考慮面板數(shù)據(jù)分析,豐富實(shí)證部分。
The Impact of Listed Companies' Data Asset Disclosure on Corporate Performance——A Text Analysis Perspective
Liu Guangwei1,Zhao Ruoqi2, Wang Chenglong3,4,
Zhou Heng4, Zhang Pengnian5
(1.Institute of Digital and Artificial Intelligence Applications, Shanghai Lida University, Shanghai 201608, China;
2. School of Economics, Jilin University, Changchun 130021, China;
3. Shanghai Fuli Technology Co., Ltd., Shanghai 200235, China;
4. School of Finance, Zhejiang Gongshang University, Hangzhou 310018, China
5. Shanghai Lida University, Shanghai 201608, China)
Abstract: With the advent of the digital era, data assets have become a critical factor in corporate value creation. This study adopts a quantitative approach, first employing the TF-IDF method from text analysis techniques to quantify the scale of data assets in listed companies, and then evaluating the impact of data assets on corporate performance through comparative analysis of the relationship between data asset scale and financial indicators. The findings reveal a significant positive relationship between data assets and corporate performance, with this positive promoting effect being mediated by corporate innovation capabilities. This research not only provides new perspectives and empirical evidence for understanding the impact of data assets on corporate financial performance in academic discourse, but also offers practical guidance for managers on how to effectively manage and utilize data assets to enhance corporate value and performance
Key Words:Data assets; Corporate performance; Text analysis; TF-IDF