999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于集成機(jī)器學(xué)習(xí)的數(shù)據(jù)資產(chǎn)定價(jià)模型及系統(tǒng)設(shè)計(jì)

2022-09-23 09:25:46任建宇
中國(guó)管理信息化 2022年14期
關(guān)鍵詞:價(jià)值特征模型

任建宇

(重慶交通大學(xué) 經(jīng)濟(jì)與管理學(xué)院,重慶 400000)

0 引言

當(dāng)今社會(huì)背景下,經(jīng)濟(jì)蓬勃發(fā)展,數(shù)據(jù)體量不斷增長(zhǎng)。我國(guó)政府始終密切關(guān)注數(shù)據(jù)發(fā)展,高度重視數(shù)據(jù)資產(chǎn)挖掘帶來(lái)的價(jià)值,并出臺(tái)多項(xiàng)專(zhuān)門(mén)政策支持?jǐn)?shù)據(jù)資產(chǎn)應(yīng)用于各大領(lǐng)域,由此,數(shù)據(jù)挖掘與應(yīng)用領(lǐng)域迎來(lái)了悄無(wú)聲息卻影響深遠(yuǎn)的革新。表1 是近年來(lái)我國(guó)出臺(tái)的關(guān)于數(shù)據(jù)發(fā)展的部分政策,筆者發(fā)現(xiàn)了相關(guān)政策對(duì)數(shù)據(jù)資產(chǎn)定價(jià)的有效指引,認(rèn)識(shí)到有效發(fā)掘數(shù)據(jù)資產(chǎn)價(jià)值、快速實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)交易已逐漸成為市場(chǎng)創(chuàng)造價(jià)值和促進(jìn)決策的熱點(diǎn)。

表1 關(guān)于數(shù)據(jù)發(fā)展的部分政策文件統(tǒng)計(jì)

數(shù)據(jù)資產(chǎn)交易雖逐漸成為熱點(diǎn),但目前市場(chǎng)數(shù)據(jù)資產(chǎn)的有效挖掘仍存在諸多難點(diǎn)和限制。數(shù)據(jù)資產(chǎn)是一種全新的無(wú)形資產(chǎn),也因此具備無(wú)形資產(chǎn)的屬性特點(diǎn),即無(wú)實(shí)體形態(tài),具有不確定性、時(shí)效性、非競(jìng)爭(zhēng)性等。同時(shí),數(shù)據(jù)的價(jià)值會(huì)受到數(shù)據(jù)容量、用途、規(guī)模等因素直接或間接的影響。筆者針對(duì)以上情況,在對(duì)大數(shù)據(jù)資產(chǎn)的應(yīng)用場(chǎng)景及價(jià)值影響因素進(jìn)行界定的基礎(chǔ)上,應(yīng)用集成機(jī)器學(xué)習(xí)的算法來(lái)評(píng)估數(shù)據(jù)資產(chǎn)價(jià)值,從而對(duì)數(shù)據(jù)資產(chǎn)進(jìn)行更準(zhǔn)確的價(jià)值評(píng)估。

1 文獻(xiàn)綜述

目前,不少學(xué)者通過(guò)改進(jìn)傳統(tǒng)研究方法建立定價(jià)模型,進(jìn)行價(jià)值評(píng)估。其中,成本法、市場(chǎng)法和收益法是傳統(tǒng)資產(chǎn)評(píng)估方法的代表。成本法作為反映企業(yè)經(jīng)營(yíng)情況最基本的方法,在市場(chǎng)不活躍的情況下更為適用,相較于收益法和市場(chǎng)法具有較大優(yōu)勢(shì)。市場(chǎng)法是指對(duì)市場(chǎng)上相同或相似資產(chǎn)的近期交易價(jià)格通過(guò)直接或者間接對(duì)比,分析其中的差異,估算數(shù)據(jù)資產(chǎn)的價(jià)值。劉琦等人提出了運(yùn)用“市場(chǎng)法”評(píng)估數(shù)據(jù)資產(chǎn)價(jià)值的基本思路,在對(duì)技術(shù)水平、價(jià)值密度、數(shù)據(jù)容量等差異因素進(jìn)行量化調(diào)整的基礎(chǔ)上,評(píng)估同一類(lèi)型的大數(shù)據(jù)資產(chǎn)的價(jià)值。收益法是評(píng)估大數(shù)據(jù)資產(chǎn)價(jià)值的首要方法。收益法在國(guó)際企業(yè)價(jià)值評(píng)估中的地位愈發(fā)突出,其使用前提是已知數(shù)據(jù)預(yù)期收益、折現(xiàn)率和效益期限。陳媛將收益法運(yùn)用于房地產(chǎn)估價(jià)中,從多個(gè)維度進(jìn)行深度思考。黃樂(lè)等人借鑒同樣作為無(wú)形資產(chǎn)的品牌價(jià)值評(píng)估的主流辦法,將收益法、成本法和市場(chǎng)法結(jié)合已有的數(shù)據(jù)資產(chǎn)評(píng)估模型,創(chuàng)造性地將平臺(tái)活躍系數(shù)等參數(shù)引入平臺(tái)式數(shù)據(jù)資產(chǎn)價(jià)值評(píng)估模型。左文進(jìn)和劉麗君則在傳統(tǒng)數(shù)據(jù)資產(chǎn)評(píng)估方法的基礎(chǔ)上引入Shapley 值法和破產(chǎn)分配法,從而構(gòu)建大數(shù)據(jù)資產(chǎn)價(jià)值評(píng)估模型。

由此可見(jiàn),數(shù)據(jù)資產(chǎn)價(jià)值評(píng)估仍處于發(fā)展探索階段,學(xué)術(shù)界對(duì)于數(shù)據(jù)資產(chǎn)價(jià)值評(píng)估缺乏統(tǒng)一的評(píng)判標(biāo)準(zhǔn)。另外,傳統(tǒng)算法前期需要繁復(fù)的特征工程,效率低下,模型精確度很大程度上會(huì)受到特征工程的干擾。因此,構(gòu)建相對(duì)完善的評(píng)估系統(tǒng)、選擇客觀正確的衡量標(biāo)準(zhǔn)對(duì)于健全當(dāng)前數(shù)據(jù)資產(chǎn)評(píng)估體系具有積極意義。

2 數(shù)據(jù)資產(chǎn)定價(jià)模型的建立

數(shù)據(jù)資產(chǎn)評(píng)估特征多、特征復(fù)雜且冗余度高,使得如何尋找評(píng)估分類(lèi)器的最優(yōu)評(píng)估特征集成為難點(diǎn)。鑒于此,筆者通過(guò)建立一個(gè)模型,有效處理樣本缺失值,降低特征工程的難度,提高精度。

在建立本數(shù)據(jù)資產(chǎn)定價(jià)模型時(shí),筆者使用了多種模型和算法幫助系統(tǒng)功能的實(shí)現(xiàn),包括引入詞向量的概念,將文本數(shù)據(jù)轉(zhuǎn)化為可供機(jī)器識(shí)別的數(shù)字?jǐn)?shù)據(jù),即對(duì)原始數(shù)據(jù)進(jìn)行數(shù)字化預(yù)處理。另外,筆者利用爬蟲(chóng)抓取網(wǎng)絡(luò)數(shù)據(jù)后生成原始數(shù)據(jù)表,該數(shù)據(jù)表將表格作為載體,在對(duì)數(shù)據(jù)表進(jìn)行詞向量化后生成詞向量矩陣,將表中的文本數(shù)據(jù)轉(zhuǎn)化為能被機(jī)器識(shí)別且與文本相對(duì)應(yīng)的數(shù)字?jǐn)?shù)據(jù)。除此之外,將以下模型和算法運(yùn)用于整個(gè)系統(tǒng)的建立與運(yùn)行過(guò)程中,這是本定價(jià)模型和系統(tǒng)的核心。①CBOW 模型(Continuous Bag-Of-Words Model)主要用于實(shí)現(xiàn)系統(tǒng)中詞預(yù)測(cè)的功能,設(shè)定某個(gè)中心詞的前后選取范圍,通過(guò)范圍內(nèi)連續(xù)詞來(lái)計(jì)算該中心詞出現(xiàn)的概率。②長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory LSTM)相較于無(wú)法處理長(zhǎng)距離依賴(lài)問(wèn)題的循環(huán)神經(jīng)網(wǎng)絡(luò),其細(xì)胞的結(jié)構(gòu)和運(yùn)算存在變化。其細(xì)胞狀態(tài)能夠傳遞序列處理過(guò)程中的信息,在訓(xùn)練過(guò)程中通過(guò)“門(mén)”結(jié)構(gòu)不斷學(xué)習(xí)保存或遺忘來(lái)實(shí)現(xiàn)添加和移除信息。③XGBoost 算法運(yùn)用于預(yù)測(cè)結(jié)果的全過(guò)程,首先采用CART 回歸樹(shù)對(duì)數(shù)據(jù)進(jìn)行擬合,每個(gè)樣本可得到相應(yīng)預(yù)測(cè)分?jǐn)?shù),將所有分?jǐn)?shù)相加,可得到該樣本在此模型下的分?jǐn)?shù)。

從數(shù)據(jù)形態(tài)的角度來(lái)看,本系統(tǒng)基于以上算法和模型將原始數(shù)據(jù)進(jìn)行數(shù)次分析轉(zhuǎn)化,得出評(píng)估數(shù)據(jù)價(jià)值的結(jié)果。原始數(shù)據(jù)利用爬蟲(chóng)獲取的文本數(shù)據(jù)在CBOW 模型的作用下轉(zhuǎn)化為可供機(jī)器識(shí)別的數(shù)據(jù),并建立數(shù)據(jù)矩陣生成三維詞向量,在LSTM 神經(jīng)網(wǎng)絡(luò)的作用下使詞向量二維化,最后利用XGBoost 算法進(jìn)行回歸分析,預(yù)測(cè)數(shù)據(jù)的價(jià)值。

3 系統(tǒng)設(shè)計(jì)及運(yùn)行流程

3.1 系統(tǒng)功能實(shí)現(xiàn)

在建立數(shù)據(jù)資產(chǎn)評(píng)估模型的基礎(chǔ)上,數(shù)據(jù)資產(chǎn)評(píng)估系統(tǒng)可以做到以下幾點(diǎn)。首先,界定數(shù)據(jù)資產(chǎn)的使用場(chǎng)景。數(shù)據(jù)具有多維使用的特性,不同應(yīng)用場(chǎng)景下的數(shù)據(jù)資產(chǎn)價(jià)值不盡相同,因此在定價(jià)前要分析數(shù)據(jù)資產(chǎn)標(biāo)題的文本相似度,根據(jù)應(yīng)用場(chǎng)景將其劃分為不同類(lèi)別。其次,推進(jìn)數(shù)據(jù)資產(chǎn)定價(jià)合理化。根據(jù)現(xiàn)有數(shù)據(jù)資產(chǎn)交易平臺(tái)上的交易相關(guān)信息構(gòu)建恰當(dāng)?shù)闹笜?biāo)體系,形成系統(tǒng)框架;根據(jù)可比交易的歷史數(shù)據(jù)構(gòu)建基于市場(chǎng)法的數(shù)據(jù)資產(chǎn)估值定價(jià)模型,為數(shù)據(jù)資產(chǎn)交易定價(jià)的公平合理提供更多、更易于被廣泛接受的實(shí)踐依據(jù),同時(shí)支持實(shí)時(shí)數(shù)據(jù)估值計(jì)算。在對(duì)數(shù)據(jù)資產(chǎn)特征進(jìn)行研究的基礎(chǔ)上,使用機(jī)器學(xué)習(xí)相關(guān)算法,建立數(shù)據(jù)資產(chǎn)實(shí)時(shí)估值系統(tǒng),通過(guò)模型參數(shù)的調(diào)優(yōu)提高估值效率。數(shù)據(jù)估值系統(tǒng)的組成部分主要包括數(shù)據(jù)采集器、數(shù)據(jù)處理器、交互模塊和數(shù)據(jù)估值模型。

3.2 系統(tǒng)模塊設(shè)計(jì)

3.2.1 數(shù)據(jù)輸入接口模塊

數(shù)據(jù)輸入接口模塊能夠反映數(shù)據(jù)資產(chǎn)交易信息特征類(lèi)型多的特點(diǎn)。該模塊分為兩個(gè)子模塊:一是數(shù)據(jù)輸入模塊。此模塊測(cè)試數(shù)據(jù)包括數(shù)據(jù)大小、數(shù)據(jù)類(lèi)型、字段數(shù)量、數(shù)據(jù)條數(shù)、采集時(shí)間等自變量數(shù)據(jù)。二是數(shù)據(jù)分類(lèi)模塊。此模塊按照產(chǎn)業(yè)經(jīng)濟(jì)、金融征信、輿情監(jiān)測(cè)、科研技術(shù)等應(yīng)用場(chǎng)景,利用文本相似度將數(shù)據(jù)輸入模塊中,劃分為不同的可比案例集。

3.2.2 數(shù)據(jù)采集模塊

數(shù)據(jù)資產(chǎn)具備量大、高維、數(shù)據(jù)類(lèi)型多樣等特點(diǎn),本系統(tǒng)有針對(duì)性地組建數(shù)據(jù)采集模塊,借助Python對(duì)數(shù)據(jù)資產(chǎn)交易平臺(tái)作最大限度的信息獲取,信息類(lèi)型包括塊數(shù)據(jù)和數(shù)據(jù)資產(chǎn)標(biāo)題、數(shù)據(jù)大小、數(shù)據(jù)條數(shù)、交易價(jià)格等。

3.2.3 異常數(shù)據(jù)預(yù)處理模塊

針對(duì)歷史交易數(shù)據(jù)存在數(shù)據(jù)類(lèi)型繁雜、數(shù)據(jù)源不唯一、數(shù)據(jù)存在缺失等問(wèn)題,本系統(tǒng)組建異常數(shù)據(jù)預(yù)處理模塊,以提高數(shù)據(jù)質(zhì)量。在實(shí)現(xiàn)數(shù)據(jù)采集和存儲(chǔ)后,將若干條數(shù)據(jù)資產(chǎn)歷史交易信息數(shù)據(jù)輸入該模塊,進(jìn)行一致性檢驗(yàn)、缺失數(shù)據(jù)處理和回歸分析等預(yù)處理操作。

3.2.4 特征工程構(gòu)建模塊

在特征工程構(gòu)建模塊輸入若干條數(shù)據(jù)資產(chǎn)交易歷史信息數(shù)據(jù),輸出對(duì)應(yīng)模型的特征數(shù)據(jù),具體實(shí)現(xiàn)以下3 方面功能。①文本情感分析。將數(shù)據(jù)資產(chǎn)標(biāo)題的文本轉(zhuǎn)化為詞向量,再利用詞向量平均模型將其轉(zhuǎn)化為句向量,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)特征降維。②One-Hot編碼。對(duì)于商品類(lèi)別和數(shù)據(jù)類(lèi)型這兩類(lèi)分類(lèi)特征,將離散特征的取值擴(kuò)展到歐式空間,優(yōu)化特征之間的距離計(jì)算,使其更具合理性。③對(duì)于數(shù)據(jù)大小、采集時(shí)間、字段數(shù)量、字段條數(shù)等變量采用歸一化和標(biāo)準(zhǔn)化處理方式,消除量綱級(jí)影響。

3.2.5 估值定價(jià)模塊

在估值定價(jià)模塊輸入特征工程提取的特征信息,輸出待估數(shù)據(jù)資產(chǎn)的參考定價(jià),具體實(shí)現(xiàn)以下兩方面功能。一是輸入可比實(shí)例與數(shù)據(jù)資產(chǎn)特征數(shù)據(jù),通過(guò)編碼完成匹配后形成特征價(jià)格矩陣,作為可比基礎(chǔ)。二是根據(jù)輸入可比實(shí)例的特征數(shù)據(jù),利用XGBoost 等多種機(jī)器學(xué)習(xí)算法訓(xùn)練數(shù)據(jù),輸入得到的可比案例至模型中,準(zhǔn)確計(jì)算待估數(shù)據(jù)資產(chǎn)的市場(chǎng)價(jià)值并輸出參考價(jià)格。

3.3 系統(tǒng)運(yùn)行流程

系統(tǒng)運(yùn)行流程如圖1 所示。首先利用Python 爬蟲(chóng)技術(shù)在數(shù)據(jù)資產(chǎn)交易平臺(tái)上收集數(shù)據(jù)資產(chǎn)交易歷史信息數(shù)據(jù),在數(shù)據(jù)輸入模塊輸入數(shù)據(jù),其中包括數(shù)據(jù)大小、類(lèi)型、字段數(shù)量、數(shù)據(jù)條數(shù)、采集時(shí)間等;隨后進(jìn)行數(shù)據(jù)處理,針對(duì)數(shù)據(jù)類(lèi)型繁雜、數(shù)據(jù)源不唯一、數(shù)據(jù)缺失等問(wèn)題對(duì)數(shù)據(jù)進(jìn)行一致性檢驗(yàn)、缺失數(shù)據(jù)處理和回歸分析等預(yù)處理操作;將經(jīng)過(guò)預(yù)處理的數(shù)據(jù)輸入對(duì)應(yīng)模型的特征數(shù)據(jù),對(duì)數(shù)據(jù)資產(chǎn)標(biāo)題進(jìn)行文本情感分析、One-Hot 編碼與數(shù)據(jù)的歸一化和標(biāo)準(zhǔn)化處理;最后輸入可比實(shí)例的特征數(shù)據(jù),利用神經(jīng)網(wǎng)絡(luò)等多種機(jī)器學(xué)習(xí)算法對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,將得到的可比案例輸入模型,準(zhǔn)確計(jì)算待估數(shù)據(jù)資產(chǎn)的市場(chǎng)價(jià)值,并輸出參考價(jià)格。

圖1 系統(tǒng)運(yùn)行流程

4 系統(tǒng)運(yùn)行效果與展望

本系統(tǒng)已開(kāi)發(fā)成功,可進(jìn)行多個(gè)對(duì)象的預(yù)測(cè),應(yīng)用人工智能對(duì)數(shù)據(jù)資產(chǎn)特征進(jìn)行系統(tǒng)分析、提取與量化。在完善評(píng)估系統(tǒng)后,評(píng)估系統(tǒng)部署于阿里云服務(wù)器,便于外部基本用戶(hù)使用。本系統(tǒng)基于集成人工智能算法,有效解決了數(shù)據(jù)資產(chǎn)交易歷史數(shù)據(jù)特征多、特征復(fù)雜、冗余度高的問(wèn)題,相對(duì)于一般的機(jī)器學(xué)習(xí)算法具有更好的泛化能力和模型精度。系統(tǒng)可操作性強(qiáng),可服務(wù)于數(shù)據(jù)資產(chǎn)估價(jià)機(jī)構(gòu)及各大數(shù)據(jù)交易網(wǎng)站,具有強(qiáng)推廣性和自主成長(zhǎng)能力。

本系統(tǒng)將順應(yīng)時(shí)代發(fā)展不斷更新。筆者認(rèn)為,此定價(jià)模型及系統(tǒng)能適用更優(yōu)化的模型和算法,從系統(tǒng)的預(yù)測(cè)精度和速度兩個(gè)維度進(jìn)行提升,利用體量更大、質(zhì)量更好的數(shù)據(jù)不斷訓(xùn)練優(yōu)化模型,并持續(xù)更新數(shù)據(jù),以滿(mǎn)足系統(tǒng)的時(shí)效性要求。

猜你喜歡
價(jià)值特征模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
如何表達(dá)“特征”
不忠誠(chéng)的四個(gè)特征
抓住特征巧觀察
一粒米的價(jià)值
“給”的價(jià)值
3D打印中的模型分割與打包
線性代數(shù)的應(yīng)用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 最新国产你懂的在线网址| 色天天综合久久久久综合片| 一区二区理伦视频| AV老司机AV天堂| 2021精品国产自在现线看| 亚洲香蕉久久| 一本色道久久88| 欧美中文字幕在线二区| 本亚洲精品网站| 亚洲国产精品无码AV| 国产精品 欧美激情 在线播放| 国产96在线 | 亚洲人成网线在线播放va| 天天干天天色综合网| 美女高潮全身流白浆福利区| 国产女人在线| 97久久免费视频| 亚洲欧美在线综合图区| 一本大道香蕉久中文在线播放| 成人小视频在线观看免费| 中文精品久久久久国产网址| 青青草国产在线视频| 韩国v欧美v亚洲v日本v| 亚洲欧美日韩另类| 欧美在线综合视频| 日韩精品亚洲一区中文字幕| 久一在线视频| 亚洲国产成人无码AV在线影院L| 国产欧美视频在线观看| 91免费观看视频| 青青热久免费精品视频6| 一级毛片在线免费看| 精品国产免费第一区二区三区日韩| 婷婷五月在线视频| 成人无码区免费视频网站蜜臀| 免费看一级毛片波多结衣| 国产91丝袜在线播放动漫| 欧洲亚洲欧美国产日本高清| 国产青青操| 国产精品黑色丝袜的老师| 亚洲人成色在线观看| 国产成人久视频免费| 5388国产亚洲欧美在线观看| 国产人碰人摸人爱免费视频 | 色综合中文综合网| 制服无码网站| 亚洲国产天堂在线观看| 亚洲制服中文字幕一区二区| 国产亚洲成AⅤ人片在线观看| 精品视频第一页| 在线观看视频一区二区| 一级毛片中文字幕| 国产在线一区二区视频| 日韩在线永久免费播放| 国产高清无码第一十页在线观看| 亚洲第一视频免费在线| 五月婷婷综合色| 一本色道久久88| 欧美一级高清视频在线播放| 亚洲精品不卡午夜精品| 精品无码一区二区三区在线视频| 又爽又黄又无遮挡网站| 一级毛片在线播放免费| 精品午夜国产福利观看| 亚洲 欧美 日韩综合一区| 又污又黄又无遮挡网站| 五月天综合网亚洲综合天堂网| 国产中文一区二区苍井空| 免费不卡视频| 亚洲成人在线免费| 国产熟睡乱子伦视频网站| 国产一在线| 国产91视频免费观看| 青青操国产| 91po国产在线精品免费观看| 19国产精品麻豆免费观看| 亚洲精品自拍区在线观看| 国产精品视频导航| 久青草国产高清在线视频| 一级毛片高清| 夜精品a一区二区三区| 成人福利在线免费观看|