999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于回歸學(xué)習(xí)算法的高鐵站媒體資源價(jià)值評(píng)估模型研究與應(yīng)用

2023-01-16 13:26:02單杏花牛慧琳
鐵路計(jì)算機(jī)應(yīng)用 2022年12期
關(guān)鍵詞:價(jià)值特征資源

許 娜,單杏花,付 睿,吳 剛,牛慧琳

(1.中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司 電子計(jì)算技術(shù)研究所,北京 100081;2.中國(guó)國(guó)家鐵路集團(tuán)有限公司 經(jīng)營(yíng)開(kāi)發(fā)部,北京 100844)

近年來(lái),我國(guó)高速鐵路(簡(jiǎn)稱:高鐵)網(wǎng)規(guī)模快速擴(kuò)大,從“四縱四橫”到“八縱八橫”[1]。高鐵所具有的高密度、高速度、安全性、舒適性、準(zhǔn)時(shí)性使其成為鐵路旅客的主流出行方式[2]。以華東某高鐵線路受眾為例,20~39 歲的消費(fèi)人群占比61.8%,男性占比約60%,本科及以上學(xué)歷占比約75%。由此可見(jiàn),具備引導(dǎo)力的消費(fèi)群體正在成為高鐵媒體的潛在消費(fèi)主力[3]。

隨著高鐵站媒體廣告市場(chǎng)的興盛,鐵路媒體應(yīng)基于各類型受眾的出行需求、身份差異及時(shí)節(jié)變化等因素,進(jìn)行針對(duì)性傳播,增強(qiáng)信息傳播的廣度、深度和影響力。因此,亟需一種科學(xué)、系統(tǒng)、全面的鐵路媒體資源價(jià)值評(píng)估體系指導(dǎo)廣告資源經(jīng)營(yíng)。目前,大數(shù)據(jù)分析、人工智能、機(jī)器學(xué)習(xí)等技術(shù)的飛速發(fā)展和成熟應(yīng)用,為高鐵站媒體資源廣告價(jià)值評(píng)估提供了可行性。

清水公一[4]提出了每日有效流量監(jiān)測(cè),建立了日本戶外廣告效果評(píng)估指標(biāo)體系;孫文清[5]認(rèn)為廣告效果的多層次性使得廣告效果具有模糊性,建立了多級(jí)模糊綜合評(píng)價(jià)模型測(cè)定廣告效果,設(shè)計(jì)了廣告效果綜合評(píng)價(jià)的指標(biāo)體系,并確定各評(píng)價(jià)指標(biāo)權(quán)重;陳文凱[6]將高鐵站內(nèi)廣告資源整合為站內(nèi)廣告空間的形式進(jìn)行評(píng)估,論述高鐵站內(nèi)廣告空間價(jià)值,分析影響因素,評(píng)估廣告空間整體價(jià)值。而目前對(duì)高鐵車站媒體資源定量評(píng)估指標(biāo)及價(jià)值分析研究尚不深入。

媒體價(jià)值是指媒體作為商品的市場(chǎng)價(jià)值。媒體資源價(jià)值評(píng)估即是對(duì)媒體的市場(chǎng)價(jià)值進(jìn)行預(yù)估和解析,建立起一個(gè)綜合的、完整的評(píng)估模型[7]。本文從鐵路媒體資源經(jīng)營(yíng)出發(fā),通過(guò)大數(shù)據(jù)分析方法,研究相關(guān)性指標(biāo)與媒體招商價(jià)值的關(guān)系,篩選影響鐵路媒體價(jià)值的強(qiáng)相關(guān)特征因素,形成媒體資源價(jià)值評(píng)估的指標(biāo)體系模型,構(gòu)建高鐵站媒體資源價(jià)值評(píng)估模型,實(shí)現(xiàn)對(duì)高鐵站媒體資源價(jià)值的評(píng)估與預(yù)測(cè)。

1 指標(biāo)體系搭建

1.1 指標(biāo)體系構(gòu)成

基于受眾和媒體2 個(gè)角度,結(jié)合高鐵站媒體特征,構(gòu)建高鐵站媒體資源價(jià)值評(píng)估指標(biāo)體系,如圖1所示,包含6 個(gè)大類、10 個(gè)子類、31 項(xiàng)指標(biāo)。

圖1 高鐵站媒體資源價(jià)值評(píng)估指標(biāo)體系

1.2 數(shù)據(jù)項(xiàng)采集及預(yù)處理

高鐵站媒體資源價(jià)值評(píng)估指標(biāo)體系31 項(xiàng)指標(biāo)的數(shù)據(jù)主要從鐵路媒體資源管理平臺(tái)、鐵路出行統(tǒng)計(jì)、國(guó)家統(tǒng)計(jì)局、各地方政府官網(wǎng)公開(kāi)發(fā)布的社會(huì)經(jīng)濟(jì)、車站環(huán)境等數(shù)據(jù)源中獲取。部分指標(biāo)的數(shù)據(jù)可直接從上述數(shù)據(jù)源采集,如城市GDP、高動(dòng)占比等;部分?jǐn)?shù)據(jù)指標(biāo)需進(jìn)行數(shù)據(jù)源分類統(tǒng)計(jì),如年齡構(gòu)成;部分?jǐn)?shù)據(jù)指標(biāo)需要對(duì)采集到的源數(shù)據(jù)進(jìn)行加工,形成數(shù)據(jù)項(xiàng),以滿足要求,以觸達(dá)人次為例,不同媒體位置的觸達(dá)人次各不相同,結(jié)合第三方調(diào)研公司獲取到媒體觸達(dá)率、觸達(dá)頻次,如表1所示,以及車站年到發(fā)客流量,根據(jù)公式(1)得出觸達(dá)人次。

表1 調(diào)研高鐵站媒體位置到達(dá)率和接觸頻次

對(duì)原始數(shù)據(jù)項(xiàng)進(jìn)行處理后,31 個(gè)指標(biāo)共形成含82 個(gè)數(shù)據(jù)項(xiàng)的原始樣本數(shù)據(jù)集。

2 特征工程

2.1 特征數(shù)據(jù)項(xiàng)分析

對(duì)原始樣本數(shù)據(jù)集進(jìn)行探索性分析,得出各特征數(shù)據(jù)項(xiàng)的分布趨勢(shì),如表2所示。其中,集中趨勢(shì)是數(shù)據(jù)聚攏程度的一種衡量,衡量參數(shù)是均值、中位數(shù)、眾數(shù)和分位數(shù);離中趨勢(shì)是數(shù)據(jù)離散程度的衡量,衡量參數(shù)主要是標(biāo)準(zhǔn)差;數(shù)據(jù)分布主要檢驗(yàn)數(shù)據(jù)是否符合正態(tài)分布,衡量參數(shù)為偏態(tài)系數(shù)和峰態(tài)系數(shù),偏態(tài)系數(shù)衡量數(shù)據(jù)平均值偏離狀態(tài),峰態(tài)系數(shù)衡量數(shù)據(jù)分布集中強(qiáng)度。

表2 部分特征數(shù)據(jù)項(xiàng)分布趨勢(shì)衡量參數(shù)

對(duì)上述指標(biāo)進(jìn)行分析可得出,年均媒體單價(jià)分布較離散,數(shù)據(jù)標(biāo)準(zhǔn)差較大,需排查并剔除異常值,同時(shí),其偏態(tài)程度也較大,需進(jìn)行數(shù)據(jù)變換,消弱數(shù)據(jù)的異方差性,使其更接近正態(tài)分布;城市GDP、年經(jīng)停列車數(shù)量等數(shù)據(jù)項(xiàng)標(biāo)準(zhǔn)差較其他數(shù)據(jù)項(xiàng)大,不利于不同單位或量級(jí)的指標(biāo)進(jìn)行比較,易影響目標(biāo)結(jié)果,使得一些回歸算法無(wú)法學(xué)習(xí)到其他數(shù)據(jù)項(xiàng)特征,因此,需進(jìn)行標(biāo)準(zhǔn)化、歸一化處理。

2.2 異常值識(shí)別

本文采用箱線圖的鑒定方式進(jìn)行異常值剔除,如圖2所示。在箱線圖中,箱子中間的一條線代表中位數(shù),箱子的上下底分別是上四分位數(shù)(Q3)和下四分位數(shù)(Q1),上極限=中位數(shù)+3 · (Q3-Q1),下極限=中位數(shù)-3 · (Q3-Q1)。箱子的高度在一定程度上反映了數(shù)據(jù)的波動(dòng)程度。上下邊緣則代表了該組數(shù)據(jù)的最大值和最小值,超范圍值視為異常值。

圖2 原始樣本集特征數(shù)據(jù)箱線圖

圖2中,紅色星為異常值,能看出城市人口規(guī)模、車站合同總金額、媒體面積、年均媒體單價(jià)等數(shù)據(jù)項(xiàng)均存在異常值。需將所列樣本數(shù)據(jù)異常值剔除。

2.3 標(biāo)準(zhǔn)化和歸一化

標(biāo)準(zhǔn)差較大的數(shù)據(jù)項(xiàng)需進(jìn)行標(biāo)準(zhǔn)化和歸一化處理,確保所有特征數(shù)值都有相同的數(shù)量級(jí)。如果數(shù)據(jù)較為穩(wěn)定,不存在極端的最大/最小值,可用歸一化方式進(jìn)行處理。本文對(duì)與媒體屬性相關(guān)的數(shù)據(jù)項(xiàng)、車站環(huán)境相關(guān)的數(shù)據(jù)項(xiàng)、與城市經(jīng)濟(jì)相關(guān)的數(shù)據(jù)項(xiàng)進(jìn)行標(biāo)準(zhǔn)化處理。對(duì)與客流有關(guān)的數(shù)據(jù)項(xiàng)、與受眾屬性相關(guān)的數(shù)據(jù)項(xiàng)進(jìn)行歸一化處理。

2.4 數(shù)據(jù)變換

對(duì)年均媒體單價(jià)做指數(shù)變換,解決其分布不均、方差較大的問(wèn)題。變換前后的分布趨勢(shì)如圖3所示。對(duì)比可知,數(shù)據(jù)變換后更符合正態(tài)分布,且對(duì)評(píng)估模型的擬合效果更優(yōu)。

圖3 年均媒體單價(jià)正態(tài)分布曲線對(duì)比

2.5 相關(guān)性分析及特征選擇

在生成預(yù)測(cè)模型前,還須對(duì)上述過(guò)程處理過(guò)的82 個(gè)特征數(shù)據(jù)之間、82 個(gè)特征數(shù)據(jù)和目標(biāo)值(年均媒體單價(jià))間的相關(guān)性進(jìn)行分析。過(guò)濾掉特征相關(guān)性高、互相冗余或與目標(biāo)值相關(guān)性較弱、給模型帶來(lái)噪聲并導(dǎo)致模型訓(xùn)練速度緩慢的數(shù)據(jù)特征。本文采用皮爾遜相關(guān)系數(shù)法檢測(cè)變量間的相關(guān)性,剔除與目標(biāo)值相關(guān)性低(相關(guān)系數(shù)<0.3)的特征數(shù)據(jù),合并相同指標(biāo)項(xiàng)下共線性較強(qiáng)(相關(guān)系數(shù)>0.9)的特征數(shù)據(jù),得到初步篩選的37 個(gè)特征數(shù)據(jù)。皮爾遜相關(guān)性熱力圖如圖4所示。共線性較強(qiáng)的紅橙色區(qū)域依然存在,須進(jìn)一步進(jìn)行特征選擇。本文采用前進(jìn)逐步回歸算法,進(jìn)行特征數(shù)量及特征因子的選擇。

圖4 特征數(shù)據(jù)初步篩選后的相關(guān)性熱力圖

特征數(shù)量結(jié)果如圖5所示,當(dāng)特征數(shù)量為24 時(shí),模型的均方根誤差(RMSE,Root Mean Square Error)最低,使用梯度提升決策樹(shù)(GBDT,Gradient Boosting Decision Tree)模型來(lái)評(píng)估該24 項(xiàng)特性的重要性結(jié)果如圖6所示。

圖5 特征數(shù)量與RMSE 關(guān)系折線圖

圖6 GBDT 模型下特征重要性排序

媒體面積為24 項(xiàng)特征項(xiàng)中與目標(biāo)值相關(guān)性最高的特征項(xiàng)。特征工程選取出的最佳數(shù)據(jù)特征子集如圖7所示。

圖7 特征工程選擇出的最佳數(shù)據(jù)特征

3 價(jià)值評(píng)估模型

對(duì)高鐵站媒體資源價(jià)值做分析與預(yù)測(cè)可歸結(jié)為回歸問(wèn)題。回歸學(xué)習(xí)算法可被認(rèn)為是一種“函數(shù)逼近”[8]。價(jià)值評(píng)估模型的建構(gòu)需先將樣本數(shù)據(jù)集依次代入多個(gè)備選回歸學(xué)習(xí)算法,根據(jù)性能指標(biāo)得到最優(yōu)算法,并將樣本數(shù)據(jù)集通過(guò)歸一化處理、超參調(diào)優(yōu)等方式進(jìn)一步提升最優(yōu)算法的擬合優(yōu)度,以求達(dá)到符合商用要求(擬合優(yōu)度(R2)≥0.80)的模型。

3.1 最優(yōu)算法選取

將包含最佳特征子集的樣本數(shù)據(jù)集按4:1 的比例,隨機(jī)分割為訓(xùn)練集和測(cè)試集,并將年均媒體單價(jià)設(shè)為目標(biāo)值Y,將最佳特征子集的24 個(gè)數(shù)據(jù)特征設(shè)為X=(x1,x2,···,x24),分別代入表3的回歸算法,在默認(rèn)算法參數(shù)不做調(diào)優(yōu)的情況下,得出各算法的性能指標(biāo)。其中,R2是衡量自變量,是解釋因變量變動(dòng)的程度指標(biāo),取值范圍在0~1 之間,越接近1,擬合度越好;均方誤差(MSE,Mean Square Error)在預(yù)測(cè)值與真實(shí)值完全吻合時(shí)等于 0,誤差越大,值越大;RMSE 越小,預(yù)測(cè)效果越好。

表3 年均媒體單價(jià)為目標(biāo)值的各種回歸算法性能指標(biāo)

由表3可知,增強(qiáng)梯度提升決策樹(shù)回歸學(xué)習(xí)算法的R2最大,且RMSE 和MAE 相對(duì)較小,但R2仍未達(dá)到0.8 的商用目標(biāo),作為本文價(jià)值評(píng)估算法需進(jìn)行進(jìn)一步優(yōu)化。

3.2 模型優(yōu)化

(1)對(duì)目標(biāo)值Y進(jìn)行歸一化處理,得到新樣本數(shù)據(jù)集,重復(fù)3.1 節(jié)中的模型訓(xùn)練過(guò)程,所得結(jié)果為:R2=0.78,RMSE=123 421.49,MAE=66 154.81。

(2)針對(duì)分布不均、方差較大的特征值,如動(dòng)車旅客數(shù)量和目標(biāo)值進(jìn)行l(wèi)og 變換,重復(fù)3.1 節(jié)模型訓(xùn)練過(guò)程,所得結(jié)果為:R2=0.8,RMSE=91 846.28,MAE=49 500.05。

3.3 超參調(diào)優(yōu)

對(duì)極限梯度提升(XGBoost,eXtreme Gradient Boosting)算法的超參學(xué)習(xí)器迭代次數(shù)(n_estimators)、樹(shù)深度(max_depth)、學(xué)習(xí)器的權(quán)重縮減系數(shù)(learning_rate)、正則化參數(shù)(gamma)等進(jìn)行經(jīng)驗(yàn)值區(qū)間設(shè)置。采用網(wǎng)格搜索法進(jìn)行超參調(diào)優(yōu),獲取最優(yōu)超參組合,即表4中R2為0.803 872 425 的組合項(xiàng)。

表4 特征變換處理后算法庫(kù)結(jié)果

4 業(yè)務(wù)場(chǎng)景驗(yàn)證

對(duì)2019~2021年度西安北站、昆明站、福州站、福州南站的燈箱類高鐵站媒體數(shù)據(jù)進(jìn)行隨機(jī)采樣,驗(yàn)證評(píng)估模型,結(jié)果如表5所示。其中,價(jià)格欄為招商價(jià)格,預(yù)測(cè)值欄為該評(píng)估模型預(yù)測(cè)值。市面?zhèn)鹘y(tǒng)評(píng)估方法,如專家打分、指標(biāo)數(shù)據(jù)加權(quán)等方式,偏離度約在±20%左右。因此,本文模型偏離度更低,評(píng)估效果更好。

表5 2019~2021年度生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)驗(yàn)證明細(xì)

5 結(jié)束語(yǔ)

本文建立了高鐵站媒體資源價(jià)值評(píng)估指標(biāo)體系,對(duì)高鐵站媒體資源樣本進(jìn)行智能識(shí)別和分析后,構(gòu)建了高鐵站媒體資源價(jià)值評(píng)估模型,并驗(yàn)證了預(yù)測(cè)效果。為高鐵站媒體經(jīng)營(yíng)提質(zhì)增效、精細(xì)化管理提供方案和工具。

本文依然存在不足之處。媒體經(jīng)營(yíng)業(yè)務(wù)復(fù)雜,為更好發(fā)揮大數(shù)據(jù)分析的作用,應(yīng)持續(xù)增加能優(yōu)化媒體價(jià)值評(píng)估模型的數(shù)據(jù)特征、樣本數(shù)據(jù)集收集處理、超參調(diào)優(yōu),進(jìn)一步擴(kuò)大可評(píng)估的媒體類型。下一步,應(yīng)基于推廣應(yīng)用的效果不斷進(jìn)行模型的迭代和驗(yàn)證,確保模型的可持續(xù)性、合理性和適用性。

猜你喜歡
價(jià)值特征資源
基礎(chǔ)教育資源展示
一樣的資源,不一樣的收獲
如何表達(dá)“特征”
不忠誠(chéng)的四個(gè)特征
資源回收
抓住特征巧觀察
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
一粒米的價(jià)值
“給”的價(jià)值
線性代數(shù)的應(yīng)用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 制服丝袜在线视频香蕉| 亚洲日本在线免费观看| 欧美性天天| 国产日韩欧美成人| 夜夜高潮夜夜爽国产伦精品| 欧美笫一页| 国产精品香蕉在线| 国产成人精品亚洲日本对白优播| 久久精品亚洲中文字幕乱码| 亚洲欧美不卡视频| 久久成人国产精品免费软件| 97人人模人人爽人人喊小说| 国产激情无码一区二区免费| 亚洲成网站| 国产男女免费视频| 日本精品视频一区二区| 国产日产欧美精品| 啊嗯不日本网站| 波多野结衣久久高清免费| 国产91麻豆视频| 国产手机在线观看| 99性视频| 欧美亚洲欧美| 色婷婷啪啪| 伊人婷婷色香五月综合缴缴情| 中文字幕第4页| 国产v欧美v日韩v综合精品| 亚洲国产成人久久精品软件| 国产成人在线小视频| 激情六月丁香婷婷四房播| 67194在线午夜亚洲 | 又粗又硬又大又爽免费视频播放| 曰韩人妻一区二区三区| аⅴ资源中文在线天堂| 老司机久久99久久精品播放| 嫩草影院在线观看精品视频| 久久久久中文字幕精品视频| 久久这里只有精品国产99| 国产美女在线免费观看| 国产区在线看| 一级毛片高清| 日本成人在线不卡视频| 无码精品国产dvd在线观看9久| 午夜三级在线| 亚洲精品国产乱码不卡| 狠狠做深爱婷婷久久一区| 日韩在线播放中文字幕| 中国美女**毛片录像在线| 欧美天堂在线| 伊人色天堂| 亚洲人成网站在线观看播放不卡| 亚洲色中色| 在线色综合| 欧美一区二区丝袜高跟鞋| 无码日韩视频| 中文字幕66页| 亚欧乱色视频网站大全| 国产区精品高清在线观看| 日韩无码一二三区| 国产网友愉拍精品| 99re精彩视频| 国产美女一级毛片| 久久黄色视频影| 手机在线国产精品| 欧美中文字幕第一页线路一| 无码aⅴ精品一区二区三区| 欧美亚洲国产精品久久蜜芽| 成人国产小视频| 丁香婷婷激情网| 亚洲第一网站男人都懂| 伊人久久大香线蕉综合影视| 免费不卡视频| 狠狠色狠狠色综合久久第一次| 色网在线视频| 青青青视频蜜桃一区二区| 国产精品美女网站| 丁香六月激情婷婷| 人妻丰满熟妇啪啪| 国内精品九九久久久精品| 青青久在线视频免费观看| 小13箩利洗澡无码视频免费网站| 亚洲精品国产乱码不卡|