999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于混合深度學習方法的房地產網絡輿情分析

2023-05-09 04:09:43李帥文劉繼
軟件工程 2023年5期
關鍵詞:房地產

李帥文 劉繼

關鍵詞:房地產;網絡輿情;情感指數;最大互信息

中圖分類號:TP183 文獻標識碼:A

1 引言(Introduction)

隨著互聯網的發展,大量的文本評論信息走進研究者的視野,成為反映房地產關注者情感表達的重要方式。現有的研究將文本評論的情感極性(積極或消極)作為反映市場狀態的指標,而本文通過研究發現,文本評論所蘊含的情緒得分不能直接用于衡量百度指數的變化,此外文本評論信息屬于非結構化的數據,具備非線性、非平穩性的特征[1],所以以往的量化投資方法應用于房地產價格研究并不適用。

近年來,越來越多的研究者嘗試使用深度學習解決基于時序數據的房地產波動問題。但是,每天會產生很多的房地產評論信息,利用深度學習只能得到單個文本的情感極性,因此單一使用深度學習得到文本情感用于衡量百度地產指數走勢是有一定缺陷的。

針對上述問題,本文提出在深度學習模型的基礎上構建情感指數,通過情感指數將深度學習得到的文本情感進行每日量化,從而估計其對于百度地產指數的影響。

2 相關研究工作(Related research work)

現有的對房地產市場輿情的研究可以分為兩類:一類是基于數值分析;另一類是基于傳統數學方法從多角度解讀影響房地產價格波動的因素。

為了能直接利用數值、數據,盡可能地了解數據背后的規則,張愛琳等[2]收集包頭市2015—2019年的年平均房價數據,用其構建預測房地產價格波動的GM(1,1)模型,從而預測包頭市房地產未來3年的價格變化趨勢。劉洋等[3]發現應用幾何布朗運動模型研究房地產價格變化有一定的優勢。幾何布朗運動模型僅單一考慮房地產價格數值信息,未考慮影響房地產價格變化的直接因素和間接因素。柳冬等[4]在進行房地產價格預測時,首先對影響房地產價格的因素進行分析,然后選取房地產行業的熱點問題,利用多種方法分析我國房地產市場價格的變化趨勢。趙怡爽[5]通過多元因子分析,從12個影響指標中挑選出重要性排名前兩位的影響指標,運用層次分析方法將上述指標進行加權賦值,得到最終綜合分數,進而預測未來房地產價格變動。邵為爽等[6]利用數據挖掘理論,將屬性約簡算法使用到房地產價格影響因素提取上,從而將降維后的數據放入網絡訓練并預測房地產價格走勢。這些方法都是基于影響房地產價格的因素,利用經濟模型對房地產價格進行預測。多元因子分析和層次分析方法皆在基礎模型上加入了其他影響因素。

隨著對影響因素的研究逐漸深入,研究者發現文本情感信息對房地產價格的預測有非常重要的影響。因此,融合文本信息的房地產價格預測模型應運而生。

何平等[7]通過構建投資者情緒指數,提取股民文本評論情緒用于研究股民的情感變化是否會影響股票市場價格波動。姜富偉等[8]通過專屬情感詞典計算媒體文本情緒指數,發現媒體文本情緒指數具有代表性作用,可以作為預測股票價格變動的參考依據。由上述研究可知,文本情緒表達會間接干預經濟變化。由于傳統情感分析方法在文本情感分類任務中耗時多且效率較低,繆亞林等[9]利用CNN和雙向GRU(門控循環單元)提取文本內在特征信息,然后通過單層GRU降維,使用激活函數進行情感分類。BEHERA等[10]提出將循環神經網絡(LSTM)與CNN結合,發現CNN-BiLSTM混合模型兼具LSTM和CNN的優點,可以使文本分類任務預測效果更好。上述研究驗證了深度學習在文本情感計算中的優越性,隨后研究人員提出深度學習文本情感分類和金融預測聯合模型。例如,JIN等[11]提出了一種基于LSTM的股票市場預測模型,該模型考慮了投資者的情緒傾向。

這些現有的基于房地產的研究和利用文本信息預測股票走勢及提供股票投資建議,讓我們有了基于深度學習提取文本情感,將其運用于地產行業的想法。

3 投資者情感指數與地產走勢相關性分析模型(Correlation analysis model of investorsentiment index and real estate trend)

為了高效提取特征,提高預測精度,本文將CNN和B i L STM網絡融入一個統一的框架之中,提出了一個名為CNN-BiLSTM的情感分析模型。該模型可以充分利用文本信息,自動學習和提取其內存特征。CNN-BiLSTM網絡結構模型如圖1所示。

在此模型中,首先通過Word2Vec(詞向量)模型訓練好詞向量,其次使用CNN提取輸入文本的局部特征,再次利用雙向循環網絡提取上下文總體文本特征,在通過Softmax分類得到情感極性后,利用自定義情緒指數計算每天的情感得分,最后將其與地產百度指數做相關性分析。

3.1 卷積神經網絡(CNN)

CNN模型主要是由卷積層和池化層構成,卷積之前需要利用文本輸入層提取文本特征,最后通過全連接層得到文本分類結果。在文本分類任務中,將文本訓練得到的詞向量傳遞給輸入層,然后通過卷積層提取詞語內部特征。卷積核的選取可以根據研究者的需求進行設置,然后通過池化進行運算,對文本特征做進一步處理,提取主要特征信息,將獲得的信息全部傳輸到全連接層,通過激活函數得到文本分類結果[12]。

設輸入詞向量為X,卷積神經網絡使用卷積核提取文本信息,從而更好地獲得字詞之間的語義內涵,其運算過程如下:

式(1)中, ?表示卷積運算,W和b表示權重和偏置,f (·)表示激活函數。把提取到的信息放入池化層,通過運算得到主要信息,運算過程如下:

最后將結果進行全連接運算。

4 實證分析(Empirical analysis)

4.1 實驗過程

房地產的價格走勢是一個二分類問題,市場參與主體如果持積極客觀的態度,看好市場未來發展,那么就可以判定房地產價格走勢極大概率會上升;反之則判定為下降。

本文實驗主要由三個部分構成,過程示意圖如圖3所示。

步驟一,分別爬取百度指數和房地產評論數據,對百度指數和房地產評論數據進行預處理,得到百度指數和房地產評論數據庫。

步驟二,對評論數據進行人工標注后,利用混合CNNBiLSTM建立評論情感分類模型。

步驟三,將預測部分評論數據輸入“步驟二”得到評論情感分值,利用自定義情緒指數計算每日最終情感得分,分析其與百度指數的相關性。

4.2 實驗數據與預處理

本實驗文本數據是相關房地產交易網頁中2020年1月初至2021年11月末有關新疆房地產評論文本數據,首先經過人工篩選剔除文本噪聲,其次對文本進行標簽標注,可以獲得11 961條有效數據用來對模型進行訓練和測試。在本實驗中,研究人員將2020年1月初至2021年5月末共計9 468條數據用來訓練模型,將2021年6月初至2021年11月末共計2 492條數據用來做預測分析。由于正負樣本不均衡,因此在此處采用下采樣方法做特殊出口。在構建詞向量階段,由于缺乏新疆地域性房地產詞典,所以對文本進行分詞處理時,將搜狗網房地產11個詞庫做合并處理,構建基礎分詞詞典,在詞基礎上利用結巴分詞,將人工篩選出的108條詞匯和根據TF-IDF(詞頻-逆文檔頻率)提取到的前2 000條詞匯添加到分詞詞典,從而完成新疆地區房地產詞典的構建。

4.3 實驗參數設置

本實驗中,Keras(人工神經網絡庫)被用作神經網絡的框架,并使用Python編程語言實現網絡結構。實驗實現過程需要環境配置,實驗性能也需要預定義相關超參數,環境配置與具體參數分別如表1和表2所示,其中Null表示該參數不需要設置。

4.4 實驗評價指標

為了直觀、定量地分析所提模型和情感指數性能,本實驗中采用準確率(Acc)、精準率(P)、召回率(R)和F1四類評價指標測度分類模型。下面給出了4類指標對應的計算公式,其中Acc衡量了模型分類準確性,R代表召回率,P代表精準率,F是精確率和召回率的調和平均數,當參數α =1時F就是F1測度。

上式中:TP表示預測的正向文本語料實際為正例;FP表示預測的正向文本語料實際為負例;TN表示預測的負向文本語料實際為負例;FN表示預測的負向文本語料實際為正例。

4.5 情感分類器實驗結果

為了驗證CNN-BiLSTM模型在文本情感分類的有效性,本文選擇五個對比模型(SVM、LSTM、TextCNN、BiLSTM、BiLSTM+Attention)與本文所提模型進行測試效果對比,其對比結果如表3所示。

從表3中可以看出,基于CNN-BiLSTM模型對房地產文本分類的準確率為93.38%,基于BiLSTM和BiLSTM+Attention模型的分類性能次之,基于SVM模型的分類效果最差。因此,本文選擇CNN-BiLSTM模型計算地產評論情感極性。

4.6 相關性分析

在CNN-BiLSTM模型得到情感極性后,通過本文設計的情感指數求得地產評論每日的情感得分(score)。首先為了驗證本文提出指標是符合實際的,則需要找出能夠代表新疆烏魯木齊房地產市場發展以及市場態度的指標測試指數。百度指數是由搜索百度引擎提出的,是基于互聯網大數據統計搜索量的一個指標。搜索量的數目可以體現投資者對市場的關注度,從而反映市場情緒變化。因此,選取百度指數作為檢驗指標,接著將計算出的情感得分和百度地產指數通過MIC分析相關性,得到MIC結果是23.08%,相關性較弱,繪制出的折線圖如圖4所示。

從圖4可以看出,情緒指數和百度指數走勢大致相同,但是MIC的結果和預想目標不太一致。通過移動平均值對數據做平滑處理,消除一部分噪聲。在對情緒指數和百度指數分別做30日的日均線,將情緒指數滯后5天,重新計算最大信息系數和繪制折線圖,繪制的折線圖如圖5所示。

計算得到MIC系數為67.84%,表現出較強相關性,從圖5中也可以看出情緒指數和百度指數趨勢基本一致,說明研究人員利用深度學習模型分析情感指數與百度指數具有較好的性能。根據市場情緒走勢,2021年7月,新疆烏魯木齊市投資者情緒高漲,樓市話題度較熱,其中2021年9月市場情緒指數和百度指數出現反常情況,這與市場大環境低迷等情況有關。2021年,住房和城鄉建設部提出把發展保障性租賃住房作為“十四五”住房建設重點任務,并且提出“三孩”配套支持政策落地:實施差異化租賃和購買房屋優惠政策,城市價值不斷凸顯導致情緒高漲,然而近年受某些因素的影響,幾乎所有行業受到沖擊,導致市場投資者情緒趨于悲觀趨勢,反映出投資者對房地產市場的擔憂。現階段國家和房地產企業拿出各種促銷活動,吸引投資者眼球,使投資者對房地產關注度有所上升。

5 結論(Conclusion)

本文在構建情緒指數的基礎上,引入深度學習提取文本情感極性分析房地產價格走勢,采用新疆烏魯木齊市房地產行業文本語料和百度地產指數對模型進行驗證,結果表明,通過CNN-BiLSTM模型提取的文本極性,通過構建量化情感指數計算得到某一日情感得分,將其與百度指數擬合,最大互信息值為67.84%,相關程度非常高,并且對市場效應進行分析,通過移動平滑可以讓二者走勢基本吻合。此模型既可以保證文本情感和房地產價格有較強的相關性,又可以保障二者走勢的可視化趨于一致,市場決策者可以根據此模型研究結論,通過實時測度房地產評論輿情走勢,為數字經濟下市場決策者提供智力支持。

作者簡介:

李帥文(1997-),男,碩士生.研究領域:數據智能分析,文本挖掘.

劉 繼(1974-),男,博士,教授.研究領域:數據智能分析,文本挖掘.

猜你喜歡
房地產
試論我國房地產行業知識產權立體化保護策略
房地產管理的重要性及其研究
房產售樓寶項目研究
科技視界(2016年22期)2016-10-18 15:02:46
關于房地產是支柱產業的辨析
中國市場(2016年33期)2016-10-18 12:38:42
化解我國房地產庫存對策研究
商(2016年27期)2016-10-17 05:17:30
新形勢下的房地產企業成本控制研究
商(2016年27期)2016-10-17 04:00:11
“白銀時代”房企轉型,路在何方
人民論壇(2016年27期)2016-10-14 13:21:12
淺議房地產風險分析以及管理措施
企業導報(2016年11期)2016-06-16 15:45:58
房地產開發項目投資估算研究
企業導報(2016年5期)2016-04-05 12:39:21
主站蜘蛛池模板: 98超碰在线观看| 欧美精品三级在线| 国产精品99久久久| 国产精品视频白浆免费视频| 国产成人综合亚洲欧美在| 国产在线观看精品| 欧美亚洲国产精品第一页| 亚洲国产成人无码AV在线影院L| 国产成人免费观看在线视频| www.91中文字幕| 亚洲国产91人成在线| 91午夜福利在线观看精品| 91人妻日韩人妻无码专区精品| 国产高清无码第一十页在线观看| 日韩视频免费| 黄色网站在线观看无码| 欧美日韩中文字幕二区三区| 亚洲一区二区约美女探花| 欧美一级特黄aaaaaa在线看片| 91欧洲国产日韩在线人成| 免费国产高清视频| 国产欧美中文字幕| 国产精品网址你懂的| 欧美精品导航| 特级做a爰片毛片免费69| 亚洲毛片网站| 四虎成人在线视频| 大陆精大陆国产国语精品1024| 一区二区影院| 国产欧美日韩在线一区| 日韩免费毛片视频| 亚洲色图综合在线| 久久久波多野结衣av一区二区| 色哟哟国产精品一区二区| 免费福利视频网站| 天堂在线视频精品| 亚洲人成网站观看在线观看| 日本手机在线视频| 欧美一区二区自偷自拍视频| 一级一毛片a级毛片| 视频国产精品丝袜第一页| 青青国产视频| 国产一区二区免费播放| 一级毛片在线播放| 久久综合亚洲鲁鲁九月天| 亚洲国产91人成在线| 亚洲中文字幕手机在线第一页| 亚洲欧美不卡| 中文字幕欧美日韩高清| 看你懂的巨臀中文字幕一区二区| 久久国产香蕉| 另类欧美日韩| 高清精品美女在线播放| 亚洲日韩高清在线亚洲专区| 91毛片网| 天天躁狠狠躁| 97国产精品视频人人做人人爱| 亚洲熟妇AV日韩熟妇在线| 久久国语对白| 亚洲中文精品人人永久免费| 凹凸国产熟女精品视频| 欧美精品一区二区三区中文字幕| 国产精品页| 日韩欧美中文| 国产白浆视频| 中文字幕波多野不卡一区| 一本视频精品中文字幕| 久久久久国产精品嫩草影院| 欧美色视频日本| 女人18一级毛片免费观看 | a级毛片免费看| 久久青草热| 精品国产电影久久九九| aa级毛片毛片免费观看久| 91蜜芽尤物福利在线观看| 国产办公室秘书无码精品| aa级毛片毛片免费观看久| 国产69精品久久久久孕妇大杂乱| 欧美激情视频二区| 综合亚洲网| 亚洲人成网址| 亚洲天堂色色人体|