潘亞琴
在展開一項學術研究時,對歷年研究文獻的分析是必不可少的。文獻分析的方法分為定性分析與定量分析,其中定性分析使用得較為普遍,但這種分析方法往往受到經驗及專業能力的限制而導致以偏概全、管中窺豹的情況。目前,隨著文獻定量分析手段的不斷革新,知識圖譜通過抽取海量歷年研究文獻作為數據樣本,以文獻中作者、機構、關鍵詞等出現的頻次、占比等信息來挖掘優秀發文作者、鑒別發文機構,判斷研究熱點及其趨勢變化,已經在相關學者的研究中證實可獲得更加客觀、全面的分析結果。本次采用文獻定量分析軟件CiteSpace生成知識圖譜,以住宅價格研究的歷年研究文獻為樣本,從發文作者分析、發文機構分析、研究熱點歸納、熱點趨勢變化幾個方面進行了分析,為住宅價格研究梳理出較為清晰的思路。
本次通過檢索篩選,剔除了文獻綜述、新聞報道、統計報告等無關的文獻,摘取了收錄在知網中的2010—2020年間共計743篇國內住宅價格研究文獻作為研究數據。
對CiteSpace軟件生成的發文作者共現網絡圖譜的分析,從中可尋找研究領域內發文活躍的發文作者,再重點對發文量居于前十的發文作者進行分析。前十位作者具體為:周豫、蘭峰、張洪、溫海珍、沈悅、張學峰、吳振華、王洋、古恒宇、宋偉軒。通過對作者及其研究課題的了解,發現這十位作者在住宅價格研究領域均為翹楚,其中,蘭峰、張洪、沈悅為教授及博士生導師,周豫、溫海珍、吳振華為副教授,研究課題主要在宏觀及微觀層面因素對住宅價格的影響研究,同時也進行住宅價格波動的分析預測研究。從時間上看,這幾位作者發表成果的時間較早,古恒宇是中美大學聯合培養博士,與就職于專業研究所的王洋、宋偉軒重點進行了基于空間計量經濟學理論的住宅價格空間效應研究。
對發文機構共現網絡圖譜的分析,可找出較為活躍的專業發文機構。首先,住宅價格研究的發文機構超80%為高等院校,因此應該重點關注高等院校的研究成果。其次,從發文量占比及中心性指標的分析,可快速鎖定專業發文機構。在發文量上,排名第一的西安建筑科技大學管理學院,占比4%,并列第二的中國人民大學公共管理學院、西安交通大學經濟與金融學院、中山大學地理科學與規劃學院,各占比2%,其余機構占比各在0.2%~1%之間,類梯度的占比明確了對發文機構研究文獻關注的優先次序。而具有中心性的中山大學地理科學與規劃學院、中國科學院大學、華南師范大學地理科學學院,則具有0.01的弱中心性,表明這些機構是連接合作橋梁的角色,對其研究文獻亦優先關注;最后從時間上分析,中山大學地理科學與規劃學院發表文獻的時間最新,因此可對其優先進行了解。
關鍵詞是從論文內容中選取出來體現論文核心內容的實質意義的詞匯,因此對關鍵詞量化分析得出的關鍵詞網絡圖譜(圖1)及關鍵詞突現圖譜(圖2)可捕捉研究熱點,獲取熱點趨勢變化。

圖1 關鍵詞網絡圖譜

圖2 關鍵詞突現圖譜
住宅價格研究的關鍵詞多數體現的是課題方向、研究對象、影響因素、研究方法等方面的詞匯。本次集中對關鍵詞網絡圖譜(圖1)及其統計的頻次≥5次的關鍵詞進行總結歸納,從中全面了解近十年來的研究熱點。
結合本次摘取的文獻及其關鍵詞詞義,其中“空間分異”(19次)、“空間分布”(18次)、“空間自相關”(14次)、“時空分異”(6次)屬于空間效應研究,而“房價上漲”(22次)、“價格泡沫”(15次)、“價格預測”(22次)、價格波動(21次)更多涉及非空間效應研究。
在研究對象上,主要圍繞“住宅價格”(518次)本身進行,同時“住宅租金”(7次)作為住宅的收益價格也是學者研究的焦點,而“住宅價格指數”(15次)、“房價收入比”(13次)、“租售比”(7次)反映了住宅價格水平及變動,亦是重要的研究對象。
“影響因素”(101次)是住宅價格形成與變動的成因,因此是備受重視的研究。在微觀層面上,以“軌道交通”(49次)、“教育設施”(12次)最受關注;在宏觀層面上,以“土地價格”(11次)、“貨幣政策”(8次)、“調控政策”(7次)、“城鎮化”(6次)、“人口結構”(5次)、“房產稅”(5次)、“供求關系”(5次)更受研究者關注。
不同的課題會確定相應的研究方法。與非空間效應研究相關的方法主要有:
(1)“特征價格模型”(146次)是住宅價格研究中極受認可的研究方法,在近十年的研究文獻中使用頻次最高。與“多元回歸分析”(47次)一樣是基于OLS回歸分析的方法。
(2)“灰色關聯分析”(16次)、“主成分分析”(11次)、“主因子分析”(8次)多用在住宅價格影響因素篩選、降維、權重的設定。
(3)“灰色預測”(14次)、“向量自回歸模型(VAR)”(13次)、“ARIMA模型”(7次)、“面板數據模型”(6次)主要用于時間序列數據的研究,其中“面板數據模型”(6次)同時將橫截面數據納入分析,屬于完善的方法。值得注意的是,時間序列數據需要先行平穩性檢驗,“Granger因果檢驗”(12次)、“Johansen協整檢驗”(8次)、“脈沖響應分析”(5次)是平穩性檢驗方法缺一不可的步驟,關聯出現在關鍵詞中可說明相關文獻涉及了這幾類或類似的研究方法。
(4)“神經網絡模型”(7次)是住宅價格研究在互聯網信息時代背景下的與時俱進,較常用到的是BP神經網絡模型。
(5)“系統動力學模型”(13次)是通過分析價格影響因素內在運行結構來研究住宅價格成因的方法。
(6)“雙重差分模型(DID)”(7次)是用在住宅調控政策成效評估、軌道交通開通前后的價格對比等方面的研究。
而“地理加權回歸模型(GWR)”(19次)、“空間計量模型”(13次)屬于空間效應研究的方法。關鍵詞中“ArcGIS地理信息系統”(15次)、“Kriging空間插值法”(16次)、“地統計分析”(8次)、“探索性空間數據分析(ESDA)”(7次)反映的是作為空間效應研究重要輔助工具的可視化地理信息系統ArcGIS進行分析的研究。
關鍵詞的中心性越大,在網絡節點中的中樞紐帶作用越大,可認為是研究學者普遍使用的基礎詞匯。本次分析的關鍵詞中除ARIAM模型、雙重差分模型(DID)、城鎮化不具有中心性外,其余關鍵詞中心度均≥0.01,在開展課題研究時應該予以借鑒。
從生成的關鍵詞突現圖譜(圖2)可了解熱點的趨勢變化。通過對本次突現的19個關鍵詞及其突現時間的分析,發現國內住宅價格研究與其當時房地產市場、社會經濟狀況密切相關,因此結合相關文獻研究背景及其關鍵詞詞義的分析,探究到了近十年的熱點趨勢變化。
首先,從住宅價格的研究對象來看。2014—2015年,防止價格泡沫而監控住宅價格走向的住宅價格指數研究受到眾多學者關注。而2018年以后,有助于判斷住宅投機以遏制房價過快上漲的租售比研究成為焦點。
然后,宏觀層面的影響因素突現。2013年以前,找到居民收入、住房支付能力與上漲房價之間矛盾的解決對策被研究學者重視,同時就2010年在全國陸續鋪開的以限購限貸為主的住宅調控政策成效研究成為另一關注點;而新型城鎮化為住宅市場的健康發展所能帶來的正外部性從2018年起成為眾多學者研究的選擇。
最后從研究方法來看:
非空間效應研究方法:①2014年以前,向量自回歸模型(VAR)、面板數據模型在住宅價格時間序列數據研究方法的選擇中受到歡迎。而時間序列數據平穩性檢驗方法Granger因果檢驗、脈沖響應分析、Johansen協整檢驗雖然突現的時間有前后差異,但考慮其均為時間序列數據平穩性檢驗中的步驟,說明住宅價格研究領域在2016年以前就已經非常注重對住宅價格時間序列數據的研究。②“價格彈性”在2014—2015年突現,主要出現在采用對數函數形式的特征價格模型作為方法進行研究的文獻中,被認為能產生更具解釋性的研究結果。③“分位數回歸”在2016—2018年突現,反映的是對OLS回歸分析只能反映全局性指標而采用分位數回歸進行局部分析的一類改良優化研究。④“雙重差分模型(DID)”在2016年開始成為對比評估研究項目的優選。⑤諸多研究學者是自2018年開始熱衷應用“神經網絡模型”這一與人工智能相關的方法進行研究的。
在空間效應研究中,關鍵詞“空間格局”“時空分異”“空間分異”主要出現于針對空間異質性現象研究的文獻中,這些關鍵詞的先后出現說明空間異質性研究在近十年受到極大重視。模型的選擇上,地理加權回歸模型(GWR)自2018年被此類研究作為優選的方法。從圖譜中還能看到,伴隨ArcGIS軟件的發展完善,這一軟件自2012年以后被研究學者更多選擇。
本次運用文獻定量分析軟件CiteSpace生成的知識圖譜,對在知網篩選摘取的近十年國內住宅價格研究文獻進行了可視化定量分析,從發文作者、發文機構共現網絡圖譜中獲知了活躍的發文作者及發文機構;從關鍵詞網絡圖譜中總結了近十年以來住宅價格研究領域的研究熱點;對關鍵詞突現圖譜的分析掌握了熱點趨勢變化,為住宅價格研究明確研究思路提供了重要幫助。
然而國內住宅價格研究文獻的關鍵詞選取沒有明確的規范,在確定關鍵詞時往往受到作者的主觀意識影響而產生諸多不同表達方式的同義詞,因此在采用關鍵詞進行的定量分析中會導致一定的計量缺失。隨著人工智能技術的發展,未來相關研究可以借助智能提取技術對關鍵詞匯進行智能分類處理,或可獲得更為精準的分析結果。