任秋靜 劉露 石燕 黃宗海 鐘艷梅 溫川飆 羅悅






關鍵詞:灰色關聯度分析法;VOSviewer 計量分析;應用;研究方法
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2022)36-0001-04
灰色關聯分析法是基于行為因子序列的微觀或宏觀幾何接近,以分析和確定因子間的影響程度或因子對主行為的貢獻測度而進行的一種分析方法。該方法基于灰色系統,可在不完全的信息中對所要分析研究的各因素在隨機的因素序列間找關聯性[1]?;疑到y是我國學者鄧聚龍教授1981 年在上海召開的中-美控制系統學術會議上提出的。鄧聚龍教授將灰色系統定義為只掌握或只能獲得部分控制信息的系統,相應的部分數學特征性確知、部分元素確知的矩陣為灰色矩陣;部分數學特征已知但具體數值未知的參數為灰色參數[2-3]。與灰色相對的還有白色與黑色,白色表示信息完全已知與掌握,黑色則表示信息完全未知,對于白色與黑色在此不再贅述?;疑P聯度分析在灰色系統理論提出后產生并應用于各個領域,從1982年開始應用至今積累了大量的應用實例,同時灰色關聯分析法也在應用過程中逐步改進和發展。對于過去灰色關聯度分析法在過去三十多年的應用和成果,本文將利用可視化分析軟件VOSviewer從實例應用和分析方法發展改進兩方面進行可視化闡述。
1 灰色關聯度
分析分析流程與方法灰色關聯分析通過確定參考數據列和若干比較數據列的集合形狀相似程度判斷其聯系的緊密程度,并以此確定關聯度?;疑P聯分析法的分析流程[4]分為六步(如圖1)。
1.1 收集數據
灰色關聯分析法第一步要根據分析目的確定相關因素并進行數據收集。該方法對數據分布沒有特定要求,可以任意分布。需要注意的是在進行灰色關聯度計算中需注意值不能為負,以免出現運算中的抵消。當出現負值數據時,將所有數據項與最小負值絕對值相加,后續運算采用相加后的數據。
1.2 確定數據列
確定參考數據列與比較數據列。參考數據列是根據分析目的確定的一個理想比較標準,各影響因素作為比較數據列。以比較數列作為算法子序列與參考數據列即算法母序列進行比較。
1.3 對數據進行無量綱化處理
各比較數列由于其值不同,甚至單位的不同,如體重和身高,導致數據差異過大,因此在進行計算之前要對數據進行無量綱化處理。在灰色關聯度分析法中進行無量綱化處理采取均值化法或者初值化法。均值化是將包括參考數據列在內的每項數據列各自相加然后求其平均值,然后再以數據列內各數據除以平均值,得到均值化結果。初值化是將包括參考數據列在內的每項數據列的第一行數據作為1,使用數據列中其他數值除以第一行數據得到初值化結果。均值化和初值化處理的目的都是為了將原本數據之間的差異減小,使數據化為相近的無綱量數據,后續計算都采用無綱量化后的數據進行計算,以處理后的數據進行計算可以有效避免計算結果出現偏頗,同時縮小計算誤差。
1.4 計算關聯系數
以公式對比較數據列與參考數據列的關聯系數進行計算:
1.6 關聯度排序并得出結論
對關聯度結果進行大小排序,其值越大則關聯度越高。
2 研究方法與數據來源
2.1 知識圖譜與VOSviewer 分析軟件
目前廣為人知的知識圖譜其全稱為科學知識圖譜,是顯示知識的發展進程與結構關系的一種圖形,用可視化技術描述已有知識資源及其載體,繪制、挖掘、分析和顯示科學技術知識以及相互之間的聯系,在組織內創造知識共享的環境以促進科學技術研究的合作和深入,其以科學知識為計量研究對象[5]。VOSviewer是由荷蘭萊頓大學科研究中心的Nees Janvan Eck 和Ludo Waltman于2009年開發并免費開放使用的知識圖譜分析軟件。Vosviewer的開發彌補了當時知圖譜分析軟件僅能滿足低于100條數據的項目分析,對大量數據分析無力的缺陷。相較此前的計量分析軟件,VOSviewer通過增加和改進縮放功能、特殊標注等手段使其具有更完備的功能[6]。VOSviewer運用概率論的思想,采用關聯強度算法,對共現數據進行歸一化處理具有優勢,因此適合對大規模網絡進行可視化分析[7]。本文采集的數據有兩千多條,因而選取VOSviewer軟件作為分析工具。
2.2 數據來源與數據格式轉換
將中國知網作為來源數據庫,以“灰色關聯度分析法”為檢索詞進行檢索,檢索條件:(主題%='灰色關聯度分析法' or 題名%='灰色關聯度分析法' or title=xls('灰色關聯度分析法') or v_subject=xls('灰色關聯度分析法') );檢索范圍:CNKI總庫。共計算結果3669 條,排除會議、學位論文和不相關文獻后共計2753篇期刊文獻,人工排除無作者文獻和重復文獻。結果符合納入文獻為1987年01月-2021年10月合計2726篇,其中中文文獻2535篇,英文文獻191篇。檢索日期2021年10月19日。
將檢索到的結果以Endnote樣式導出為txt格式,再在Endnotex9中導入題錄。經人工篩選排除重復和無作者文獻后導出題錄,設置導出樣式為VOSviewer 支持的RefMan(RIS)保存為txt格式記事本,后修改文件后綴名為“.ris”。本文使用的工具軟件為VOSview?er_1.6.13。
3 數據分析
3.1 發文趨勢
灰色關聯度分析法的應用論文最早見于鄧聚龍于1985年發表的《灰色系統與農業》[8]文中列舉了灰色關聯分析在汾河輸沙量和果樹產量實例中的應用。其后歭英與石書琰[9]于1987年利用灰色關聯度分析法對棉花品系進行評價,并且將灰色關聯度分析法與模糊評價方法進行比較。二者評價結果完全一致,但是灰色關聯度分析方法具有計算更加簡便的優點。之后灰色關聯度分析法逐漸應用在更多的領域,并且在應用中逐漸改進。發文量趨勢圖(圖2)可以看出灰色關聯度分析法相關文獻在1987年至2015年一直呈上升趨勢,其中2004-2015年上升趨勢相對較快;在2015年發文量達到頂峰,年發表論文258篇;2015年之后發文量出現下降趨勢。
3.2 灰色關聯度分析法應用可視化
3.2.1 高頻次關鍵詞可視化
將2726條文獻題錄導入VOSviewer軟件進行分析,以關鍵詞出現頻率≥10篩選聚類得到高頻關鍵詞標簽圖(圖3)。從圖3可以看出灰色關聯分析法主要應用在農藝、經濟,主要研究內容是影響因素測定和評價指標測定。
程葉青等[10]將灰色關聯分析法應用于東北地區單位面積糧食產量的性狀特征的動態變化研究,并且通過分析成功得出影響單位面積糧食產量變化的重要因素是農業機械總功率、化肥消耗和有效灌溉面積,而提高單位面積糧食產量的有效途徑是建設農田改良基礎,開墾中低產田等。潘雄鋒[11]則是將灰色關聯度分析應用于城市建設和經濟協同發展系統。利用協同學、灰色理論、數值分析的相關理論建立城市建設與經濟協同發展系統的數學模型,并以此對大連市的城市建設和經濟協同發展關系進行分析,得出提高GDP對城市建設與經濟協同發展系統向高級有序狀態發展極為重要的結論,為城市建設決策提供了參考。
導入題錄屏蔽針對灰色關聯度分析法本身的研究得到和高頻關鍵詞密度聚類圖(圖4)。根據圖4可以看出,灰色關聯度分析法的應用主要分為三個熱度板塊:一是以農藝性狀和農產品集中分布的農業板塊;二是與農業密切關聯的綜合評價應用;三是以經濟增長為核心設計到影響因素和產業調整的經濟增長模塊。
馬素英[12]利用灰色關聯度分析法對海洋經濟效益進行了測評。通過對海洋經濟第一、第二、第三產業占比以及海洋經濟與國民經濟關系的分析,獲得了海洋經濟產業結構的構成和變化趨勢;同時計算海洋經濟GDP在國民GDP中的比重,獲悉海洋經濟與整體經濟之間有的相關性。
由上述高頻關鍵詞的標簽聚類和密度聚類可以得到灰色關聯分析法應用的最主要范圍是農藝性狀和農業產品的評價,其次則是經濟增長方面的應用;同時對于農業和經濟的產業結構也通過灰色關聯分析法進行分析調整。對于灰色關聯度分析法的應用內容在于綜合評價分析,利用灰色關聯分析法的部分已知屬性對整體進行評價探索。
3.2.2 低頻次關鍵詞可視化
將2726條文獻題錄導入VOSviewer軟件,以關鍵詞出現頻次≥2聚類分析得到低頻關鍵詞標簽圖(圖5)。圖中由冷色到暖色調的過渡過程表示時間從遠至今的顯示,圖中字標大小表示關鍵詞出現頻次,字標越大則出現頻次越高。由圖5可以看出出現頻次最高的仍舊是農藝性狀和綜合評價,綜合分析其原因是在2010年前累計研究發文多集中在農業和綜合評價方面。隨著研究方法越來越成熟,越來越多的行業出現了灰色關聯度分析法的應用。2010年至2015年出現了醫藥、房地產市場、消費結構等方面的應用;2015年至2021年期間灰色關聯度分析法的應用擴展到制造業、物流業、網絡等行業。
蔡萍等[13]對杜仲藥材有效成分與環境因子的關系進行了灰色關聯度分析。通過對影響杜仲皮和葉中有效成分含量產地差異性的主要環境因子的分析,得出堿解氮、速效鉀、有機質、年平均相對濕度、年平均最高氣溫為排名靠前的影響因素,據此為合理施肥及環境調控來提高杜仲次生代謝產物的含量提供參考,也為杜仲的適宜種植區選擇提供了依據。梁雯等[14]通過灰色關聯度分析,找到影響物流業全要素生產率的主導因素和潛在因素,并成功得出技術效率的提高是增加物流業全要素生產率的主要動力,而技術進步則并未真正起到促進作用的結論。該團隊還據此提出了提高物流業全要素生產率的兩個途徑。
根據上述低頻次關鍵詞聚類可以清晰地了解到灰色關聯度分析法的應用脈絡,其在農業方面的應用是時間最早、范圍最廣且時間跨度最大的。除此以外其應用從早期的農業行業擴展到醫藥、物流、制造、技術等各個行業,目前灰色關聯分析法的應用已經涵蓋三大產業。
3.3 灰色關聯分析法研究方法可視化
灰色關聯度分析法在實例應用中發揮了很重要的作用,同時也在此過程中暴露了其關聯度計算中客觀性不足、評價精度低等弊端。后來的學者針對灰色關聯度分析法的弊端在應用過程中引入了相應的改進和彌補方法。
將文獻題錄導入VOSviewer軟件,篩選以聯合研究技術≥5的關鍵詞聚類分析得到技術關鍵詞標簽圖(圖6)。根據圖6可以看出其聯合技術方法以層次分析法即Analytical Hierarchy Process(AHP)為主要分析方法,并且以層次分析法為核心向熵值法、topsis(距離分析法)和聚類分析等方法擴展和延伸。
灰色關聯度分析法關聯度計算公式對各樣本采用平權處理[15],在計算中顯現出客觀性較差,不符合某些更為重要的樣本的實際情況[16]。對此,鐘登華[17]于1994年使用層次分析法與灰色關聯度分析法相結合的方法對水利工程決策方案進行研究,利用層次分析法確定權重,針對難以數量化的定性和定量指標采用灰色關聯度進行分析使得開發方案的決策方法更加直觀明了和便捷實用。王敬敏等[18]在2005年將層次分析法和距離分析法分別引入灰色關聯度分析法,并且在評價河北省農村電力消費影響因素實例印證中對兩種改進方法做出了比較研究。結果顯示層次分析法需要先人為地進行層次劃分,并且對每一層的相對重要性給予定量表示,這一過程具有主觀性,在易于請到專家的條件下用層次分析法改進應用較好;與此相對的距離分析法的權重計算具有客觀性強的優點,因此在數據齊全且應用者熟悉數學計算的情況下采用距離分析法更易于操作和客觀。
針對灰色關聯度分析法評價精度低的弊端,李國良等[19]于2006年將熵值理論[20]引入灰色關聯分析法,利用數據本身的信息無序化效用值進行權重系數的計算,從而消除權重計算中的人為干擾,并利用該方法對雨水資源開發利用潛力進行綜合評價。結果顯示基于熵權的灰色關聯分析模型較單純灰色關聯分析法的評價結果更加合理準確。邵軍義[21]、鄒立巖[22]則是將TOPSIS 法與灰色關聯度法結合建立GRATOPSIS模型,并引入OWA[23]算子加權,該方法能有效彌補灰色關聯度分析法評價精度低和TOPSIS法不能很好反應數據的態勢變化和無加權處理的弊端。其團隊在承包商選擇的實例應用中也成功證實引入OWA算子賦權的GRA-TOPSIS模型能充分發揮模型各自的優點,避免單一模型使用的局限性。
邱學軍[24]于1995年將聚類評估引入灰色關聯分析,提出灰色聚類關聯分析法(GCRAM),并且在復雜醫學病類診斷上進行了實例驗證,并表明其可以使用于醫學、經濟、科技等多個領域。未必貴等[25]于2010年將指數表達式引入灰色聚類關聯分析法,將灰色聚類關聯分析法的白化函數進行改進,使之能夠更加充分合理地利用已知信息,夠做出更加準確的評價。其團隊將改進后的方法應用于阜新市大氣環境質量評價,其結果顯示改進后的灰色聚類關聯分析法拓寬白化函數范圍,信息利用率更高,評價結果也更加客觀準確。
4 結果與討論
本研究對灰色關聯度分析法自提出以來的應用和方法改進做出了可視化分析,分析結果顯示其主要范圍是農藝性狀和農業產品的評價,其次則是經濟增長方面的應用;同時對于農業和經濟的產業結構也通過灰色關聯分析法進行分析調整。隨著研究方法越來越成熟,越來越多的行業出現了灰色關聯度分析法的應用。其應用也從早期的農業行業擴展到物流、制造、技術等各行業。
灰色關聯度分析法在應用過程中暴露出關聯度計算中客觀性不足、評價精度低等弊端。因此產生了以層次分析法即Analytical Hierarchy Process(AHP)為主要分析方法向熵值法、topsis(距離分析法)和聚類分析等方法擴展和延伸的復合研究方法。除此以外在近幾年人工智能的浪潮下,正則化徑向基神經網絡[26]、正交設計[27-28]、直覺模糊灰色關聯分析(IFGRA)[29]、灰色-響應曲面法(GRA-RSM)[30]等更多的方法也開始應用于灰色關聯分析法的研究應用中。
灰色關聯度分析法實用性高,在過去三十年的應用中已經積累了大量實例經驗,這些經驗也充分證實了灰色關聯度分析法對于小樣本、部分可知的系統分析的適宜性,該方法宜推及如中醫中藥等正值與現代科技相碰撞和融合時期的傳統領域。