[摘要] 商品交易市場專業化指數是用來衡量某地區各類商品交易市場經濟總量在各類交易市場之間的集中程度。基于前人的研究基礎,作者給出了億元商品交易市場專業化指數計算公式,并將空間關聯規則分析引入商品交易市場專業化水平與其他經濟因素的關聯分析中。在指定的最小支持度和可信度閾值下,獲得了3條有意義的商品交易市場專業化水平與其他經濟因素之間關聯規則。通過這些關聯規則,可以對一地區商品交易市場的專業化水平進行預測,為市場合理規劃和建設提供決策支持。
[關鍵詞] 億元商品交易市場 專業化 關聯規則 數據挖掘
億元商品交易市場是指年成交額為1億元及以上的大型和特大型市場(以后億元商品交易市場簡稱商品交易市場)。經過幾十年的發展,中國商品交易市場呈現出規模化、規范化、專業化、信息化和高效益化等特征,豐富了人們的物質、精神生活,增強了區域合作,推動了城鄉的立體化發展。目前有關商品交易市場的研究多集中于政策研究和基于統計數據的發展趨勢分析。在專業商品交易市場方面,更多的學者是不同區域的專業市場進行統計分析,以發現其發展變化的規律。游產業的發展,加強區域合作,形成高度區域一體化,合作立體化。尋找專業化水平高低和相應的區域其他因子之間關聯關系對區域商品交易市場的規劃和建設都有著重大的意義。商品交易市場專業化的影響因素是分布于一定的區域內,同時具有屬性信息和空間信息,并且相互之間存在一定相關性。影響因素分析的方法,一般是多元回歸分析或經驗模型。首先這些方法不能處理空間信息,其次它們要求數據要滿足統計獨立性。因此,傳統的分析方法無法反應它們之間一種共生或因果關聯模式。鑒于以上原因,本文將可以同時處理空間和非空間信息的空間關聯分析引入區域商品交易市場的專業化研究中,通過分析相應影響或者共生因素,挖掘其與區域商品交易市場專業化之間的關聯模式,為我國億元商品交易市場的合理規劃和建設提供參考依據。
一、數據來源
本文所用有關億元商品交易市場數據來源于2001年到2007年中國商品交易市場統計年鑒(該統計年鑒最早起始于2001年)。此統計數據包括中國大陸地區的省、地區和直轄市,缺少西藏自治區、香港、澳門、臺灣地區的相關統計數據。市場成交額反應了市場的規模,被用于進行商品交易市場專業化指數計算。專業化指數是指一個地區所有類型專業化市場的成交額或其他指標在該地區中所有類型專業市場中的分布情況。因此,專業市場的分類對專業化指數有著很重要的影響。本文采用中國商品交易市場統計年鑒對專業化市場的分類方法將億元商品專業市場分成,紡織品服鞋帽裝市場,食品飲料煙酒市場,家具市場等21類市場(詳見中國商品交易市場統計年鑒)。
參與億元商品交易市場專業化關聯分析的要素主要包括,城鎮居民恩格爾指數,農村居民恩格爾指數,人口密度,公路密度,鐵路密度,個私經濟發展水平,貿易競爭,城市化水平,第二產業占所有產業比重,市場化水平,鄰域專業化水平。這些數據主要來源于2001到2007年的中國統計年鑒和中國人口統計年鑒。其中有些因素是通過計算得到,例如貿易競爭水平是通過出口額與進口額的比值得到。
二、研究方法
1.商品交易市場的專業化測度方法。在產業經濟學中,區位商常被用于衡量區域內部的某一部門專業化水平的高低,如商建初等利用區位商研究了長三角地區工業的行業專業化程度;宗剛等利用?指數及區位商對北京產業結構進行研究。區位商反映的是一個研究區域內某一產業是否具有比較優勢,但無法反映各種產業在空間上聚集后專業化的程度。賀燦飛等在研究中國制造業的省區專業化時,引入了一個專業化測度方法來度量各省區的諸產業相對集中指標。當研究區域中所有產值或其他考察變量集中于一個產業時,專業化指數應該最高,理論上應該是1,然而該公式測算的結果為(n-1)/n,只有當n趨于無窮大時才能得到1。當專業化水平較高時,n越大,計算的專業化指數就越精確。商品交易市場專業化指研究區域內所有類型交易市場的交易額或從業人口總數在各類交易市場間的集中程度。當交易額或其他參數在各類交易市場之間平均分布,專業化指數最小,是0;當交易額或其他參數集中于某一類市場,專業化指數最高,是1。為了正確衡量商品交易市場的專業化水平,本文對賀燦飛等人提出的模型進行改進,并用其對中國億元商品交易市場的專業化水平進行度量。商品交易市場專業化指數的計算公式如下:
(1)
(1)式中,S是研究區域中商品交易市場類型的個數; 為研究區域中每類交易市場占所有類型交易市場的總成交額的比重的平均值;VAjn,VAkn 為研究區域n中j,k兩種類型商品交易市場的成交額;VAn為研究區域n中所有類型商品交易市場的成交額。當研究區域中的商品交易市場類型個數為1時,不采用該計算公式,專業化指數為1。
2.空間關聯規則。Agrawal等于1993年首先對顧客交易數據中購買物品之間的關聯問題進行研究,提出了關聯規則的概念,并給出了相應挖掘的算法。Koprski K對傳統的關聯規則進行了拓展,并成功地將其引入了空間數據挖掘領域。從此諸多地學工作者和區域經濟學家對空間關聯規則挖掘進行了大量的研究,主要包括概念,挖掘過程,挖掘算法等。這些基礎性的研究工作大大地促進了空間關聯規則在各領域中的應用。空間關聯規則是通過蘊含表達式來進行描述,如A→B(c%,s%)。A和B是交集為空(A∩B=φ)的謂詞集合,且二者中至少包含一個空間謂詞。s%,是規則的支持度,指A和B在所有空間事務中同時發生的概率,P(A∩B)。c%,規則的可信度,指在所有空間事務中A發生的前提下B發生的概率,P(B/A)。非空間謂詞,指常規的邏輯謂詞。空間謂詞是包含空間關系的邏輯謂詞。除了可信度和支持度,很多學者還開發出了其他的指標對空間關聯規則進行衡量。蘊含表達形式直觀、簡單、明了。如規則,is-a(x,house)∧close-to(x,urban center)→is-expensive(x)(100%,95%)。該規則表明:95%靠近市中心的房子價格都高,該規則的正確率為100%。
3.鄰域專業化空間滯后。一個研究區域的商品交易市場專業化的水平不但與該區域中的經濟因素有關,而且還受到其鄰域商品交易市場專業化程度的影響。本文中通過專業化指數滯后來反映鄰域專業水平對當前研究區域商品交易市場專業化的影響。專業化指數滯后計算公式如式(2)所示。
(2)
S是鄰域億元商品交易市場專業化指數空間滯后,N是研究區域的鄰域個數,pn和λn分別是第n相鄰區域的專業化指數和相應的權重。
三、億元商品交易市場區域專業化關聯分析
1.億元商品交易市場區域專業化計算。關聯規則分析要求數據表中的屬性是離散的數值或符號。在進行關聯分析之前,應該將連續的專業化指數轉換成離散的專業化水平。本文將商品交易市場專業化劃分成三個等級:高專業化水平,中等專業化水平和低專業化水平。下圖展示了2005年各省區億元商品交易市場專業化水平的分布情況。
說明:①(a)是億元商品交易市場專業化指數(連續)分布圖,(b)是離散化億元商品交易市場專業化水平分布圖②統計數據主要包括大陸省區億元商品交易市場成交額數據。西藏地區和港澳臺地區沒有統計數據,專業化指數設為0。③為統一數據,專業化計算過程中沒有包含計算機市場、通訊器材市場和花卉市場。
連續型專業化指數可以更精確地表示商品交易市場的專業化水平,但是其不符合人們的思維習慣,比較抽象不易理解。離散型的專業指數很容易被人們接受和理解,但精度不是很高。由于關聯分析的需要,我們需要將連續的專業化指數進行離散化處理。
2.億元商品交易市場區域專業化關聯因素分析。關聯規則分析可以發現專業化水平和區域其他因素之間讓人感興趣的關聯知識。關聯規則的支持度反映該規則在挖掘數據中的覆蓋度;可信度反映規則的正確度。在對挖掘規則沒有限制的情況下,會有大量的關聯規則成為挖掘結果,但其中只有很小的一部分是有意義的。最小置信度和支持度分別設置為80%和10%。除了規則模版、最小支持度和置信度,我們通過專業知識對的挖掘結果進行分析評估來得出最終有意義的關聯規則,如表1所示。
結合中國億元商品交易市場的專業背景知識,這里我們得到了3條有用的規則。它們的支持度和置信度分別在14%和81%以上。其中第一規則說明:如果一個地區的城市化水平中等,第二產業占所有產業的比重高,市場化水平低,人口密度低,高速公路密度低,該地區的億元商品交易市場專業化是中等水平,該規則的支持度是14.29%,置信度是90%。
四、討論與結論
商品交易市場專業化影響因素是分布于一定的區域空間中,具有屬性信息和空間信息,且相互之間存在一定的相關性。由于空間信息的存在和統計獨立性假設的無法滿足,從而使得傳統的分析方法無能為力。空間關聯規則可以反映要素的空間、非空間信息之間的關系,適合進行商品交易市場專業化關聯分析。空間關聯規則分析要求數據表中的數據項是離散的,然而專業指數和影響因素數據都是連續的。連續數據離散化是空間關聯分析的第一步工作。上圖顯示了2005年中國億元商品交易市場省區專業化指數連續值和離散值的空間分布情況。通過對比我們可以發現:連續數據表達更精確;離散數據表達更易理解。上表顯示了空間關聯分析獲得的強關聯規則。在指定的最小置信度和最小支持度下,我們只能獲得后件為商品交易市場專業化是中等水平的關聯規則。不同的關聯規則前件,對應的置信度和支持度也各不相同。連續數據離散化是關聯分析前最為重要的數據處理過程。不同的離散化方法得到的離散化結果存在很大的差異,最終影響關聯分析的結果。本文中采用的等距離離散化方法將所有連續數據轉換成三個等級的離散值:高、中和低。由于專業化指數和影響因素的連續數值集中于一個很窄的數據范圍內,從而導致了離散化后數據集中于中水平等級。如最終的挖掘結果所示,所有強規則的后件都是專業化水平中,其他兩個等級為后件的規則都被最小支持度和可信度過濾掉了。同時缺失數據的插值算法和統計數據本身的精度對離散化的結果也有著重要的影響。商品交易市場專業化是衡量一個地區所有商品交易市場的經濟總量在各類交易市場之間的集中程度,其反映了經濟總量的一種分布模式。基于前人的研究基礎,作者給出了商品交易市場專業化指數的計算公式。空間關聯規則被用于對商品交易市場專業化與其影響因素之間關聯分析,如最后分析結果所示,我們得到了三條有趣的關聯規則。這些規則可以用來預測一個地區商品交易市場專業化的水平,也可以為商品交易市場的規劃與建設提供決策支持。
注:張雪伍為通訊作者
參考文獻:
[1]任興洲:我國商品批發交易市場的發展現狀與趨勢[J].經濟縱橫, 2000, (8): 26~27
[2]王克臣李敏:入世五年我國億元商品交易市場快步走過[J].數據, 2007, (7): 28~30
[3]楊松:北京商品交易市場的發展模式及管制方式 (一) [J]. 中國市場, 2007, (30): 24~27