摘要:IPO定價一直是理論界和實務界爭相討論的熱點話題,以往構建于單一指標的估值方法誤差較大,怎樣采用合適的辦法對IPO定價相關指標進行量化分析是一個難題。文章對研究對象數據采用主成因分析法對影響IPO定價的有關指標矩陣數據進行預處理,再采用改進的Chameleon算法進行聚類分析,最后對待分析的新上市股票進行貝葉斯分類,從而實現其定價的指導。實驗證明,該方法能夠比較客觀、科學的對IPO定價進行調整指導,具有一定的實際意義。
關鍵詞:聚類算法;改進Chameleon算法;IPO定價
中圖分類號:F803 文獻標識碼:A 文章編號:1009-2374(2014)04-0029-03
在第四次新股發行體制改革穩步推進的大背景下,IPO定價理論研究近期得到了廣泛關注,傳統的IPO估值辦法由基于資產的估值方法、現值估價方法、可比公司法、實物期權估價法等,但采用少數單一指標比對的估值辦法難免有失偏頗,而多指標估值法因指標間的復雜關系,采用人工或某些簡單的基數對比算法難以厘清各種指標間的關系,實用性受到極大影響。聚類算法作為可行、高效、客觀的計算機自動處理劃分技術在信息處理領域得到了廣泛應用。現有的聚類算法主要有:劃分法、密度法、網格法等,這些算法大都存在初始參數需要人工給定,分類過程需要人工調整干預的缺陷,影響了算聚類的無監督性和客觀性。
本文的思路是在回歸分析的基礎上,遴選變量作為聚類指標,再利用改進的Chameleon算法進行聚類分析并得到一組分類判別函數,最終實現對IPO的定價調整。實驗證明,該算法具有無監督和泛化能力強的
特點。
1 數據預處理
如表1所示,每一個對IPO定價具有影響的分指標的量綱和數量級都不同,未消除不同指標間的差別,同時考慮到分類器收斂的需要,采用適當調整過的主成分分析法(PCA)對數據進行降維預處理。具體步驟為:(1)對原始數據進行預處理,剔除大于95%分位的和小于95%分位的極端數據;(2)再對處理后的數據用平均值法進行處理;(3)計算協方差矩陣;(4)計算矩陣的特征根和特征向量,由此得到各成分的方差貢獻率及累計方差貢獻率;(5)依據累計方差貢獻率大小依次排列,取前t個為主成分。
3 具體流程
挑選具有一定代表性的股票樣本數據,按照表1列出因素矩陣,并利用調整過的主成分分析法對數據進行預處理確定t個主成分;選定某行業作為分析范圍,利用改進Chameleon算法對相關行業股票數據進行聚類分析;(1)利用預處理后的矩陣計算得到加權圖;(2)假設初始加權圖分為n個獨立的簇,然后每次選取結構等價相似度小的兩個簇進行合并,并計算模塊度;(3)模塊度達到最大時停止計算,此時的劃分結果即為聚類
結果。
計算不同類別的費氏線性判別函數,將待分析的新上市股票定價因素值帶入求得函數值,依據最大值判定分類歸屬,并依此進行最終定價分析。
4 實驗及其結果
選取1993年4月至2005年2月期間我國滬深市場所發行36只電力板塊IPO股票為樣本,依靠各自上市時的財務數據,進行數據預處理,設定累計方差貢獻率閾值為85%,求得主成分為:每股凈資產(POE),市盈率(PE),區域(A),主營業務利潤率(PR),發行股數(QN)共5項,利用本文給出的改進的Chameleon算法進行聚類分析,其分析過程如圖1所示,當Q的最大值為0.54時,37支股票被劃分為3類。
運用判別函數時,將帶判別股票的各指標數據分別代入3個判別函數中,每個樣本點對應的3個函數的值進行比較,其中,函數值最大的那個是第幾個函數,則該股票就歸為第幾類,由此可以得出IPO定價的參考值。
下面分別采用2006、2011年上市的大唐發電和中國水電IPO時相關數據進行驗證,計算得到表3。
可以看到對于大唐發電,其判別函數最大值為-23,IPO參考定價為5.99;對于中國水電,其判別函數最大值為-26,IPO參考定價為4.68。對照兩者實際上市價格6.68和4.5,發現利用本文方法給出的參考定價具有較強的參考價值。
5 結語
IPO定價是一項復雜的系統工程,聚類算法作為一種客觀的定量分析方法,具有規范性、科學性等特點,本文利用聚類算法對IPO定價進行了初步的量化討論分析,是數據挖掘技術在IPO定價中實際應用的有益嘗試,對于指導新股定價改革具有一定的借鑒意義。
參考文獻
[1] Jiawei Han,Micheline Kamber,范明,孟小峰.數據挖掘:概念與技術(第1版)[M].機械工業出版社,2002.
[2] 龍真真,張策,劉飛裔,張正文.一種改進的Chameleon算法[J].計算機工程,2009,35,(20).
[3] E.F.Fama and K.R.French.The cross-sectionof expected stock returns.Journal of Finance,1992,47:427-465.
[4] Newman M E J, Girvan M.Finding and evaluatingcommunity structure in networks.Phys.Rev.E,2004,69:026113
[5] R.S.Burt,Positions in networks[J].Social Forces55,93-122(1976)
[6] 王雙成,苑森淼,王輝.基于類約束的貝葉斯網絡分類器學習[J].小型微型計算機系統,2004,25(6):969-971.
作者簡介:王華(1978—),女,河北人,新時代證券有限責任公司資深投資經理,北京大學經濟學院學生,研究方向:投資學與資本市場。
摘要:IPO定價一直是理論界和實務界爭相討論的熱點話題,以往構建于單一指標的估值方法誤差較大,怎樣采用合適的辦法對IPO定價相關指標進行量化分析是一個難題。文章對研究對象數據采用主成因分析法對影響IPO定價的有關指標矩陣數據進行預處理,再采用改進的Chameleon算法進行聚類分析,最后對待分析的新上市股票進行貝葉斯分類,從而實現其定價的指導。實驗證明,該方法能夠比較客觀、科學的對IPO定價進行調整指導,具有一定的實際意義。
關鍵詞:聚類算法;改進Chameleon算法;IPO定價
中圖分類號:F803 文獻標識碼:A 文章編號:1009-2374(2014)04-0029-03
在第四次新股發行體制改革穩步推進的大背景下,IPO定價理論研究近期得到了廣泛關注,傳統的IPO估值辦法由基于資產的估值方法、現值估價方法、可比公司法、實物期權估價法等,但采用少數單一指標比對的估值辦法難免有失偏頗,而多指標估值法因指標間的復雜關系,采用人工或某些簡單的基數對比算法難以厘清各種指標間的關系,實用性受到極大影響。聚類算法作為可行、高效、客觀的計算機自動處理劃分技術在信息處理領域得到了廣泛應用。現有的聚類算法主要有:劃分法、密度法、網格法等,這些算法大都存在初始參數需要人工給定,分類過程需要人工調整干預的缺陷,影響了算聚類的無監督性和客觀性。
本文的思路是在回歸分析的基礎上,遴選變量作為聚類指標,再利用改進的Chameleon算法進行聚類分析并得到一組分類判別函數,最終實現對IPO的定價調整。實驗證明,該算法具有無監督和泛化能力強的
特點。
1 數據預處理
如表1所示,每一個對IPO定價具有影響的分指標的量綱和數量級都不同,未消除不同指標間的差別,同時考慮到分類器收斂的需要,采用適當調整過的主成分分析法(PCA)對數據進行降維預處理。具體步驟為:(1)對原始數據進行預處理,剔除大于95%分位的和小于95%分位的極端數據;(2)再對處理后的數據用平均值法進行處理;(3)計算協方差矩陣;(4)計算矩陣的特征根和特征向量,由此得到各成分的方差貢獻率及累計方差貢獻率;(5)依據累計方差貢獻率大小依次排列,取前t個為主成分。
3 具體流程
挑選具有一定代表性的股票樣本數據,按照表1列出因素矩陣,并利用調整過的主成分分析法對數據進行預處理確定t個主成分;選定某行業作為分析范圍,利用改進Chameleon算法對相關行業股票數據進行聚類分析;(1)利用預處理后的矩陣計算得到加權圖;(2)假設初始加權圖分為n個獨立的簇,然后每次選取結構等價相似度小的兩個簇進行合并,并計算模塊度;(3)模塊度達到最大時停止計算,此時的劃分結果即為聚類
結果。
計算不同類別的費氏線性判別函數,將待分析的新上市股票定價因素值帶入求得函數值,依據最大值判定分類歸屬,并依此進行最終定價分析。
4 實驗及其結果
選取1993年4月至2005年2月期間我國滬深市場所發行36只電力板塊IPO股票為樣本,依靠各自上市時的財務數據,進行數據預處理,設定累計方差貢獻率閾值為85%,求得主成分為:每股凈資產(POE),市盈率(PE),區域(A),主營業務利潤率(PR),發行股數(QN)共5項,利用本文給出的改進的Chameleon算法進行聚類分析,其分析過程如圖1所示,當Q的最大值為0.54時,37支股票被劃分為3類。
運用判別函數時,將帶判別股票的各指標數據分別代入3個判別函數中,每個樣本點對應的3個函數的值進行比較,其中,函數值最大的那個是第幾個函數,則該股票就歸為第幾類,由此可以得出IPO定價的參考值。
下面分別采用2006、2011年上市的大唐發電和中國水電IPO時相關數據進行驗證,計算得到表3。
可以看到對于大唐發電,其判別函數最大值為-23,IPO參考定價為5.99;對于中國水電,其判別函數最大值為-26,IPO參考定價為4.68。對照兩者實際上市價格6.68和4.5,發現利用本文方法給出的參考定價具有較強的參考價值。
5 結語
IPO定價是一項復雜的系統工程,聚類算法作為一種客觀的定量分析方法,具有規范性、科學性等特點,本文利用聚類算法對IPO定價進行了初步的量化討論分析,是數據挖掘技術在IPO定價中實際應用的有益嘗試,對于指導新股定價改革具有一定的借鑒意義。
參考文獻
[1] Jiawei Han,Micheline Kamber,范明,孟小峰.數據挖掘:概念與技術(第1版)[M].機械工業出版社,2002.
[2] 龍真真,張策,劉飛裔,張正文.一種改進的Chameleon算法[J].計算機工程,2009,35,(20).
[3] E.F.Fama and K.R.French.The cross-sectionof expected stock returns.Journal of Finance,1992,47:427-465.
[4] Newman M E J, Girvan M.Finding and evaluatingcommunity structure in networks.Phys.Rev.E,2004,69:026113
[5] R.S.Burt,Positions in networks[J].Social Forces55,93-122(1976)
[6] 王雙成,苑森淼,王輝.基于類約束的貝葉斯網絡分類器學習[J].小型微型計算機系統,2004,25(6):969-971.
作者簡介:王華(1978—),女,河北人,新時代證券有限責任公司資深投資經理,北京大學經濟學院學生,研究方向:投資學與資本市場。
摘要:IPO定價一直是理論界和實務界爭相討論的熱點話題,以往構建于單一指標的估值方法誤差較大,怎樣采用合適的辦法對IPO定價相關指標進行量化分析是一個難題。文章對研究對象數據采用主成因分析法對影響IPO定價的有關指標矩陣數據進行預處理,再采用改進的Chameleon算法進行聚類分析,最后對待分析的新上市股票進行貝葉斯分類,從而實現其定價的指導。實驗證明,該方法能夠比較客觀、科學的對IPO定價進行調整指導,具有一定的實際意義。
關鍵詞:聚類算法;改進Chameleon算法;IPO定價
中圖分類號:F803 文獻標識碼:A 文章編號:1009-2374(2014)04-0029-03
在第四次新股發行體制改革穩步推進的大背景下,IPO定價理論研究近期得到了廣泛關注,傳統的IPO估值辦法由基于資產的估值方法、現值估價方法、可比公司法、實物期權估價法等,但采用少數單一指標比對的估值辦法難免有失偏頗,而多指標估值法因指標間的復雜關系,采用人工或某些簡單的基數對比算法難以厘清各種指標間的關系,實用性受到極大影響。聚類算法作為可行、高效、客觀的計算機自動處理劃分技術在信息處理領域得到了廣泛應用。現有的聚類算法主要有:劃分法、密度法、網格法等,這些算法大都存在初始參數需要人工給定,分類過程需要人工調整干預的缺陷,影響了算聚類的無監督性和客觀性。
本文的思路是在回歸分析的基礎上,遴選變量作為聚類指標,再利用改進的Chameleon算法進行聚類分析并得到一組分類判別函數,最終實現對IPO的定價調整。實驗證明,該算法具有無監督和泛化能力強的
特點。
1 數據預處理
如表1所示,每一個對IPO定價具有影響的分指標的量綱和數量級都不同,未消除不同指標間的差別,同時考慮到分類器收斂的需要,采用適當調整過的主成分分析法(PCA)對數據進行降維預處理。具體步驟為:(1)對原始數據進行預處理,剔除大于95%分位的和小于95%分位的極端數據;(2)再對處理后的數據用平均值法進行處理;(3)計算協方差矩陣;(4)計算矩陣的特征根和特征向量,由此得到各成分的方差貢獻率及累計方差貢獻率;(5)依據累計方差貢獻率大小依次排列,取前t個為主成分。
3 具體流程
挑選具有一定代表性的股票樣本數據,按照表1列出因素矩陣,并利用調整過的主成分分析法對數據進行預處理確定t個主成分;選定某行業作為分析范圍,利用改進Chameleon算法對相關行業股票數據進行聚類分析;(1)利用預處理后的矩陣計算得到加權圖;(2)假設初始加權圖分為n個獨立的簇,然后每次選取結構等價相似度小的兩個簇進行合并,并計算模塊度;(3)模塊度達到最大時停止計算,此時的劃分結果即為聚類
結果。
計算不同類別的費氏線性判別函數,將待分析的新上市股票定價因素值帶入求得函數值,依據最大值判定分類歸屬,并依此進行最終定價分析。
4 實驗及其結果
選取1993年4月至2005年2月期間我國滬深市場所發行36只電力板塊IPO股票為樣本,依靠各自上市時的財務數據,進行數據預處理,設定累計方差貢獻率閾值為85%,求得主成分為:每股凈資產(POE),市盈率(PE),區域(A),主營業務利潤率(PR),發行股數(QN)共5項,利用本文給出的改進的Chameleon算法進行聚類分析,其分析過程如圖1所示,當Q的最大值為0.54時,37支股票被劃分為3類。
運用判別函數時,將帶判別股票的各指標數據分別代入3個判別函數中,每個樣本點對應的3個函數的值進行比較,其中,函數值最大的那個是第幾個函數,則該股票就歸為第幾類,由此可以得出IPO定價的參考值。
下面分別采用2006、2011年上市的大唐發電和中國水電IPO時相關數據進行驗證,計算得到表3。
可以看到對于大唐發電,其判別函數最大值為-23,IPO參考定價為5.99;對于中國水電,其判別函數最大值為-26,IPO參考定價為4.68。對照兩者實際上市價格6.68和4.5,發現利用本文方法給出的參考定價具有較強的參考價值。
5 結語
IPO定價是一項復雜的系統工程,聚類算法作為一種客觀的定量分析方法,具有規范性、科學性等特點,本文利用聚類算法對IPO定價進行了初步的量化討論分析,是數據挖掘技術在IPO定價中實際應用的有益嘗試,對于指導新股定價改革具有一定的借鑒意義。
參考文獻
[1] Jiawei Han,Micheline Kamber,范明,孟小峰.數據挖掘:概念與技術(第1版)[M].機械工業出版社,2002.
[2] 龍真真,張策,劉飛裔,張正文.一種改進的Chameleon算法[J].計算機工程,2009,35,(20).
[3] E.F.Fama and K.R.French.The cross-sectionof expected stock returns.Journal of Finance,1992,47:427-465.
[4] Newman M E J, Girvan M.Finding and evaluatingcommunity structure in networks.Phys.Rev.E,2004,69:026113
[5] R.S.Burt,Positions in networks[J].Social Forces55,93-122(1976)
[6] 王雙成,苑森淼,王輝.基于類約束的貝葉斯網絡分類器學習[J].小型微型計算機系統,2004,25(6):969-971.
作者簡介:王華(1978—),女,河北人,新時代證券有限責任公司資深投資經理,北京大學經濟學院學生,研究方向:投資學與資本市場。