999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Web挖掘的新股破發(fā)原因探究及預(yù)測*

2015-10-20 02:39:12張穎瑩李艷紅上海財經(jīng)大學(xué)信息管理與工程學(xué)院上海200433上海市金融信息技術(shù)研究重點實驗室上海財經(jīng)大學(xué)上海200433
關(guān)鍵詞:情緒模型

張穎瑩,李艷紅(1.上海財經(jīng)大學(xué) 信息管理與工程學(xué)院,上海 200433;2.上海市金融信息技術(shù)研究重點實驗室(上海財經(jīng)大學(xué)),上海 200433)

基于Web挖掘的新股破發(fā)原因探究及預(yù)測*

張穎瑩1,2,李艷紅1,2
(1.上海財經(jīng)大學(xué)信息管理與工程學(xué)院,上海200433;2.上海市金融信息技術(shù)研究重點實驗室(上海財經(jīng)大學(xué)),上海200433)

近年來我國創(chuàng)業(yè)板股市頻繁出現(xiàn)新股破發(fā)現(xiàn)象,暴露出創(chuàng)業(yè)板市場存在的風(fēng)險問題。基于行為金融學(xué)及有限注意力理論,運用Web挖掘手段和機(jī)器學(xué)習(xí)算法分析股票論壇投資者的文本評論和搜索行為,建立投資者情緒和投資者關(guān)注指數(shù),對創(chuàng)業(yè)板新股破發(fā)進(jìn)行定量化實證研究。結(jié)果表明,除了市場指標(biāo)、發(fā)行指標(biāo)、機(jī)構(gòu)參與指標(biāo)和財務(wù)指標(biāo),從股票論壇和搜索引擎獲取的投資者情緒和關(guān)注也是影響創(chuàng)業(yè)板股票破發(fā)的重要因素,據(jù)此建立的新股破發(fā)預(yù)測模型平均準(zhǔn)確率達(dá)90%。

Web挖掘;新股破發(fā);機(jī)器學(xué)習(xí);支持向量機(jī);樸素貝葉斯

0 引言

創(chuàng)業(yè)板市場是專門為創(chuàng)業(yè)型企業(yè)融資上市的市場,與主板市場相比,門檻低、風(fēng)險高。近年來,創(chuàng)業(yè)板迎來大面積新股破發(fā)的窘境,即新股的上市首日收盤價低于其發(fā)行價。破發(fā)的損失全部由廣大的投資者承擔(dān),打擊二級市場投資者的信心,不利于新股流通;降低保薦人和承銷商信譽(yù)度和業(yè)務(wù)量;影響發(fā)行公司信譽(yù),不利于其再融資。探究創(chuàng)業(yè)板新股破發(fā)成因并對其進(jìn)行預(yù)測具有重大意義。

以往對新股破發(fā)問題的研究主要從傳統(tǒng)的財務(wù)指標(biāo)和上市公司基本信息出發(fā),未能全面地解釋這一現(xiàn)象。互聯(lián)網(wǎng)上關(guān)于上市公司和股民觀點的大數(shù)據(jù)為探究新股破發(fā)成因帶來了新的思路。本文基于行為金融學(xué)和有限注意力理論,利用Web挖掘技術(shù)和機(jī)器學(xué)習(xí)算法,從股票論壇和搜索引擎爬取數(shù)據(jù)進(jìn)行文本挖掘和情感分析。將建立的投資者情緒和關(guān)注指標(biāo)與傳統(tǒng)的金融學(xué)指標(biāo)相結(jié)合,全面探究創(chuàng)業(yè)板股票破發(fā)成因,建立預(yù)測模型。本文研究框架如圖1所示。實證表明,預(yù)測模型準(zhǔn)確率達(dá)到90%以上,可用于對創(chuàng)業(yè)板股票市場行情的早期研判,有助于監(jiān)管部門提早采取引導(dǎo)措施,避免新股破發(fā)帶來的危害,推動創(chuàng)業(yè)板以及整個證券市場的協(xié)調(diào)發(fā)展。

1 國內(nèi)外相關(guān)研究現(xiàn)狀

對新股破發(fā)的影響因素,蔡春華認(rèn)為影響破發(fā)最主要的3個因素是每股收益、發(fā)行價格和日換手率[1]。肖奇定性地從發(fā)行公司、政府、承銷商和投資者4個維度去探究新股破發(fā)的原因[2]。

在文本挖掘技術(shù)興起之前,對于投資者情緒的度量主要是使用金融市場中其他數(shù)據(jù)計算得到的間接代表投資者情感的指標(biāo),魯訓(xùn)法選用“每周新開交易賬戶數(shù)”作為反映投資者情緒變化的代理指標(biāo)[3]。

圖1 本文研究框架

有限注意力理論認(rèn)為存在注意力配置的問題,投資者關(guān)注確實會影響其對信息的反應(yīng),進(jìn)而影響決策。WYSOCKI P D發(fā)現(xiàn)發(fā)帖量能夠預(yù)測第二天的交易量與異常收益率[4]。

2 影響創(chuàng)業(yè)板新股破發(fā)的指標(biāo)體系建立

本文把市場因素、上市指標(biāo)、機(jī)構(gòu)參與情況以及公司財務(wù)狀況與投資者情緒和關(guān)注相結(jié)合,建立起表1所示的指標(biāo)體系。

表1 指標(biāo)體系

3 投資者情緒和投資者關(guān)注指標(biāo)計算

3.1投資者情緒指數(shù)計算

本文以東方財富股吧作為數(shù)據(jù)源,爬取45支作為樣本的創(chuàng)業(yè)板個股上市前后10天的帖子共61 921條,并從中抽取了2 000條進(jìn)行“積極”、“消極”和“中性”的人工情感標(biāo)注。用查全率和查準(zhǔn)率的綜合值f1來比較樸素貝葉斯(NB)和線性支持向量機(jī)(LinearSVC)等分類算法的效率,結(jié)果如圖2所示。最終確定1 500的特征維度下的支持向量機(jī)法作為最佳分類器。

3.1.1樂觀情緒指數(shù)

樂觀情緒指數(shù)計算公式為:

圖3 分類器準(zhǔn)確率

3.1.2意見分歧指數(shù)

情緒的方差計算公式如下:

意見分歧指標(biāo)可表示為:

3.2投資者關(guān)注指標(biāo)計算

股票論壇某日發(fā)帖量可作為投資者關(guān)注的衡量指標(biāo),而搜索引擎也是中小投資者獲取信息的主要網(wǎng)絡(luò)渠道。百度在中國平均市場份額遠(yuǎn)超其他搜索引擎,故選擇百度指數(shù)作為數(shù)據(jù)源。對每支個股都將股票名稱和股票代碼搜索強(qiáng)度加總來描述該股的綜合搜索強(qiáng)度。

4 創(chuàng)業(yè)板新股破發(fā)成因?qū)嵶C分析

4.1樣本個股選取及時間范圍確定

本文按照與當(dāng)年上市的創(chuàng)業(yè)板新股總量成比例的原則選取了2011年1月25到2014年1月23日之間上市的45支創(chuàng)業(yè)板個股。

以股票的首發(fā)抑價率作為因變量來衡量創(chuàng)業(yè)板新股上市當(dāng)日的破發(fā)程度,抑價率越高,破發(fā)的程度越低,計算公式如下:

4.2多元線性回歸

4.2.1OLS多元線性回歸和多重共線性檢驗

根據(jù)指標(biāo)體系建立多元逐步線性回歸模型,消除模型的共線性和異方差性后,結(jié)果如表2所示。

4.2.2多元線性回歸結(jié)論

創(chuàng)業(yè)板指數(shù)代表的市場行情與新股抑價率成正比,說明市場行情好的時候股票不容易破發(fā)。而在發(fā)行指標(biāo)中,市盈率、首發(fā)募集資金以及超募資金均與抑價率成反比,這體現(xiàn)了創(chuàng)業(yè)板新股“三高”問題是導(dǎo)致創(chuàng)業(yè)板破發(fā)的重要原因。限售股的比例與首發(fā)抑價率成正比,說明較高的機(jī)構(gòu)參與度往往可以降低股票的破發(fā)概率且影響力較大。此外公司本身的盈利情況和資產(chǎn)構(gòu)成也會影響其是否破發(fā)。可以發(fā)現(xiàn)網(wǎng)絡(luò)變量是影響創(chuàng)業(yè)板破發(fā)的重要因素,首發(fā)前5~10天投資者越樂觀和關(guān)注度越高,股票破發(fā)的概率越小。而首發(fā)之后的5~10天投資者的情緒和關(guān)注對破發(fā)的影響大大降低,可能是這段時間內(nèi)投資者并沒有獲得更多的新消息。直到上市當(dāng)天,投資者情緒和關(guān)注又會對首發(fā)抑價率產(chǎn)生正向影響。當(dāng)投資者意見存在分歧時,市場的投機(jī)氛圍弱,股票破發(fā)的風(fēng)險也會降低。

表2 多元逐步回歸結(jié)果

5 新股破發(fā)預(yù)測模型

線性回歸模型中的顯著變量作為特征,以45只個股作為訓(xùn)練集,并以另外20只新股作為測試集,分別以支持向量機(jī)(SVM)和樸素貝葉斯(NB)模型建立分類預(yù)測模型。采用十折交叉檢驗的方法,用查全率和查準(zhǔn)率的綜合值f1作為評價模型準(zhǔn)確率的指標(biāo)。將預(yù)測模型與只用傳統(tǒng)金融學(xué)指標(biāo)作為特征建立的分類模型進(jìn)行對比,結(jié)果如表3所示。

表3 破發(fā)預(yù)測模型準(zhǔn)確率對比 (單位:%)

6 結(jié)論

實證研究中模型擬合優(yōu)度達(dá)到93%,很好地解釋了創(chuàng)業(yè)板股票破發(fā)的成因。市場指標(biāo)、發(fā)行指標(biāo)、機(jī)構(gòu)參與指標(biāo)、財務(wù)指標(biāo)、投資者情緒和關(guān)注都是創(chuàng)業(yè)板破發(fā)的重要影響因素。據(jù)此建立的新股破發(fā)預(yù)測模型較傳統(tǒng)預(yù)測模型準(zhǔn)確率從60%提升到90%以上。投資者情緒和關(guān)注本身是多因素的綜合反映,從這兩點入手來研究創(chuàng)業(yè)板股票破發(fā)問題,開辟了這一問題研究的新視角。

考慮了網(wǎng)絡(luò)信息后模型擬合優(yōu)度從57%提升到了93%,說明從網(wǎng)絡(luò)信息中獲取的投資者情緒和關(guān)注是影響創(chuàng)業(yè)板股票破發(fā)的重要因素。基于Web挖掘的預(yù)測模型準(zhǔn)確率超過90%,可為投資者決策提供參考,減少損失。

根據(jù)實證結(jié)論給監(jiān)管部門的建議如下:(1)創(chuàng)業(yè)板新股“三高”問題是導(dǎo)致創(chuàng)業(yè)板破發(fā)的重要原因,要完善創(chuàng)業(yè)板股票的發(fā)行和定價機(jī)制,增加獨立中介機(jī)構(gòu)的詢價權(quán)限,防止機(jī)構(gòu)為了自身利益報價過高;(2)創(chuàng)業(yè)板公司需強(qiáng)化信息披露,防止惡意隱瞞其財務(wù)和重要信息;(3)網(wǎng)絡(luò)已經(jīng)成為股市輿情的重要發(fā)源地,有關(guān)部門應(yīng)完善對論壇、搜索引擎等網(wǎng)絡(luò)平臺的監(jiān)管,加強(qiáng)投資者教育,引導(dǎo)情緒,促進(jìn)其理性投資。

[1]蔡春華.中國創(chuàng)業(yè)板上市公司破發(fā)影響因素實證分析[J].現(xiàn)代商業(yè),2013(8):43-44.

[2]肖奇.我國創(chuàng)業(yè)板新股破發(fā)原因探究[D].成都:西南財經(jīng)大學(xué),2012.

[3]魯訓(xùn)法,黎建強(qiáng).中國股市指數(shù)與投資者情緒指數(shù)的相互關(guān)系[J].系統(tǒng)工程理論與實踐,2012(3):621-629.

[4]WYSOCKI P D.Cheap talk on the Web:the determinants of postings on stock message boards[J].University of Michigan Business School Working Paper,1998(98025).

Study on the reason and prediction for IPO underpricing in Chinese GEM based on Web mining technique

Zhang Yingying1,2,Li Yanhong1,2
(1.Department of Information Management and Engineering,Shanghai University of Finance and Economics,Shanghai 200433,China;2.Shanghai Key Laboratory of Financial Information Technology,Shanghai 200433,China)

In recent years,lots of new shares in GEM break on the first trading day,which shows the inefficiency of the IPO pricing in GEM.Based on behavioral finance and limited attention theory,we analyze investors′online review and search queries with Web mining technique,then do empirical study on the determinants for IPO pricing in Chinese GEM from the perspective of investors′sentiment and attention.The result shows that apart from traditional financial factors,investors′sentiment and attention indexes are also important factors influencing IPO underpricing.The accuracy of the prediction model reaches 90%.

Web mining;IPO underpricing;machine learning;support vector machine(SVM);na?ve Bayes(NB)

TP399

A

1674-7720(2015)10-0058-03

2015-01-18)

張穎瑩(1993-),通信作者,女,碩士研究生,主要研究方向:數(shù)據(jù)挖掘。E-mail:fjzhzhyy@163.com。

李艷紅(1974-),女,博士,副教授,主要研究方向:軟件工程。

猜你喜歡
情緒模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
小情緒
小情緒
小情緒
小情緒
小情緒
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 色哟哟国产精品一区二区| 中字无码精油按摩中出视频| 国产一区二区丝袜高跟鞋| 亚洲va在线观看| 欧美成人午夜视频| 精品视频福利| 日韩在线播放中文字幕| 伊人久久精品无码麻豆精品| 国产午夜小视频| 日本高清免费一本在线观看| 亚洲欧美另类中文字幕| 久久久久人妻一区精品| 欧美翘臀一区二区三区| 日韩福利在线观看| 国产69囗曝护士吞精在线视频| 免费国产黄线在线观看| 日本少妇又色又爽又高潮| 亚洲中文字幕久久精品无码一区| 欧美一级黄片一区2区| 2018日日摸夜夜添狠狠躁| 国产区精品高清在线观看| 成年网址网站在线观看| 亚洲中文字幕久久精品无码一区 | 少妇被粗大的猛烈进出免费视频| 91久久青青草原精品国产| 国产精品太粉嫩高中在线观看| 老司机久久99久久精品播放| 日韩一区二区三免费高清| 国产一区二区三区精品久久呦| 国产真实乱人视频| 欧美高清国产| 亚洲综合中文字幕国产精品欧美 | 午夜老司机永久免费看片| 国产91小视频| 成人午夜天| 日本一区二区三区精品国产| 人妻出轨无码中文一区二区| 国产亚洲欧美在线人成aaaa| 亚洲成人动漫在线| 伊人91在线| 色噜噜综合网| 波多野结衣无码中文字幕在线观看一区二区 | 国产亚洲精品97在线观看 | 国产视频一二三区| 亚洲精品第一页不卡| 高清码无在线看| 国产极品美女在线播放| 成人午夜久久| 久久久精品久久久久三级| 凹凸国产熟女精品视频| 中文字幕日韩久久综合影院| a级毛片一区二区免费视频| 欧美综合在线观看| 精品91自产拍在线| 久久频这里精品99香蕉久网址| 亚洲国产天堂久久综合| 亚洲 成人国产| 亚洲丝袜第一页| 国产成人精品高清不卡在线| 四虎综合网| 国产男女XX00免费观看| 国产永久无码观看在线| 国产在线拍偷自揄拍精品| 国产视频自拍一区| 日韩国产精品无码一区二区三区| 久久精品女人天堂aaa| 国产在线精品99一区不卡| 一级毛片在线播放| 在线免费a视频| 日韩无码黄色网站| 狠狠五月天中文字幕| 亚洲综合欧美在线一区在线播放| 一级爱做片免费观看久久| 国产精品免费露脸视频| 久久精品国产免费观看频道| 国产亚洲现在一区二区中文| 91精品啪在线观看国产60岁| 色偷偷一区| 国产在线观看精品| 国产一国产一有一级毛片视频| 国产黑人在线| 婷婷五月在线视频|