周一維
國內(nèi)創(chuàng)新創(chuàng)業(yè)項(xiàng)目的分析與挖掘——基于36氪和虎嗅網(wǎng)的聚類分析
周一維
(同濟(jì)大學(xué) 經(jīng)濟(jì)與管理學(xué)部,上海 201804)
國務(wù)院總理李克強(qiáng)在十二屆全國人大四次會議上提出“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”。同樣,“互聯(lián)網(wǎng)+”和“大眾創(chuàng)業(yè)”的概念也正引領(lǐng)著創(chuàng)業(yè)新時(shí)代。以36氪、虎嗅網(wǎng)等為代表的國內(nèi)知名互聯(lián)網(wǎng)創(chuàng)業(yè)生態(tài)服務(wù)平臺為創(chuàng)業(yè)者們提供了更多的創(chuàng)業(yè)機(jī)會。因此,基于36氪和虎嗅網(wǎng),試圖對其上的創(chuàng)業(yè)項(xiàng)目進(jìn)行數(shù)據(jù)挖掘與分析,以探究現(xiàn)有創(chuàng)業(yè)項(xiàng)目的特征以及成功融資項(xiàng)目和失敗項(xiàng)目各自的特征,以幫助創(chuàng)業(yè)者更清晰地了解目前的創(chuàng)業(yè)環(huán)境和流行趨勢,結(jié)合自身優(yōu)勢與投資人偏好,投身于合適的創(chuàng)業(yè)領(lǐng)域。
創(chuàng)業(yè);創(chuàng)新;Clementine;虎嗅網(wǎng)
截至2018-12,中國網(wǎng)民為8.29億,互聯(lián)網(wǎng)普及率達(dá)59.6%[1]。互聯(lián)網(wǎng)和移動(dòng)互聯(lián)技術(shù)的快速發(fā)展,給創(chuàng)業(yè)活動(dòng)提供了強(qiáng)大的技術(shù)支持,帶動(dòng)了相關(guān)產(chǎn)品服務(wù)、管理模式的革新,也形成了廣闊的消費(fèi)市場,創(chuàng)造了更多的機(jī)會。國務(wù)院總理李克強(qiáng)在十二屆全國人大四次會議記者會上提出:“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”[2]。2018-09-18,國務(wù)院下發(fā)《關(guān)于推動(dòng)創(chuàng)新創(chuàng)業(yè)高質(zhì)量發(fā)展打造“雙創(chuàng)”升級版的意見》[2]。而現(xiàn)在正在興起的“互聯(lián)網(wǎng)+”和“大眾創(chuàng)業(yè)”的概念推波助瀾,引領(lǐng)著一個(gè)創(chuàng)業(yè)新時(shí)代。國民創(chuàng)新創(chuàng)業(yè)能力已經(jīng)成為拉動(dòng)國民經(jīng)濟(jì)增長的重要元素,而國民自主創(chuàng)新創(chuàng)業(yè)能力逐漸受到各個(gè)國家的重視[3]。因此,本研究希望能對基于虎嗅網(wǎng)和36氪的所有創(chuàng)業(yè)項(xiàng)目進(jìn)行采集以及宏觀上的聚類分析,以求分析出目前兩網(wǎng)站上創(chuàng)業(yè)項(xiàng)目的發(fā)展情況以及分布特征,有助于創(chuàng)業(yè)者更好地了解創(chuàng)業(yè)環(huán)境與趨勢,做好創(chuàng)業(yè)準(zhǔn)備,提高創(chuàng)業(yè)成功率。
自18世紀(jì)法國經(jīng)濟(jì)學(xué)家CANTILLON第一次使用“entrepreneur”這個(gè)詞以來,創(chuàng)業(yè)研究開始嶄露頭角[4]。現(xiàn)有的創(chuàng)業(yè)研究不僅從宏觀層面上意識到創(chuàng)業(yè)、創(chuàng)新在經(jīng)濟(jì)活動(dòng)中的重要地位和作用,也重視微觀層面的創(chuàng)業(yè)者行為特征和創(chuàng)業(yè)本身特殊的運(yùn)行機(jī)理,并隨著時(shí)代背景的變遷和創(chuàng)業(yè)主體的變化涌現(xiàn)出許多新的研究主題。總的來說,現(xiàn)有研究主要關(guān)注以下幾個(gè)方面:創(chuàng)業(yè)網(wǎng)絡(luò)、創(chuàng)業(yè)資源、創(chuàng)業(yè)者、創(chuàng)業(yè)環(huán)境及創(chuàng)業(yè)機(jī)會[5]。從目前的文獻(xiàn)來看,宏微觀的創(chuàng)業(yè)研究還存在一些待完善的不足之處和有待彌補(bǔ)的空缺。從宏觀層面分析,創(chuàng)業(yè)研究只關(guān)注創(chuàng)業(yè)總體的行為效果,偏向從理論上分析創(chuàng)業(yè)促進(jìn)經(jīng)濟(jì)發(fā)展的本質(zhì)以及創(chuàng)業(yè)與宏觀環(huán)境之間的互動(dòng)關(guān)系,論證創(chuàng)業(yè)企業(yè)拉動(dòng)經(jīng)濟(jì)增長的力度,卻沒有深入細(xì)分創(chuàng)業(yè)企業(yè)類型,難以突出時(shí)代特征和識別創(chuàng)業(yè)類型的變化[3]。在微觀方面,管理學(xué)的分析方法有助于關(guān)注創(chuàng)業(yè)微觀個(gè)體,但很少比較不同類型創(chuàng)業(yè)企業(yè)之間的差異[4]。總的來說,目前的文獻(xiàn)較注重于理論研究,即使是跨學(xué)科的研究,也是基于各學(xué)科現(xiàn)有理論的研究,并沒有對創(chuàng)業(yè)的數(shù)據(jù)進(jìn)行定量與定性分析。實(shí)際上,基于數(shù)據(jù)的研究更能客觀地反映創(chuàng)業(yè)環(huán)境與現(xiàn)象,甚至發(fā)現(xiàn)一些不為人知的新規(guī)律。
本論文主要采用定量與定性分析相結(jié)合的研究方法。首先利用八爪魚采集器對虎嗅網(wǎng)和36氪網(wǎng)兩個(gè)網(wǎng)站的創(chuàng)業(yè)項(xiàng)目進(jìn)行采集,然后利用Excel對采集到的數(shù)據(jù)進(jìn)行清理,最后利用Clementine建立模型對結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,挖掘其隱藏的更深層次的信息[6],以求根據(jù)聚類結(jié)果探究現(xiàn)有創(chuàng)業(yè)項(xiàng)目的特征以及成功融資項(xiàng)目和失敗項(xiàng)目各自的特征。本次采集時(shí)間截至2019-11-19,共采集到1 487條數(shù)據(jù),數(shù)據(jù)字段主要是關(guān)于產(chǎn)品、公司以及創(chuàng)始人的信息,具體的分析過程與結(jié)果如下所述。
導(dǎo)入數(shù)據(jù)后連接Data Audit節(jié)點(diǎn)對數(shù)據(jù)的完整性以及異常值進(jìn)行分析,并利用CRT算法對缺失值(空值)進(jìn)行填補(bǔ)。連接K-means和TwoStep兩節(jié)點(diǎn)分別建立聚類模型,對最終的聚類結(jié)果進(jìn)行分析,選擇出最佳的聚類結(jié)果[8];連接Select節(jié)點(diǎn)將數(shù)據(jù)分為融資成功和融資失敗兩部分,使用K-means和TwoStep兩種方式分別建模,并對最終的聚類結(jié)果進(jìn)行分析,選擇出最佳的聚類結(jié)果[9]。具體的建模流程如圖1所示。

圖1 建模數(shù)據(jù)流圖
對聚類結(jié)果進(jìn)行分析后發(fā)現(xiàn)K-means的聚類效果好于TwoStep,因此選擇分析K-means的聚類結(jié)果[10]。所有創(chuàng)業(yè)項(xiàng)目類型如下:①各地新興的孵化期微型企業(yè)項(xiàng)目;②各地早期成立有新產(chǎn)品的初創(chuàng)期小型企業(yè)項(xiàng)目;③各地早期成立的較大型成熟企業(yè)項(xiàng)目;④華南華東地區(qū)早期較成熟的各類企業(yè)項(xiàng)目。
其中,未融資的創(chuàng)業(yè)項(xiàng)目類型如下:①各地新興的微型企業(yè)項(xiàng)目;②華南早期成立的較大型企業(yè)項(xiàng)目;③華東地區(qū)一兩年前成立的中小型企業(yè)項(xiàng)目;④各地一兩年前成立的小型企業(yè)項(xiàng)目。
相反,融資成功的創(chuàng)業(yè)項(xiàng)目類型如下:①華北新興的小微型企業(yè)項(xiàng)目;②各地早期小型企業(yè)項(xiàng)目;③華東地區(qū)早期成立有新產(chǎn)品的各類型企業(yè)項(xiàng)目;④華南華東早期成立的較大型企業(yè)項(xiàng)目。
經(jīng)過上述分析不難發(fā)現(xiàn),地區(qū)與成立時(shí)間對融資成功與否影響較大,有趣的是兩類創(chuàng)業(yè)項(xiàng)目里都有“華南華東早期成立的較大型企業(yè)項(xiàng)目”這一子類,說明機(jī)會是均等、公平的,因此,創(chuàng)業(yè)公司自身產(chǎn)品的實(shí)力也很關(guān)鍵。中型以及大型企業(yè)更有可能得到融資,且較大型有一定資歷(成立時(shí)間)尤其是來自北京、杭州、南京的公司創(chuàng)業(yè)項(xiàng)目更易得到更高輪次的融資。創(chuàng)業(yè)是一個(gè)長時(shí)間持續(xù)的過程,從未融資到Pre-A再到最后的D輪,耗時(shí)幾年之久,本文做的分析只是對一個(gè)時(shí)間點(diǎn)的初步分析,如果能對這些數(shù)據(jù)進(jìn)行跟蹤,分析這些項(xiàng)目的整個(gè)創(chuàng)業(yè)過程將會得到更加有意義、系統(tǒng)的分析結(jié)果。
[1]中國電信網(wǎng).CNNIC:2019年第43次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[EB/OL].[2018-02-28].http://www.cac.gov.cn/2019-02/28/c_1124175686.htm.
[2]中華人民共和國國務(wù)院.國務(wù)院關(guān)于推動(dòng)創(chuàng)新創(chuàng)業(yè)高質(zhì)量發(fā)展打造“雙創(chuàng)”升級版的意見[EB/OL].[2018- 09-26].http://www.gov.cn/zhengce/content/2018-09/26/content_5325472.htm.
[3]張茉楠.國際創(chuàng)新創(chuàng)業(yè)發(fā)展戰(zhàn)略新趨勢及啟示[J].宏觀經(jīng)濟(jì)管理,2016(1):87-90.
[4]陳震紅,董俊武.國外創(chuàng)業(yè)研究的歷程、動(dòng)態(tài)與新趨勢[J].外國經(jīng)濟(jì)與管理,2004(2):7-11.
[5]WU A,LI S.New ventures,product innovation and business intermediaries:empirical analyses of 145 new Chinese ventures[J].Chinese Management Studies,2014,8(2):241-257.
[6]張帆.基于Clementine的廣告客戶數(shù)據(jù)挖掘模型設(shè)計(jì)[D].北京:北京郵電大學(xué),2010.
[7]ARUN R,XINL T,PAUL B,et al.Assimilation patterns in the use of electronic procurement innovations:A cluster analysis[J].Information & Management,43(3):336-349.
[8]黃震.數(shù)據(jù)挖掘在電信客戶流失預(yù)警中的應(yīng)用[D].北京:北京郵電大學(xué),2008.
[9]ZHANG Y,LI H.Innovation search of new ventures in a technology cluster:the role of ties with service intermediaries[J].Strategic Management Journal,2010,31(1):88-109.
[10]BOCQUET R,BRION S,MOTHE C et al. The role of cluster intermediaries for KIBS’resources and innovation[J]. Journal of Small Business Management,2016(54):256-277.
F124
A
10.15913/j.cnki.kjycx.2020.02.032
2095-6835(2020)02-0090-02
周一維(1995—),女,重慶人,碩士研究生,研究方向?yàn)樾畔⑾到y(tǒng)用戶使用行為、商業(yè)數(shù)據(jù)挖掘與分析。
〔編輯:張思楠〕