999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于創(chuàng)業(yè)者信息挖掘的創(chuàng)業(yè)成功傾向分析

2017-06-01 12:20:16黃燕黃慧穎汪瑞嶸丁志剛
微型電腦應(yīng)用 2017年5期
關(guān)鍵詞:關(guān)聯(lián)分析信息

黃燕, 黃慧穎, 汪瑞嶸, 丁志剛

(上海計(jì)算機(jī)軟件技術(shù)開發(fā)中心,上海 201112)

基于創(chuàng)業(yè)者信息挖掘的創(chuàng)業(yè)成功傾向分析

黃燕1, 黃慧穎2, 汪瑞嶸3, 丁志剛4

(上海計(jì)算機(jī)軟件技術(shù)開發(fā)中心,上海 201112)

在創(chuàng)新創(chuàng)業(yè)大環(huán)境下,為了幫助創(chuàng)業(yè)服務(wù)機(jī)構(gòu)更準(zhǔn)確地識(shí)別具有成功傾向的創(chuàng)業(yè)項(xiàng)目,探討了用數(shù)據(jù)挖掘這種自動(dòng)化方法對(duì)創(chuàng)業(yè)者的信息進(jìn)行分析,從而提供指導(dǎo)與建議。對(duì)Apriori算法和ID3決策樹算法進(jìn)行研究,并根據(jù)創(chuàng)業(yè)成功預(yù)測(cè)這一特殊目標(biāo),對(duì)Aprior算法進(jìn)行了改進(jìn),提出了一種創(chuàng)業(yè)成功傾向預(yù)測(cè)分析模型,為對(duì)創(chuàng)業(yè)者進(jìn)行客觀的、可定量信息評(píng)估提供了依據(jù)。

創(chuàng)業(yè)成功; 挖掘; Apriori; 決策樹

0 引言

近年來,隨著全面深化改革、繼續(xù)擴(kuò)大開放和創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略的實(shí)施,我國迎來了世界科技創(chuàng)新格局調(diào)整時(shí)期,在960萬平方公里土地上掀起了“大眾創(chuàng)業(yè)”、“萬眾創(chuàng)新”的新浪潮。在這創(chuàng)新創(chuàng)業(yè)大環(huán)境下,一批類似創(chuàng)客空間、創(chuàng)業(yè)咖啡、創(chuàng)新工場(chǎng)等形式的創(chuàng)新創(chuàng)業(yè)服務(wù)載體應(yīng)運(yùn)而生,旨在通過提供環(huán)境支持、技術(shù)支撐、政策引導(dǎo)、資源對(duì)接等方面的服務(wù),助力創(chuàng)業(yè)者成功創(chuàng)業(yè)。但面對(duì)各種需求不同、層次不齊的創(chuàng)業(yè)者,如何挖掘有潛力的、可能成功的創(chuàng)業(yè)者,成為創(chuàng)業(yè)服務(wù)機(jī)構(gòu)十分關(guān)注的問題。

對(duì)于創(chuàng)業(yè)扶持和投資對(duì)象的選擇,國內(nèi)外都有不同的選擇模式。美國愛荷華大學(xué)學(xué)生創(chuàng)業(yè)孵化器主要通過挖掘?qū)W校實(shí)驗(yàn)室的技術(shù)發(fā)明創(chuàng)新,配合概念試驗(yàn)和市場(chǎng)情報(bào)分析技術(shù)的可行性和市場(chǎng)成功潛力,以此選拔扶持的創(chuàng)業(yè)企業(yè)[1]。硅谷主要依靠斯坦福大學(xué)提供了智力、技術(shù)和人才諸多方面的強(qiáng)大支撐,尤其是全美首屈一指的斯坦福電子工程專業(yè)[2]。在國內(nèi),有的創(chuàng)業(yè)投資機(jī)構(gòu)通過考察項(xiàng)目的成長(zhǎng)性、技術(shù)含量、管理層的綜合素質(zhì)等因素,選擇創(chuàng)業(yè)項(xiàng)目進(jìn)行投資[3];有的通過創(chuàng)業(yè)大賽選拔優(yōu)秀的創(chuàng)業(yè)項(xiàng)目;有的主要考評(píng)創(chuàng)業(yè)者的智力資本和未來價(jià)值[4]。以上這些機(jī)構(gòu),主要憑借自身經(jīng)驗(yàn)以及對(duì)行業(yè)的預(yù)判進(jìn)行創(chuàng)業(yè)項(xiàng)目挑選,是一種基于主觀意念的評(píng)估方式,而本文將對(duì)創(chuàng)業(yè)者本身的信息進(jìn)行定量分析,以此作為創(chuàng)業(yè)項(xiàng)目主觀評(píng)估的補(bǔ)充。文章將基于應(yīng)用場(chǎng)景對(duì)Apriori算法進(jìn)行改進(jìn),并結(jié)合ID3決策樹算法,對(duì)創(chuàng)業(yè)者樣本信息進(jìn)行關(guān)聯(lián)分析和決策樹構(gòu)建,分析具有哪些特質(zhì)的創(chuàng)業(yè)者容易創(chuàng)業(yè)成功或創(chuàng)業(yè)失敗。

1 創(chuàng)業(yè)成功傾向預(yù)測(cè)流程及相關(guān)算法

1.1 整體流程

本文以某創(chuàng)業(yè)者公共實(shí)訓(xùn)基地采集的入駐創(chuàng)業(yè)者信息為樣本,經(jīng)過對(duì)數(shù)據(jù)進(jìn)行篩選、清洗、轉(zhuǎn)化等預(yù)處理,通過屬性與創(chuàng)業(yè)結(jié)果的關(guān)聯(lián)規(guī)則分析,建立決策樹預(yù)測(cè)模型,為新的創(chuàng)業(yè)者創(chuàng)業(yè)成功概率分析提供參考依據(jù),整個(gè)流程如圖1所示。

圖1 創(chuàng)業(yè)者成功傾向預(yù)測(cè)流程圖

由圖1可見,首先數(shù)據(jù)來源于基地入駐的創(chuàng)業(yè)者個(gè)人信息、創(chuàng)業(yè)團(tuán)隊(duì)信息以及創(chuàng)業(yè)的項(xiàng)目信息,通過創(chuàng)業(yè)信息采集系統(tǒng)進(jìn)行數(shù)據(jù)搜集。由于搜集獲得的數(shù)據(jù)存在干擾項(xiàng)、信息缺失、屬性取值連續(xù)等問題,需要經(jīng)過清理、整合、轉(zhuǎn)化等預(yù)處理才能進(jìn)行進(jìn)一步的分析。預(yù)處理后的數(shù)據(jù)需要進(jìn)行2個(gè)分析步驟:第一步是基于Apriori算法的關(guān)聯(lián)規(guī)則分析,通過關(guān)聯(lián)規(guī)則分析提取與創(chuàng)業(yè)成功與否之間存在強(qiáng)關(guān)聯(lián)關(guān)系的屬性,同時(shí)能對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的篩選,以提高模型構(gòu)建的準(zhǔn)確性;第二步是根據(jù)分析得到的關(guān)聯(lián)關(guān)系以及樣本庫構(gòu)建決策樹,得到的決策樹即是預(yù)測(cè)模型。對(duì)于新的創(chuàng)業(yè)者信息可以通過預(yù)測(cè)模型迅速得到創(chuàng)業(yè)成功與否的判斷,作為指導(dǎo)建議。當(dāng)然預(yù)測(cè)模型的優(yōu)劣與否取決于樣本的質(zhì)量,在數(shù)據(jù)量較小的時(shí)候,產(chǎn)生的結(jié)果會(huì)有偏差,需要在建立后不斷用新的可信的樣本數(shù)據(jù)進(jìn)行調(diào)整完善,以獲得更準(zhǔn)確的結(jié)果。

1.2 數(shù)據(jù)采集

在數(shù)據(jù)采集中,首先結(jié)合實(shí)訓(xùn)基地創(chuàng)業(yè)者入駐流程、服務(wù)模式以及調(diào)查跟蹤頻度,搭建系統(tǒng)進(jìn)行創(chuàng)業(yè)者創(chuàng)業(yè)數(shù)據(jù)采集,從入駐、信息變更、注冊(cè)企業(yè)、成長(zhǎng)調(diào)查、退出等階段收集各入駐企業(yè)/團(tuán)隊(duì)負(fù)責(zé)人、團(tuán)隊(duì)轉(zhuǎn)化企業(yè)、企業(yè)成長(zhǎng)發(fā)展以及退出等方面信息,經(jīng)分析與創(chuàng)業(yè)成功有關(guān)的信息,如表1所示。

表1數(shù)據(jù)分別為創(chuàng)業(yè)者在入駐基地時(shí)和入駐后不同階段采集獲得,上表只是通過歸納將數(shù)據(jù)內(nèi)容合并在一起。

1.3 數(shù)據(jù)預(yù)處理

通過采集系統(tǒng)獲得了數(shù)據(jù)樣本,但是采集到的數(shù)據(jù)往往存在不完整、冗余、離散值等問題,無法直接用于數(shù)據(jù)挖掘和分析,因此需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,以提高后期挖掘和分析的效率和準(zhǔn)確度,預(yù)處理方式包括以下幾種:

(1) 數(shù)據(jù)清理

在數(shù)據(jù)采集時(shí),為了減少用戶主觀填寫造成的不一致,盡可能采用選擇題的方式讓用戶填寫,但收集的數(shù)據(jù)仍然存在部分屬性值缺失的現(xiàn)象。數(shù)據(jù)清理的目的是刪除出現(xiàn)多處空屬性的數(shù)據(jù)。由于空值對(duì)關(guān)聯(lián)分析無意義,且分析是基于一定的存在潛在規(guī)律的樣本進(jìn)行規(guī)律挖掘,部分?jǐn)?shù)據(jù)的刪除不會(huì)影響分析結(jié)果,因此清理時(shí)刪除屬性缺失3個(gè)及以上的記錄,缺失少于屬性的記錄予以完善補(bǔ)充。

表1 創(chuàng)業(yè)成功相關(guān)主要屬性

(2) 數(shù)據(jù)整合

被分析數(shù)據(jù)往往存在不同數(shù)據(jù)表中,為了防止分析過程中頻繁跨表分析造成運(yùn)算效率降低以及復(fù)雜度增大,將要分析的目標(biāo)數(shù)據(jù)通過視圖方式從不同數(shù)據(jù)表中抽取整合。整合不僅能有效去除冗余內(nèi)容還能在整合的同時(shí)完成數(shù)據(jù)的清理和轉(zhuǎn)化。

(3) 數(shù)據(jù)轉(zhuǎn)化

數(shù)據(jù)轉(zhuǎn)化的過程主要是將連續(xù)的數(shù)據(jù)轉(zhuǎn)化成離散的數(shù)據(jù),字符串形式轉(zhuǎn)化成有限的離散型的數(shù)值。如表1中的負(fù)責(zé)人年齡屬性,取值為正整數(shù),統(tǒng)計(jì)時(shí)數(shù)據(jù)值較分散無法形成有效分析,因此需要進(jìn)行轉(zhuǎn)化。同時(shí)創(chuàng)業(yè)者一般年齡都分布在20-60歲之間,年齡值可轉(zhuǎn)化成20-30歲、30-40歲、40-50歲、50-60歲、其他5種取值范圍,并用0、1、2、3、4四種數(shù)值進(jìn)行表示,大大簡(jiǎn)化了連續(xù)型數(shù)據(jù)帶來的復(fù)雜度。數(shù)據(jù)轉(zhuǎn)化可以在數(shù)據(jù)整合的同時(shí)進(jìn)行,除了將連續(xù)型的數(shù)據(jù)進(jìn)行轉(zhuǎn)化,還包括將字符型的離散型的數(shù)據(jù)轉(zhuǎn)化成對(duì)應(yīng)的整形數(shù)字。

(4) 增加創(chuàng)業(yè)結(jié)果判斷屬性

數(shù)據(jù)采集時(shí),記錄了創(chuàng)業(yè)者的基本信息以及發(fā)展情況,但是對(duì)于判斷哪些屬于創(chuàng)業(yè)成功的創(chuàng)業(yè)者并未明示。因此,在數(shù)據(jù)預(yù)處理時(shí),需要對(duì)創(chuàng)業(yè)成功者進(jìn)行預(yù)定義,并增加字段進(jìn)行標(biāo)識(shí)。根據(jù)數(shù)據(jù)源內(nèi)容以及公共實(shí)訓(xùn)基地服務(wù)入駐創(chuàng)業(yè)者周期為3月-1年的特點(diǎn),通過創(chuàng)業(yè)團(tuán)隊(duì)轉(zhuǎn)化企業(yè)情況、營(yíng)業(yè)額、帶動(dòng)就業(yè)效應(yīng)、知識(shí)產(chǎn)權(quán)產(chǎn)生情況等方面綜合評(píng)定,評(píng)定標(biāo)準(zhǔn),如表2所示。

表2 創(chuàng)業(yè)成功評(píng)分標(biāo)準(zhǔn)

表2為對(duì)所有信息庫中的創(chuàng)業(yè)者進(jìn)行評(píng)分的標(biāo)準(zhǔn),60分及以上標(biāo)識(shí)為成功創(chuàng)業(yè)者,否則為失敗。此定義規(guī)則可根據(jù)最后輸出結(jié)果、創(chuàng)新發(fā)展情況及成功創(chuàng)業(yè)者特性進(jìn)行調(diào)整與不斷完善。

1.4 基于Apriori算法的關(guān)聯(lián)規(guī)則挖掘

對(duì)創(chuàng)業(yè)成功因素建模,首先需要分析創(chuàng)業(yè)者身上各種特質(zhì)與創(chuàng)業(yè)成功的聯(lián)系,誠然通過預(yù)處理后的數(shù)據(jù)可以得到創(chuàng)業(yè)者信息與創(chuàng)業(yè)成功之間的聯(lián)系,并通過決策樹建立創(chuàng)業(yè)成功的模型,但預(yù)處理后的數(shù)據(jù)屬性過多,且含有很多低概率出現(xiàn)的數(shù)據(jù),因此我們采用關(guān)聯(lián)規(guī)則挖掘算法,過濾那些先關(guān)性較低的屬性和相關(guān)性小的樣本,以增加決策樹建立的可信性。

Apriori算法是最成熟、最具有影響力的關(guān)聯(lián)規(guī)則挖掘算法之一,其挖掘過程一般包括兩個(gè)階段[5],第一階段為從信息庫中找出所有頻繁項(xiàng)集,即支持度不低于預(yù)定義閾值的所有項(xiàng)集;第二階段則利用頻繁項(xiàng)集找出強(qiáng)關(guān)聯(lián)規(guī)則,即滿足既定置信度的頻繁項(xiàng)的關(guān)聯(lián)關(guān)系。它利用頻繁集的子集一定是頻繁集,非頻繁集的超集必定不是頻繁集這一原理,通過迭代方式獲得所有頻繁集。

Apriori算法由頻繁k-1項(xiàng)集進(jìn)行自連接生成的候選頻繁k項(xiàng)集數(shù)量巨大,且在驗(yàn)證候選頻繁k項(xiàng)集的時(shí)候需要對(duì)整個(gè)數(shù)據(jù)庫進(jìn)行掃描[6],鑒于本文使用關(guān)聯(lián)規(guī)則分析并非找出創(chuàng)業(yè)者信息庫中的所有頻繁集和強(qiáng)關(guān)聯(lián)關(guān)系,只需找出和是否創(chuàng)業(yè)成功之間的關(guān)系,因此對(duì)Apriori進(jìn)行如下改進(jìn):

(1) 開始于尋找含有創(chuàng)業(yè)結(jié)果的2-項(xiàng)頻繁集

由于本次關(guān)聯(lián)規(guī)則查詢的目的是為了查找各條件與創(chuàng)業(yè)結(jié)果之間的關(guān)聯(lián),因此頻繁集中必然包含創(chuàng)業(yè)結(jié)果這一項(xiàng),所以1-頻繁集的查找無任何意義。同時(shí)查找的2-項(xiàng)候選集必定含有創(chuàng)業(yè)結(jié)果一項(xiàng),因此搜索時(shí)只需將創(chuàng)業(yè)結(jié)果項(xiàng)與其他各進(jìn)行連接,獲得2-項(xiàng)頻繁項(xiàng)集。

(2) 及時(shí)刪除不含有頻繁項(xiàng)的事務(wù)

由于非頻繁項(xiàng)的超級(jí)必定為非頻繁項(xiàng),因此如果某個(gè)事務(wù),在掃描過程中發(fā)現(xiàn)不含有任何頻繁項(xiàng),可以將其刪除,不再進(jìn)行下一次掃描。

根據(jù)本文所求關(guān)聯(lián)規(guī)則的特殊性,對(duì)Apriori算法進(jìn)行了改進(jìn),其流程,如圖2所示。

圖2 基于Apriori的關(guān)聯(lián)規(guī)則分析流程圖

算法描述:

(1) 掃描樣本數(shù)據(jù)庫,將創(chuàng)業(yè)結(jié)果與各項(xiàng)連接,尋找搜有2-項(xiàng)候選項(xiàng);

(2) 根據(jù)設(shè)定的最小支持度,刪除非頻繁項(xiàng),得到2-項(xiàng)頻繁集;

(3) 判斷頻繁項(xiàng)集,為空,則結(jié)束;若不為空,則生成;

(4) 通過K-1項(xiàng)的連接,生成K項(xiàng)候選項(xiàng)(初始K=3);

(5) 如果K項(xiàng)候選項(xiàng)的某項(xiàng)是非頻繁項(xiàng)的超集,則刪除;

(6) 計(jì)算所有候選項(xiàng)的支持度和置信度,刪除非頻繁項(xiàng),以及不含有頻繁項(xiàng)的事務(wù);

(7)K+1,返回3),將6)生成的頻繁集作為基礎(chǔ)頻繁集,生成新的頻繁集。

通過此算法,可以找到與創(chuàng)業(yè)成功與否存在強(qiáng)關(guān)聯(lián)的屬性,以作為后續(xù)決策樹構(gòu)建的主要分支。

1.5 ID3決策樹算法

決策樹著眼于從一組無規(guī)則、無次序的實(shí)例中推理出決策樹表示形式的分類規(guī)則[7],并根據(jù)此規(guī)則判斷未知類別數(shù)據(jù)所屬類別,以此達(dá)到預(yù)測(cè)的目的[8]。ID3算法,是最經(jīng)典的決策樹挖掘算法[9],構(gòu)造決策樹的關(guān)鍵在于分裂屬性,即在某個(gè)節(jié)點(diǎn)按照屬性的不同取值進(jìn)行分支。在構(gòu)造時(shí),需要選擇盡可能“純”的屬性進(jìn)行分裂,即讓分裂后在同一區(qū)域的數(shù)據(jù)盡可能得到相同的結(jié)果[10]。ID3算法將信息熵(entropy)和信息增益(information gain)作為選擇分裂屬性的標(biāo)準(zhǔn)。

假設(shè)S為用類別對(duì)樣本庫進(jìn)行的劃分,則S的熵表示,如式(1)。

(1)

其中Pi表示S中第i個(gè)取值出現(xiàn)的概率,它表示為S中各取值的平均信息量。

假設(shè)S樣本庫用屬性A進(jìn)行劃分,則A對(duì)S劃分的期望信息,為式(2)。

(2)

其中|S|是S中元素的個(gè)數(shù),|Sj|是樣本S中是屬性A取值j時(shí)的個(gè)數(shù),Entropy(Sj)為屬性A取值j時(shí)的條件熵。

屬性A在樣本S上的信息增益,為式(3)。

Gain(A)=Entropy(S)-EntropyA(S)

(3)

在決策樹構(gòu)造過程中,樹根從Gain(A)值最高的屬性開始分裂,如果對(duì)應(yīng)分支得到的結(jié)果純度很高,則不繼續(xù)分裂,對(duì)應(yīng)的高純度的結(jié)果為葉子節(jié)點(diǎn);如果無法得到純度高的結(jié)果,則繼續(xù)按照信息增益高的屬性進(jìn)行分裂,直至無屬性分裂,選擇相對(duì)取值多的結(jié)果作為葉子節(jié)點(diǎn)。在使用決策樹預(yù)測(cè)新樣本時(shí),從樹的根節(jié)點(diǎn)開始按照樣本的值選擇分支,直至到葉子節(jié)點(diǎn),得到最終結(jié)果。

2 創(chuàng)業(yè)成功傾向預(yù)測(cè)分析應(yīng)用

基于對(duì)創(chuàng)業(yè)成功預(yù)測(cè)模型搭建的流程介紹以及相關(guān)算法的分析,本文選取了100個(gè)的經(jīng)數(shù)據(jù)預(yù)處理的創(chuàng)業(yè)者樣本,對(duì)負(fù)責(zé)人年齡、學(xué)歷、創(chuàng)業(yè)經(jīng)歷、專業(yè)類別、性別、是否海歸這六個(gè)類別進(jìn)行分析建模。我們以按照Apriori算法進(jìn)行關(guān)聯(lián)規(guī)則分析,設(shè)定最小支持度為2%,最小置信度為50%,得到的部分2項(xiàng)頻繁集和3箱頻繁集的置信度,如表3所示。

在A→B時(shí),置信度表示A發(fā)生時(shí)B發(fā)生的概率,計(jì)算方式,如式(4)。

Support(A→B)=P(AB)/P(A)

(4)

提升度表示A與B是否正向相關(guān),計(jì)算方式見式(5)

Lift(A,B)=Support(A→B)/P(B)

(5)

當(dāng)置信度越大,表示A發(fā)生時(shí)B發(fā)生的概率越大;提升度>1且值越大時(shí),表示A和B的之間的正向相關(guān)性越強(qiáng),彼此的關(guān)聯(lián)關(guān)系也越強(qiáng)。根據(jù)上述理論,得到了學(xué)歷、年齡、創(chuàng)業(yè)經(jīng)歷、專業(yè)類別、海歸&工科這5個(gè)屬性與創(chuàng)業(yè)成功與否關(guān)系最強(qiáng)烈,我們將根據(jù)這幾個(gè)屬性構(gòu)建決策樹。

按照決策樹信息熵的定義,42人創(chuàng)業(yè)成功,58人失敗的創(chuàng)業(yè)結(jié)果的信息熵結(jié)果,如式(6)。

(6)

表3 2項(xiàng)、3項(xiàng)部分頻繁集置信度和提升度

各關(guān)鍵屬性的條件熵結(jié)果,為式(7)~式(11)。

(7)

(8)

(9)

(10)

(11)

按照信息增益理論,“學(xué)歷”為決策樹的根節(jié)點(diǎn)。以學(xué)歷中三個(gè)與創(chuàng)業(yè)成功與否強(qiáng)關(guān)聯(lián)的三個(gè)取值“20—30歲”、“30—40歲”、“其他”作為新的樹分裂的劃分準(zhǔn)則,并計(jì)算信息熵、條件熵以及信息增益以得到其子結(jié)點(diǎn),直至到葉子結(jié)點(diǎn)。按此方法逐級(jí)構(gòu)造,如圖3所示。

圖3是基于樣本庫以及負(fù)責(zé)人年齡、學(xué)歷、創(chuàng)業(yè)經(jīng)歷、專業(yè)類別、性別、是否海歸這些屬性對(duì)創(chuàng)業(yè)者成功與否預(yù)測(cè)構(gòu)建的決策樹,新的創(chuàng)業(yè)者樣本可以根據(jù)此樹進(jìn)行成功創(chuàng)業(yè)與否的判斷。當(dāng)然本文只列舉了一小部分考量的成功相關(guān)因素,實(shí)際考慮的因素更多,如是否已經(jīng)享受投融資、創(chuàng)業(yè)的領(lǐng)域方向、創(chuàng)業(yè)團(tuán)隊(duì)的其他人員情況等等,將形成一個(gè)更復(fù)雜更龐大的決策分析樹。

圖3 創(chuàng)業(yè)成功傾向判斷決策樹

3 總結(jié)

在雙創(chuàng)大趨勢(shì)下,眾多創(chuàng)業(yè)服務(wù)機(jī)構(gòu)希望通過他們的扶持,幫助創(chuàng)業(yè)者成功創(chuàng)業(yè)。文本對(duì)數(shù)據(jù)挖掘方法中的關(guān)聯(lián)規(guī)則算法與決策樹算法進(jìn)行了研究,并將兩種算法結(jié)合構(gòu)建了創(chuàng)業(yè)成功傾向預(yù)測(cè)模型,應(yīng)用于創(chuàng)業(yè)服務(wù)機(jī)構(gòu)在對(duì)創(chuàng)業(yè)者不熟悉情況下的考察分析中,通過科學(xué)、客觀的方式和機(jī)器學(xué)習(xí)分析的手段為決策者決策時(shí)提供了參考依據(jù)。

當(dāng)然,對(duì)創(chuàng)業(yè)者是否成功創(chuàng)業(yè)的預(yù)測(cè),還與創(chuàng)業(yè)項(xiàng)目的可行性、市場(chǎng)前景,創(chuàng)業(yè)主要負(fù)責(zé)人的領(lǐng)導(dǎo)能力、表達(dá)能力、決策能力,創(chuàng)業(yè)團(tuán)隊(duì)主要成員的工作能力等需要主觀評(píng)判的因素有關(guān),本文只是對(duì)與創(chuàng)業(yè)者相關(guān)的客觀因素進(jìn)行了模型搭建,如何更好地結(jié)合主觀因素以及外界環(huán)境因素,建立更完善的模型是今后研究的方向。

[1] 侯典牧,鄭云.美國大學(xué)生技術(shù)創(chuàng)業(yè)典型模式探析 [J].經(jīng)濟(jì)視角,2013(12):122-125.

[2] 李向輝,李艷茹.美國硅谷科技創(chuàng)業(yè)經(jīng)驗(yàn)研究 [J].江蘇科技信息,2014(2):11-13.

[3] 楊春華,熊勤竹,莫瓊玉,周威.李保嬋創(chuàng)業(yè)投資項(xiàng)目評(píng)估相關(guān)問題研究 [J].合作經(jīng)濟(jì)與科技,2015(3):66-67.

[4] 汪志華,尹國俊.創(chuàng)業(yè)投資項(xiàng)目決策模型文獻(xiàn)綜述 [J]. 商場(chǎng)現(xiàn)代化,2014(25):111-112.

[5] 朱惠.關(guān)聯(lián)規(guī)則中Apriori算法的研究與改進(jìn)[D].合肥:安徽理工大學(xué),2014.

[6] 丁麗.基于Apriori 算法的用戶行為數(shù)據(jù)挖掘研究[J].科技通報(bào),2013,29(12):214-215.

[7] 潘永麗.決策樹分類算法的改進(jìn)及其應(yīng)用研究[D].昆明:云南財(cái)經(jīng)大學(xué),2012.

[8] 黃宇達(dá),范太華.決策樹ID3算法的分析與優(yōu)化[J] .計(jì)算機(jī)工程與設(shè)計(jì),2012,33(8):3088-3092.

[9] 李瑞,許旭睿.決策樹ID3算法的分析與優(yōu)化[J].大連交通大學(xué)學(xué)報(bào),2015(2):91-95.

[10] 瞿花斌.?dāng)?shù)據(jù)挖掘的決策樹技術(shù)在高校畢業(yè)生管理中的應(yīng)用[D].濟(jì)南:山東大學(xué),2014.

Analysis of Entrepreneurial Success Tendency Based on Entrepreneur's Information Mining

Huang Yan, Huang Huiying, Wang Ruirong, Ding Zhigang

(Shanghai Development Center of Computer Software Technology, Shanghai 201112, China)

Under the environment of innovation and entrepreneurship, in order to help the entrepreneurial service institutions more accurately identify the entrepreneurial projects with success tendency, this article discusses the method of using data mining to analyze the information of entrepreneurs to provide guidance and advice. After researching the Apriori algorithm and ID3 decision tree algorithm, we improve the Apriori algorithm based on the specific objective of entrepreneurial success prediction, and propose an entrepreneurial success tendency analysis prediction model, and it provides a base for an objective and quantitative information evaluation for entrepreneurs.

Entrepreneurial success; Mining; Apriori; Tree prediction

上海大數(shù)據(jù)科技成果轉(zhuǎn)化平臺(tái)(16DZ1110101)

黃 燕(1982-),女,上海計(jì)算機(jī)軟件技術(shù)開發(fā)中心,工程師,碩士,研究方向:大數(shù)據(jù)。 黃慧穎(1983-),女,上海計(jì)算機(jī)軟件技術(shù)開發(fā)中心,工程師,學(xué)士,研究方向:科研管理。 汪瑞嶸(1980-),女,上海計(jì)算機(jī)軟件技術(shù)開發(fā)中心,工程師,碩士,研究方向:大數(shù)據(jù)。 丁志剛(1962-),男,上海計(jì)算機(jī)軟件技術(shù)開發(fā)中心,研究員,學(xué)士,研究方向:計(jì)算機(jī)應(yīng)用。

1007-757X(2017)05-0008-05

TP311

A

2016.12.01)

猜你喜歡
關(guān)聯(lián)分析信息
“苦”的關(guān)聯(lián)
隱蔽失效適航要求符合性驗(yàn)證分析
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
奇趣搭配
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
智趣
讀者(2017年5期)2017-02-15 18:04:18
電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
展會(huì)信息
語言學(xué)與修辭學(xué):關(guān)聯(lián)與互動(dòng)
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 欧日韩在线不卡视频| 麻豆精品在线播放| 91国内外精品自在线播放| 亚洲妓女综合网995久久| 国产网站一区二区三区| 亚洲一区二区三区麻豆| 国产欧美另类| 国产www网站| 91亚洲视频下载| 伊人色天堂| 国产成人你懂的在线观看| 思思99热精品在线| 国禁国产you女视频网站| 一级片免费网站| 日本精品中文字幕在线不卡| 午夜精品福利影院| 国产免费黄| 婷婷亚洲天堂| 国产精品久久精品| 欧美三级视频网站| 黄色网在线| 亚洲第一页在线观看| 国产成人综合亚洲网址| 国产精品黄色片| 在线播放国产99re| 99精品视频九九精品| 久久国产精品波多野结衣| 国产精品亚洲va在线观看| 亚洲自偷自拍另类小说| 激情综合婷婷丁香五月尤物| 东京热av无码电影一区二区| 国产欧美精品专区一区二区| 欧美亚洲网| 亚洲欧美人成电影在线观看| 一级毛片免费高清视频| 色综合天天综合中文网| 免费人成在线观看成人片 | 亚洲一级毛片在线观播放| 国产99在线| 最新国产你懂的在线网址| 成人一级免费视频| 久久久久亚洲Av片无码观看| 91亚瑟视频| 99久久国产综合精品女同| 福利视频一区| 久久精品人人做人人综合试看| 91偷拍一区| 福利在线一区| 免费一级毛片在线播放傲雪网| 在线视频亚洲色图| Aⅴ无码专区在线观看| 五月天久久综合| 国产三级毛片| 成人欧美日韩| 日韩无码视频播放| 四虎永久免费在线| 久久国产拍爱| 欧美亚洲另类在线观看| 丝袜久久剧情精品国产| 亚洲天堂精品视频| 亚洲AⅤ永久无码精品毛片| 玖玖免费视频在线观看| 国产精品成人观看视频国产| 亚洲区视频在线观看| 狠狠干综合| 亚洲精品天堂自在久久77| 国产成a人片在线播放| 91在线高清视频| 五月激情婷婷综合| 毛片免费在线视频| 午夜无码一区二区三区在线app| 亚洲美女久久| 丰满人妻被猛烈进入无码| 亚洲AⅤ波多系列中文字幕| 国产福利影院在线观看| 亚洲爱婷婷色69堂| 亚洲天堂视频在线观看免费| 色婷婷亚洲综合五月| 又猛又黄又爽无遮挡的视频网站| 极品私人尤物在线精品首页| 亚洲资源站av无码网址| 亚洲a级在线观看|