吳瓊 趙春生

摘 要:風險投資,又可以理解為創(chuàng)業(yè)投資,是初創(chuàng)企業(yè)開始發(fā)展并進入正軌的一種重要融資方式。風險投資的成功與否與企業(yè)環(huán)境、財務、管理、市場、技術(shù)等密切相關(guān)。在此背景下,本文講述了如何利用線性Logistic回歸方法和非線性粒子群神經(jīng)網(wǎng)絡算法分析影響投資成敗的一系列因素,并對其進行評估。
關(guān)鍵詞:風險投資;主成分分析;Logistic回歸神經(jīng)網(wǎng)絡;粒子群
1 緒論
風險投資,或稱為風險資本、創(chuàng)業(yè)資本,是指以股權(quán)、準股權(quán)或具有附帶條件的債權(quán)形式投資于新穎、未經(jīng)試用技術(shù)項目或未來具有高度不確定性的項目,并愿意為所投資的項目或企業(yè)提供管理或經(jīng)營服務,期望通過項目的高成長率并最終以某種方式出售產(chǎn)權(quán)以取得高額中長期收益的一種投資方式[1]。
相比于國外,國內(nèi)的風險投資起步相對較晚。在20世紀40年代,風險投資開始于美國硅谷[2]。與根深蒂固的交易方式不同,風險投資不是類似于各種財產(chǎn)的抵押交換,而是直接將資金與所投資公司的股權(quán)交易,即資金多少直接與企業(yè)股權(quán)占有量成比,所以,投資人在進行投資時,會對投資公司的背景文化、運營方式、效益等多方面進行考察選擇,最終確定投資。可見,投資是具有一定風險的,綜合評估投資企業(yè)對投資成功具有重要意義。風險投資具有高風險、高收益的特點,所以,只有少部分精通投資的人會涉足這一領域,而且風險投資對象大多是涉及通信、半導體等的新興高科技企業(yè)。
當代社會,科技迅猛發(fā)展,隨之而來的,是企業(yè)的發(fā)展與社會的進步。對于企業(yè)來講,只有將技術(shù)和創(chuàng)新擺在首位,才能為企業(yè)的長遠發(fā)展提供保障。同樣的,長久利益是企業(yè)吸引風險投資的必備優(yōu)勢,所以,風險投資的產(chǎn)生與運營將會帶動企業(yè)的創(chuàng)新和發(fā)展,從而促進經(jīng)濟發(fā)展和社會進步。可見,風險投資對于整個社會的進步有一定的推動作用。
2 理論基礎
2.1 粒子群算法理論
群體活動往往表現(xiàn)出智能性,而且智能仿生技術(shù)在解決實際問題中越來越受到青睞。粒子群算法(PSO)是一種典型的群體智能優(yōu)化算法,由Eberhart博士和Kennedy博士在1995年提出,并受到了很大關(guān)注。粒子群算法來源于鳥群的捕食行為,利用群體中個體之間信息的共享,從而實現(xiàn)群體的無序到有序的行為轉(zhuǎn)變,并最終完成整個問題。
在利用粒子群算法進行求解問題時,首先對定義的一群粒子進行初始化,包括位置、速度和適應度值三個量,在求解過程中,每一個粒子都是潛在的最優(yōu)解,設定適應度值函數(shù)用來計算每個粒子的適應度值,其大小代表了粒子的優(yōu)劣。在粒子運動過程中,通過比較每個粒子或其本身所經(jīng)歷的適應度值,尋找粒子群的個體極值和群體極值,即個體所經(jīng)歷的最大適應度函數(shù)的位置為個體極值,所有粒子中的最大適應度值個體為群體極值。再通過不斷更新粒子的位置和適應度值,來尋找最優(yōu)解。
2.2 BP神經(jīng)網(wǎng)絡算法理論
前饋神經(jīng)網(wǎng)絡的算法中,反向傳播(BP)算法是最基本的算法,也是應用較為普遍的算法。所謂反向傳播,是指將神經(jīng)網(wǎng)絡訓練中的誤差從輸出層反向推導至隱含層、輸入層,以使誤差逐漸減小為原則,調(diào)整網(wǎng)絡各層的連接權(quán)值和閾值。
BP算法的缺點是在學習過程中采用的是非線性梯度優(yōu)化算法,存在局部極小問題,學習算法收斂速度慢,迭代次數(shù)多,學習步長的選取造成穩(wěn)定性變化。因此,我們通常會用到改進的BP算法,如用粒子群算法來優(yōu)化BP算法。
傳統(tǒng)的BP神經(jīng)網(wǎng)絡采用誤差反向傳播來調(diào)整網(wǎng)絡連接權(quán)值,該方法容易陷入局部最優(yōu)解,而PSO算法可以在更大的空間內(nèi)搜索,在一定程度上避免了以上問題。所以,將PSO算法應用于BP神經(jīng)網(wǎng)絡的網(wǎng)絡權(quán)值優(yōu)化。從而更好實現(xiàn)全局尋優(yōu)問題。
將神經(jīng)網(wǎng)絡各層的連接權(quán)值編碼成粒子,適應度值則為使用該組權(quán)值時的網(wǎng)絡輸出均方誤差,利用之前描述的粒子群算法,在預設的迭代次數(shù)內(nèi)搜索最優(yōu)的網(wǎng)絡權(quán)值。
3 投資風險評估
風險投資公司在對風險進行識別的過程中更多地是利用在以往的項目開發(fā)中的經(jīng)驗,以及累積和整理的風險投資行業(yè)的經(jīng)驗和教訓對風險進行識別,在這一過程中,風險投資公司會首先查看風險企業(yè)的歷史資料,如,索賠記錄、其他風險信息等,對企業(yè)信譽進行考察;其次查看風險企業(yè)近期財務報表,對企業(yè)近幾年的銷售收入、利潤增長率、凈利潤、凈資產(chǎn)收益率進行了解;再次對企業(yè)進行實地考察,對風險企業(yè)進行全面考察,最后由參與項目的人員進行討論。
風險投資公司目前在對風險進行識別時重點對環(huán)境、技術(shù)、財務、市場和管理等6個風險因素進行了關(guān)注,具體如下表所示。
3.1 樣本選擇與數(shù)據(jù)處理
首先對各個公司收集的以上歷史數(shù)據(jù)進行處理,如果數(shù)據(jù)量太小,而且多列數(shù)據(jù)存在不同程度的缺失,如果因為某個數(shù)據(jù)缺失而刪除整行會導致大量重要信息丟失,所以在原始數(shù)據(jù)較少的情況下,不能剔除缺失值所在行,所以需要進行缺失值處理。所以,首先對整體數(shù)據(jù)進行分析,然后用SPSS軟件對缺失值進行填補,最后利用EXCEL對每列數(shù)據(jù)進行歸一化標準處理,從而可以進行建模分析。
3.2 相關(guān)性分析
首先運用SPSS軟件進行主成分分析,可以得到各個指標的相關(guān)性排序,并能得到相關(guān)性排名靠前的指標,例如:市場需求強度、市場推廣和擴張能力主流化、凈利率預估、管理類別好1中2差3、目前收入可持續(xù)程度、樣品準備時間、發(fā)展路線圖的詳細度、資產(chǎn)需求指數(shù)、輕資產(chǎn)0為真位于前9位,然后對這9個主變量進行線性Logistic回歸分析和非線性粒子群神經(jīng)網(wǎng)絡處理,從而建立風險評估的線性和非線性模型。
3.3 風險評估模型
3.3.1 線性logistic回歸
在logistic回歸分析中,回歸系數(shù)的估計方法通常是最大似然法。最大似然法就是選取使得總體真參數(shù)落在樣本觀察值領域里的概率達到最大的參數(shù)值作為真參數(shù)的估計值。為了得到一個非偏估計,需采用重遞推的方法,將最大似然估計值不斷修正。軟件系統(tǒng)使用的是重復加權(quán)最小二乘遞推法來估計回歸系數(shù)。對這9個主變量進行線性Logistic回歸分析,結(jié)合分析結(jié)果可以建立一種線性關(guān)系:z=a0+a1x1+a2x2+…+a9x9,并將此關(guān)系式代入p(y)=11+e-z,從而可以對因變量的發(fā)生概率進行預測,即p(y)值越大,代表投資成功率越大。
3.3.2 非線性粒子群神經(jīng)網(wǎng)絡
粒子群BP神經(jīng)網(wǎng)絡分為三層,分別是輸入層、隱含層和輸出層。其中輸入層的數(shù)據(jù)為前面選取的排名前9的指標,分別是市場需求強度、凈利率預估、資產(chǎn)需求指數(shù)、對市場的細分程度、市場發(fā)育、市場推廣和擴張能力、發(fā)展路線圖的詳細程度、樣品準備時間、制度化管理能力。
設定隱含層個數(shù),輸出為合并的結(jié)果,也就是1代表投資成功,0代表投資失敗。通過訓練收集的歷史數(shù)據(jù)來訓練粒子群神經(jīng)網(wǎng)絡模型,建立各項指標與輸出的一種非線性映射關(guān)系,從而根據(jù)最新數(shù)據(jù),利用優(yōu)化的非線性模型得到企業(yè)投資成功的概率。從中分析得出企業(yè)獲得成功投資的概率越高,投資風險也就越小。
線性logistic回歸和粒子群神經(jīng)網(wǎng)絡是對數(shù)據(jù)進行擬合的線性和非線性方法,在數(shù)據(jù)處理和預測中具有重要作用,兩者都可以對數(shù)據(jù)進行擬合,適用于不同的數(shù)據(jù)類型,各有千秋,需要根據(jù)實際數(shù)據(jù)和場景進行選擇和比較。
4 結(jié)論
本文從線性系統(tǒng)角度構(gòu)建了基于Logistic回歸的風險評估模型,從非線性角度構(gòu)建了基于粒子群優(yōu)化的BP神經(jīng)網(wǎng)絡模型,從而可以評估各企業(yè)的投資風險。線性Logistic回歸模型,易受極端變量影響,需要建立長期的報告,檢測機制操作較為復雜,但是易于理解和實行。非線性的粒子群優(yōu)化的BP神經(jīng)網(wǎng)絡模型同樣也容易受到極端變量的影響,并且對訓練樣本有著嚴格的要求,對于訓練樣本和測試樣本的分類個數(shù)也會影響模型的準確度。但是它的計算精度比較高,只要定期更新訓練數(shù)據(jù),就可以構(gòu)建穩(wěn)健的評估模型。
綜上所述,通過線性和非線性兩種方法對收集的數(shù)據(jù)進行處理,可以對投資風險進行全面的評估,有利于投資人基于公司歷史表現(xiàn)數(shù)據(jù)評估投資風險,具有非常重要的現(xiàn)實應用意義。
參考文獻:
[1]郭占力.中國風險投資發(fā)展研究[D].黑龍江:哈爾濱工程大學,2015.5.
[2]成思危.科技風險投資論文集.北京:民主與建設出版,1997.
[3]施祖麟,韓岱峰.美國風險投資業(yè)發(fā)展及促進高技術(shù)產(chǎn)業(yè)化的啟示.科技導報,1988(11).