














摘 要:針對眾籌融資過程中存在的信息不對稱問題,基于前景理論中處理不確定信息的決策效用規則,結合眾籌項目信息披露與投資者效用分析,構建了一個新的眾籌績效預測模型。為解決實際應用中特征選擇過多的問題,引入了一種基于神經網絡算法的稀疏性特征選擇方法,該方法能夠幫助眾籌平臺聚焦于核心特征,以更好地理解和預測投資者行為。對Kickstarter平臺上超過15萬個項目的實證分析結果表明:考慮投資者風險感知和前景效用的模型對眾籌績效有更好的預測和解釋能力。該研究結論不僅為眾籌項目的預測和評估提供了新的視角,也為眾籌平臺和籌資者建立分析投資者支持行為的分析框架提供了有力的工具。
關鍵詞:投資者行為; 不確定性偏好; 行為建模; 眾籌績效
中圖分類號:TP39;F83 文獻標志碼:A
文章編號:1001-3695(2024)08-028-2448-07
doi:10.19734/j.issn.1001-3695.2023.11.0590
Crowdfunding performance prediction model based on investor behavior analysis
Wei Ju1, Zhou Zhengming2
(1.Bank of Beijing Post-Doctoral Research Station, Bank of Beijing, Beijing 100033, China; 2.Post-Doctoral Research Station, Bank of Communications, Shanghai 200093, China)
Abstract:Addressing the issue of information asymmetry in crowdfunding, this paper developed a new model for predicting crowdfunding performance, based on the decision utility rules for processing uncertain information in prospect theory and combining the analysis of crowdfunding project information disclosure with investor utility. To tackle the issue of excessive feature selection in practical applications, it introduced a sparsity-based feature selection method using neural networks, which could help crowdfunding platforms to focus on core features for better understanding and predicting investor behavior. Empirical analysis of over 150 000 projects on the Kickstarter platform shows that models considering investors’ perception of risk and prospect utility have better predictive and explanatory power for crowdfunding performance. The research results not only provide a new perspective for the prediction and evaluation of crowdfunding projects, but also offer powerful tools for crowdfunding platforms and fundraisers to establish models for analyzing backers’ backing behavior.
Key words:investor behavior; uncertainty preference; behavioral modeling; crowdfunding performance
0 引言
長期以來,在全球范圍內,經營規模較小的中小企業面臨因獲客難和風控難而導致的融資難問題,從而使其難以發展與成長[1~3]。互聯網等信息通信技術的發展,使得以技術為基礎的方式,特別是基于互聯網技術的眾籌平臺為籌資者提供了資金支持。目前全球共有500多個眾籌平臺,如Kickstarter、Indiegogo和GoFundMe等[4,5]。眾籌這一新的商業模式涉及三個主要利益相關者: 發起者(發起項目)、投資者(資助項目)和眾籌平臺(把發起者和投資者鏈接起來的平臺)[6]。有創意的個人或企業可以在眾籌平臺上發起眾籌項目,面向所有線上網民尋找項目資助者,以獲取資金。除了提供資金支持外,近年來,眾籌因其能在新產品開發階段了解消費者需求,獲取市場反饋和使創業者在真正投資生產前與消費者簽約而備受關注[7~9]。隨著眾籌在獲取資金和了解市場情況的優勢逐漸顯現,眾籌正在轉變為依托互聯網支持創業(融資屬性)和學習需求(運營屬性)的重要方式。然而,Kickstarter的統計數據顯示,Kickstarter上成功融資的項目所占比例很小,這使得眾籌平臺和發起者迫切想知道如何及時有效地評估眾籌項目,從而提高眾籌活動的成功率[10,11]。
在過去的十年中,大量的實證研究通過分析項目發起人特征、項目本身特征和支持者特征來預測眾籌項目的成功[6,12]。例如,Xiao等人[12]通過構建面板向量自回歸模型(panel vector auto regression model)說明了投資者對眾籌的支持決策中存在慣性行為。Du等人[6]利用文本分析,從出資人的質押歷史數據中識別出資人的語言偏好,根據出資人的語言偏好通過深度學習模型預測眾籌項目的成功。上述兩項實證研究說明了分析支持者行為對預測眾籌項目績效的有效性。然而,這兩個研究只是從識別投資者行為特征出發,從而基于識別的特征建立預測模型,但行為相關因素影響投資者決策的原因和方式卻一直被忽視。
在眾籌融資活動中,投資者的支持決策直接決定了眾籌的資金規模,從而決定了眾籌項目的成敗。因此,在預測或評估眾籌項目的績效時,分析個體出資人的決策行為對預測眾籌項目績效是非常重要的。此外,了解出資人在眾籌活動中的個人決策行為,對于項目創作者、眾籌平臺乃至政府立法者培育更好的眾籌市場[12]都至關重要。為此,本文在以往實證研究的基礎上,基于前景理論(prospect theory,PT),從行為相關因素對出資人支持決策的影響視角出發,構建了一個新的混合模型來評估眾籌項目。一般來說,影響決策者決策的行為因素可以被廣泛地分為兩類[12,13]:一是與決策情境相關的因素,如信號觀察學習[13]、同伴影響[14]和媒體注意[15];二是決策者的心理和情緒,如有限理性[16]、樂觀[17]和過度自信[18]。
在互聯網快速發展的背景下,本文提出了兩個與行為相關的因素: 項目信息觀察和出資人對不確定性信息的風險偏好。在線眾籌平臺提供了關于眾籌項目的詳細信息(如融資目標、持續時間、項目描述和介紹),以及項目已有質押與目標的比例、項目更新次數、評論次數、出資人數量、截止日期前剩余天數等實時指標數據。對于任何潛在的投資者來說,獲取上述項目相關信息都非常容易。然而,支持者獲取的信息卻并不準確,并且是不斷變化的。例如,投資者無法獲得關于眾籌結果、眾籌產品以及產品是否會按時交付的準確信息。因此,選擇在眾籌平臺上支持一個項目,是否能獲得滿意的產品,對每個投資方來說都存在不確定性和風險。綜上,眾籌融資活動中支持者的支持決策總是伴隨著不確定性和風險。正如Wei等人[19]的研究結果指出,不同的投資者在進行投資決策時,對不確定性和風險的偏好不同,進而導致了不同的投資策略。
在本文中,支持者對不確定性和風險的偏好是上文提到的第二類與行為相關的因素,即決策者是有限理性的,其主觀參考標準直接影響最終的決策結果。在存在不確定性和風險的決策問題中,傳統的效用函數無法解釋決策者的異質性行為[20,21]。為了有效刻畫決策者在面對不確定和風險時的行為,Kahneman等人[22]提出了前景理論(PT),作為傳統效用理論的有效補充,前景理論在具有不確定性和風險的決策問題中被廣泛應用。根據PT,利用收益為凹、損失為凸的s型(值)效用函數來刻畫決策者的異質性風險偏好。PT指出決策者更傾向于選擇前景值較大(相對值)的決策方案,而不是效用最大(絕對值)的決策方案[22,23]。基于PT在眾多具有不確定性和風險的決策問題的廣泛使用,本文引入PT來捕捉眾籌中支持者支持行為的異質性。直觀來說,每個支持者首先觀察并學習項目相關信息,然后基于PT對項目的前景效用進行評估,最后根據評估的前景效用進行支持決策(PT在本應用場景下的詳細信息見第3.2節)。
為解決以往研究指出的特征數目過多導致實際應用不方便的問題,本文使用神經網絡算法并結合重參數采樣方法構造稀疏優化問題來控制眾籌特征子集的大小,即添加特征子集中特征數量的l0約束[24]。本文中的l0約束意味著只能從N個候選特征中選擇最多K個特征來優化特征數量,其中K值根據決策者在實踐決策中的需求確定。
綜上,本文模型包括兩個部分:a)稀疏特征子集的選擇;b)建立基于信息和行為分析的眾籌項目預測模型。首先,稀疏特征子集選擇給出對眾籌項目績效貢獻最大的眾籌特征;接著根據選出的眾籌項目特征,通過將上述兩種行為相關的因素和眾籌特征鏈接在一起構建基于行為分析的眾籌績效預測模型。
本文有以下三點貢獻:
a)通過建立基于PT的出資人行為相關決策模型,考察出資人行為相關因素對眾籌評估和預測的影響,本文為在眾籌場景中使用投資者行為預測眾籌績效的實證論文提供了理論解釋。雖然當前已有學者關注對投資人投資行為的拆解,但其研究僅通過實證數據檢驗強調投資人投資行為對眾籌績效預測的重要性。本文通過對支持者的決策過程進行PT建模,識別支持者行為相關因素,量化支持者的預期效用,檢驗了支持者行為相關因素如何影響眾籌項目的績效。
b)通過將深度學習模型應用于基于互聯網的眾籌領域,對特征選擇進行稀疏優化,本文在方法論上作出了貢獻。本文采用隨機神經網絡模型結合重參數化采樣方法,簡單有效地解決了稀疏性特征子集選擇是NP-hard的問題。通過特征選擇權重稀疏性來控制眾籌特征子集的大小,并使用深度學習方法,本文模型可以為特定數量的項目特征選擇貢獻最大的特征子集。同時,為了將多源項目相關信息與支持者的效用相結合進行實證分析,采用了證據理論(ET)[25]中的Dempster的組合規則來匯總從特征信息數據中提取的多個加權證據。
c)本文模型為眾籌平臺和籌資者在處理投資者行為相關決策的問題上提供了實際應用價值。在模型中,基于深度學習模型的稀疏特征子集能夠選擇貢獻最大的特征,優化發起人特征選擇效率。在實際應用中,眾籌平臺可以使用提出的模型動態選擇貢獻最大的特征,這有利于眾籌平臺和集資方提高眾籌相關特征的資源配置效率。并且通過眾籌項目評估與預測模型以及關注支持者行為相關決策的預測模型,構建了這些被選擇的特征對眾籌項目評估的影響,有效促進了眾籌項目個性化推薦的處理過程,從而進一步提高眾籌融資績效。
1 文獻綜述
在過去的幾十年里,眾籌已經發展成為一種有效解決小公司傳統融資難的有效機制。與傳統的融資方式相比,眾籌為個人和企業提供了創業機會,讓創意能在潛在支持者的資金支持下得以實現。然而,眾籌的概念仍處于進化的早期階段,在以往的研究中,學者們主要使用了兩種方法來概念化眾籌:a)將眾籌作為一種商業模式,由創始人(項目創造者)、資助人(人群)和眾籌網站(在線平臺)等關鍵部分組成[1~3];b)將眾籌定義為支持創業和企業發展的籌集小額資金的方法[26]。隨著眾籌在國內外的不斷發展,眾籌項目分為獎勵型眾籌、股權型眾籌、借貸型眾籌和捐贈型眾籌四種。
本文的研究目標集中在基于獎勵的眾籌市場。現有的基于獎勵的眾籌前沿研究主要從實證分析的角度關注眾籌績效(如成功的項目)的影響因素,并確定了項目層面、創造者層面和資助方層面的相關特征。例如,Mollick[27]使用線性回歸模型證明項目的質量、社會網絡聯系和目標數量對融資成功均會產生影響。Wu等人[28]的研究結果表明投資者數量、互動話題、價格梯度和活動持續時間對眾籌項目融資成功概率有正向影響。Xiao等人[12]強調了在線眾籌市場中跟蹤個體投資者投資行為的重要性,建立了帶有外生變量的面板向量自回歸模型(panel vector auto regression model),以檢驗投資者在眾籌項目的重復投資決策中是否存在慣性行為,以及慣性行為是如何存在的。研究發現,投資者在獎勵層選擇中的慣性行為似乎強于投資時機選擇,項目屬性相關因素對投資者決策的影響不同,同行投資者的影響對出資人投資時機選擇的影響強于籌資人的營銷力度。 Du等人[6]利用文本分析來識別每個資助人的語言偏好,并基于語言期望理論使用深度學習模型來預測眾籌項目的成功。
與以往的研究相比,本文從理論角度探究了既往文獻提出的行為因素在眾籌決策過程中的作用,詳細分析了眾籌中個體行為因素對評估和預測的影響。與現有的對支持者個人行為因素的實證研究不同,本文引入PT識別支持者行為相關因素并量化支持者效用,利用ET檢驗支持者行為相關因素對眾籌評估的影響,這對于眾籌平臺推薦支持者最有可能支持的項目具有重要意義。
同時,本文研究也與行為經濟學文獻相關,在行為經濟學領域,研究者通常試圖解釋心理和情感因素在決策者決策過程中的作用,大量的研究結果表明,在決策過程中必須考慮心理和情感因素,能夠解釋效用理論可能產生的一些悖論和非理性現象[29]。在許多心理實驗中,決策者是有限理性的,其主觀決策參考標準直接影響最終的決策結果[30]。例如,假設有一個投擲硬幣的問題,如果硬幣正面朝上,玩家可以贏得5萬美元。否則,玩家將損失5萬美元,雖然這個博弈的預期結果是零,而且是一個完全公平的賭注,但許多實驗表明,大多數人不愿參與這個博弈[30,31]。在存在不確定性信息的眾籌市場中,投資人的支持決策也可能存在類似的涉及心理因素的行為模式,因為投資人在支持眾籌項目的決策中總是存在不確定性和風險。正如Xiao等人[12]的實證研究結果表明,當投資者選擇支持一個新的眾籌項目時,投資者的慣性行為總是存在的。
為了對眾籌融資過程中支持者支持行為的行為因素進行建模,本文采用前景理論來描述風險和不確定性下的決策行為。PT表明最終的結果是用與決策者的參照點相比的得失來表示的,而不是財富的最終狀態,PT引入價值函數來描述決策者的風險態度的影響。作為對傳統效用理論的補充,前景理論闡述了決策者的風險態度如何影響最終結果,并已在決策領域得到證實和廣泛應用[32~34]。例如:Zhu等人[31]提出了一種多參考點的風險決策方法;Wang等人[32]研究了一種基于前景理論的應急群體決策方法;Liu等人[33]建立了基于前景理論的比例分析加全乘法形式的多目標優化方法,并將其推廣到概率語言信息環境中。同時,為了聚合多個項目的相關信息來評價眾籌項目,本文采用Dempster-Shafer理論[25]中的證據推理理論來表示一個特征與眾籌績效之間的關系,并利用ER規則將從特征信息數據中提取的多個證據進行聚合。
2 前景理論和前景投資者
2.1 前景理論
前景理論是由Tversky等人[20]于1992年提出的,通過將心理學研究應用在經濟學中,前景理論為不確定情況下決策者的決策建模作出了突出貢獻。針對長期以來沿用的完全理性人假設,前景理論從實證研究出發,從決策者的心理特質、行為特征入手,揭示了影響選擇行為的非理性心理因素。前景理論認為決策者的決策具有參考依賴以及損失敏感的特性,投資者根據和參考點對比得到的相對的前景收益來分析各種風險方案的收益和損失,并選擇前景收益最大的決策方案[34,35]。
式(1)是前景理論中用來刻畫參考依賴和損失敏感的價值函數v(x)。
v(x)=(x-)α if x-≥0-λ(-(x-))β if x-<0(1)
其中:是決策方案的參考點;x是決策方案某一特征的取值。因此,根據前景理論,x-≥0表示相對于參考點的前景收益,x-<0表示相對于參考點的損失。決策參考點是前景理論中的一個關鍵概念,它關注的是決策結果與預期結果之間的差異,而不僅僅是結果本身。α∈(0,1)和β∈(0,1)是風險態度系數。價值函數v(x)是關于收益(x->0)為凹、損失(x-<0)為凸的s型(值)效用函數。α、β的值越高,說明出資人越容易冒險。λ為損失厭惡系數,當λ>1時,表示出資人對損失風險敏感。
2.2 前景投資者
眾籌研究領域的實證研究已經表明眾籌項目特征信息對于預測項目績效的重要性。然而,眾籌平臺上的產品和項目信息往往是由發起者自行發布的,這引發了信息的不確定性,包括信息造假和不準確的產品描述等問題。這一不確定性和風險源于投資者難以獲得有關眾籌結果、產品質量以及交付時間的準確信息。
此前的研究表明,傳統的效用函數無法很好地解釋決策者在面對不確定性和風險時的異質行為[20]。因此,在眾籌場景中,尤其是存在信息不確定性的情況下,鑒于前景理論已被大量的研究文獻證明能夠用來刻畫決策者在面臨不確定性和風險時的決策行為,在本文中,前景理論被用來深入分析眾籌中支持者的支持決策和效用。前景理論關注決策者在面對不確定性信息時對潛在收益和損失的感知不對稱性,并提供了一個效用決策框架來梳理不確定性條件下的決策過程。前景理論的優勢在于它能夠解釋為何某些支持者更愿意冒險,而其他人則更加保守,以及他們如何權衡潛在的風險和回報。
將前景理論融入眾籌領域的研究,有助于更全面地分析和展示支持者在面對眾籌環境中不確定性信息時的潛在決策行為。這種方法為眾籌平臺的管理和投資者提供了更有效的決策支持工具。具體模型構建邏輯為:每位訪問眾籌平臺的支持者均能觀察并學習與項目相關的信息,并依據前景理論評估項目的效用,最終基于評估出的前景效用作出支持決策。
為了將PT應用于眾籌場景中投資者決策的建模,本文定義決策參考點向量為特征均值。為了說明投資者決策的異質性(如損失和收益的偏好),本文將PT中的價值函數擴展重寫為
vij(Δrij)=θΔrαij if Δrij≥0-λ(-Δrij)β if Δrij<0(2)
其中:Δrij=dij-rj,dij是項目i在特征j上的規范化取值,rj是所有項目在特征j上的均值,也就是特征j的決策參考點。根據所定義的價值函數vij(Δrij),對于相同程度的收益(Δrij>0)或損失(Δrij<0),具有不同收益/損失偏好的決策者(θ,λ)的前景效用值不同,因此,使用前景效用可以很好地刻畫投資者在眾籌活動中的異質性偏好。在實際應用中,眾籌平臺可以根據每個支持者的支持歷史行為,模擬出θ、λ的取值,從而利用式(2)計算支持者的前景效用值,進行有效的個性化推薦服務。投資者信息獲取過程如圖1所示。
綜上,相比于以往的研究方法,除了利用項目相關特征信息對眾籌項目績效進行回歸分析以外,本文利用PT分析在不確定決策條件下的投資者行為,使用PT中的效用函數計算出資人的預期前景效用,從而將投資者效用和眾籌項目特征信息共同作為輸入和眾籌績效進行回歸分析。本文模型不僅能夠用來說明投資者行為在預測眾籌績效方面的貢獻,同時也能為眾籌平臺指定個性化推薦策略提供有效的研究視角。
3 模型建立
本文模型建立包括兩部分內容:a)建立基于神經網絡和重參數方法的稀疏性特征子集選擇,通過加強權值稀疏性來控制眾籌特征子集的大小,并使用帶有重新參數采樣的隨機神經網絡算法,通過檢查和評估各種可能的特征子集來獲得最優特征子集;b)根據步驟a)選出的特征使用2.2節的PT計算每個項目的前景效用值,結合眾籌項目信息和前景效用值對眾籌項目績效進行預測。本文模型建立框架如圖2所示。
3.1 稀疏性特征子集選擇
稀疏性特征子集選擇在限制特征個數的同時提供了對眾籌績效貢獻最大的特征列表,通過使用Kickstarter網站上真實的眾籌項目特征信息數據,稀疏性特征子集選擇可以建模為式(3)的回歸問題。
minw‖Xw-Y‖22
s.t. eTw=10≤wi≤1‖w‖0≤Ki=1,2,3,…,N(3)
其中:X∈Euclid ExtraaBpM×N是M個項目在N個特征上的取值向量;w∈Euclid ExtraaBpN是特征權重向量;e是一個N維的單位矩陣;Y∈Euclid ExtraaBpM表示眾籌項目的籌集資金量,即眾籌績效;約束‖w‖0≤K用于限制模型選取特征的個數為K,即對權重向量進行l0范數約束(權重向量w中非零元素的個數)。
事實上,具有l0范數的優化問題是不可微的,并且已經被證明是NP-hard[24]。本文的創新之一在于引入隨機神經網絡算法來求解上述l0范數優化問題。然而眾所周知,由于反向傳播算法不能應用于不可微函數,具有權值稀疏性的隨機神經網絡會由于不可求導的稀疏性約束變得很難訓練。為了解決此問題,根據隨機梯度估計的最新發展,可以通過重參數采樣的技巧得到梯度的低方差估計,即通過Gumbel-softmax技術,使用重參數化采樣技巧為不可微樣本獲得訓練梯度,從而實現隨機神經網絡算法的反向傳播,并迭代更新參數來搜索最優特征子集。將隨機神經網絡算法與重新參數化采樣技巧結合包括以下三個步驟:
a)參數化采樣。研究目標是從N個特征中選擇最多K個特征,為了更好地理解特征選擇過程,以從袋中取球為例,假設有K個袋子,每個袋子裝有N個球,從索引為i的袋中抽到一個索引為j的球的概率是ρij。為了方便計算,使用獨熱編碼向量來記錄從袋中取球的結果,例如,對于第1個袋子,如果第5個球被選中,則得到一個向量z1=[0;:::;0;1;0;:::],即在向量z1中,第5個元素是1(對應第五個球被選中),其余的都是0。因此,稀疏性特征選擇過程和取球一樣,可以用一個隨機過程來描述: 依次從每個袋子中準確地挑選一個球,并每次記錄球的索引,這保證了最終最多得到K個唯一的索引,通過索引就能獲取其對應的眾籌項目特征。因此,最終模型輸出K個向量,即{z1,z2,…,zK}∈(N×K)。將每個zi進行加和,得到一個長度為N的向量z=∑Ki=1zi,其中最多K個元素是非零的,其表示的是相應的特征應該被選取。在模型訓練優化上述過程中涉及到的輔助變量是有界的,即ρij∈(0,1),而神經網絡算法的參數是沒有約束的,故需要引入一個無約束變量S作為輸入來得到ρij,即給定輸入S∈Euclid ExtraaBpK×N,ρij=exp(Sij)∑jexp(Sij)。同時,神經網絡訓練時關于各特征的權重向量w也是隨機生成的輸入向量=[1,2,…,N],同樣不受約束,為了滿足式(3)中對于權重向量w的約束,通過無約束的隨機值輸入得到最后的權重輸出w,步驟如下:(a)=exp()=[exp(1),exp(2),…,exp(N)];(b)=ΘZ(Θ表示克羅內克內積運算;(c)w=i∑ii。
b)梯度估計。通過重參數采樣,可以將特征權重w看作是由一個隨機函數w=f(w,S,ε)產生的,ε表示抽樣過程(特征選擇過程)引入的隨機性。隨機生成函數w=f(w,S,ε)理解為具有離散隱藏神經元Z的隨機神經網絡,通過神經網絡訓練即可得到最終的特征權索引和對應的權重向量。然后,隨機生成函數中的向量Z和ρ是離散的,而擁有離散神經元的隨機神經網絡由于缺乏梯度而變得難以訓練,因為神經網絡中的反向傳播算法需要可微神經元進行梯度更新和迭代。為了解決這個問題,即在訓練神經網絡時獲得有效的梯度,使用Gumbel-softmax技巧[24]以及straight through(ST)梯度估計器[28]為優化Z和ρ時提供有效梯度,如式(4)所示。
z=softmax(g+log(ρ))(4)
其中:g=[g1,g2,…,gN]是從Gumbel(0,1)抽取的隨機樣本。式(4)背后的動機是將可訓練變量ρ從純噪聲g中“分離”,以便對分布參數取隨機樣本的梯度成為可能。舉一個簡單的例子,考慮從高斯分布z~N(μ,σ2)采樣,并計算導數zu、zσ。如果直接對高斯分布N(μ,σ2)采樣,梯度的計算很困難。然而,如果進行以下采樣: (a)從一個標準的高斯分布采樣ε,ε~N(0,1);(b)計算z=u+εσ,則計算梯度zu、zσ是很容易的。重新參數化技巧的詳細證明可以在Zhang等人[23]的分析中找到。
c)算法優化求解。經過以上兩步,可以得到特征的權重向量w。通過使用運算符‖Xw-Y‖22作為損失函數,并使用模擬退火算法更新所有參數,得到最終滿足式(3)所有約束的最優參數值。圖3概述了上述稀疏性特性子集選擇的優化流程。
3.2 支持者的前景效用
基于3.1節所選的特征子集,本節將PT應用于所選特征的支持者的前景效用模型,并使用ET聚合候選眾籌項目的多個特征效用。假設投資者根據他們的前景效用作出融資決策,關于前景投資者的詳細信息見2.2節。在前景投資者的假設下,項目特征的價值在計算投資者的前景效用中發揮重要作用,從而影響投資者支持項目的決策。由于所選特征的類型和度量單位不同,為了便于比較和計算,本文首先對特征的值進行歸一化處理。假設特征的規范化值是dij,則定義以下規范化規則:
dij=max dj-dijmax dj-min dj(5)
其中:max dj=max{dij,i=1,2,…,M};min dj=min{dij,i=1,2,…,M}。值得注意的是,不同的決策者對利益和風險的偏好不同,這反映在面對相同的利益或風險時,他們的預期效用并不總是完全相等的。考慮到這一差異,基于特征值矩陣D=[dij]M×N和決策參考點向量R=[rj]1×N,本文中項目i在特征j上的前景值矩陣V=[vij]M×N可以按照式(6)進行計算:
vij(Δrij)=θΔrαij if Δrij≥0-λ(-Δrij)βif Δrij<0(6)
其中:Δrij=dij-rj,rj是特征j上所有項目的平均值。當α=β時,對于收益或損失值為Δrij時,具有不同λ和θ值的決策者具有不同的值。為了綜合所有特征信息得到項目pi的綜合前景值,使用證據推理理論的框架,即將方案pi在特征fj上的vij前景價值作為項目pi達到預期值的證據之一。
4 實證分析
本章針對提出的眾籌項目評估預測模型進行了實證研究。數據來源于Kickstarter網站,Kickstarter成立于2009年,是歷史最悠久、規模最大、最受歡迎的眾籌平臺[36]。以往大多數研究都是使用Kickstarter平臺的數據集,因此本文也采用Kickstarter網站上的數據,以保證研究結果可靠且具有可對比性。
4.1 實驗數據信息
數據收集分為兩個主要步驟。首先,利用專門開發的爬蟲工具從Kickstarter網站定期抓取新發布的實時項目,頻率為每天一次;接著,基于這些實時項目數據,進一步提取早期項目的相關信息。項目的簡介頁面不僅顯示了項目所有者的歷史記錄,還提供了投資者的詳細信息,包括他們支持的其他項目。本文的數據樣本范圍覆蓋了2009年—2014年11月期間的所有項目。在篩選項目時,排除了正在進行、被取消或暫停的項目。參考以往的研究[36],考慮到資金規模非常小或非常大的項目可能與主流項目有顯著差異,進一步篩除了資金目標在100以下或1 000 000以上的項目。最終,數據樣本涵蓋了15個資助類別,總計151 752個項目。有關數據詳情和特征信息如表1和2所示。
4.2 模型評價
為了展示模型的有效性,基于邏輯回歸模型構建了四個預測模型,邏輯回歸模型在二值分類中被廣泛使用,并與支持向量機等傳統分類模型有著相似的預測性能[36]。首先,采用了Zhou等人[36]的研究特征作為基準預測模型(模型1)。接著,基于第3章提出的效用研究框架,計算基準模型的每一個特征,得到其前景效用特征,加入模型1形成了基準模型+CPT(模型2)。最后,為了驗證重參數方法在特征選擇上的優勢,通過加強權值稀疏性來控制眾籌特征子集的大小(選擇的特征個數為9和13),進行了進一步的效果檢驗(模型3和4),即K={9,13}。模型3和4構建的邏輯如下:a)通過3.1節提出的方法控制特征的個數;b)根據a)選出的特征使用PT計算每個特征的前景效用值,即輸入為原特征和特征的前景效用值。模型3和4與模型2的不同之處在于,模型3和4進行了輸入特性個數限定這一步處理。
為了解決樣本不平衡問題,利用imblearn模塊的SMOTE對實證檢驗中的數據進行抽樣,訓練集和測試集的樣本分布情況如表3所示。
為了展示預測效果,使用混淆矩陣來度量本文模型的性能。混淆矩陣是一個兩行兩列的表,表示真陽性(TP)、假陽性(FP)、假陰性(FN)和真陰性(TN)的數量。舉例來說,如果一個本來就屬于成功的眾籌項目,被預測為成功,則被認為是真陽性,如果被歸類為失敗,則被算作假陰性,反之亦然。在預測性能上來說,本文用accuracy(Acc)、F1-score和area under curve(Auc)三個性能指標來評價模型的預測性能。
recall=TPTP+FN, precision=TPTP+FP
accuracy=TP+TNtotal, F1=21precision+1recall(7)
其中:Acc是指精確度或準確率,表示模型正確預測的實例與總體實例之間的比率;F1分數是precision(精確率)和recall(召回率)的調和平均值,它試圖平衡這兩個指標。是衡量分類器正確的頻率。Auc的取值在0.5(等于隨機猜測)~1.0(完美分類器)。一個模型的Auc值越接近1.0,表示該模型的性能越好。根據表3中的數據,四個模型預測指標如表4所示。
首先,由表4可知,與模型1相比,模型2通過行為分析的效用模型,在Acc、F1和Auc指標上分別提高了3%、3%和2%。從決策建模來看,本文提出的基于前景理論投資分析過程考慮了投資者在不確定性決策過程的行為特征,提供了關于決策者對風險和損失的感知方式的理論基礎,從而有助于更精確地模擬支持者的投資決策過程,實現了模型預測效果的提升。其次,表4的結果表明,平均而言,與模型1相比,本文提出的具有稀疏特征選擇的模型(模型3、4)在Acc、F1和Auc指標測度上分別提高了11.5%、10.5%和12.5%。從特征選擇來看,本文提出的以稀疏特征選擇代替所有特征作為初始特征輸入能夠減少特征維度,使模型更集中地關注對決策產生影響的關鍵特征,避免了維度災難和過擬合的問題。這與特征選擇理論和機器學習中的維度縮減方法一致,有助于提高模型的泛化性能,從而在Acc、F1和Auc等指標上實現明顯的改進n2+DMN1YY2LdZm+ZllzTMQ==。
綜上所述,本文模型在Acc、F1和AUC等指標上表現優于基準模型。為進一步詳細地驗證實證結果,圖4展示了本文模型的ROC曲線。ROC曲線揭示了在各種閾值設置下真陽性率與假陽性率的變化關系,進一步證實了本文模型的效用和有效性。
如圖4(a)和(b)所示,相較于模型1,新提出的模型(模型2、3、4)的ROC曲線更接近左上角。這種趨勢表明,這些模型在維持較高的真陽性率的同時,成功降低了假陽性率。這一性能表現意味著在實際應用中,當項目所有者考慮調整項目配置或評估其融資成功的可能性時,使用所提出的模型會更為有效和準確。同時,為了檢驗本文所提出的基于行為效用分析模型的穩健性,使用KNN(K-nearest neighbor)和NB(naive Bayes classifier)模型進行預測分析(表5)。由表5可知,相比于其他算法,本文提出的效用+稀疏性方法(模型3和4)在預測指標上表現突出。
5 結束語
基于前景理論,從決策行為出發,構建了眾籌場景中投資者的前景效用決策模型,并進一步引入了特征選擇過程,揭示了行為相關因素影響出資人支持決策的路徑和機理。在互聯網眾籌融資的研究背景下,識別和建模項目信號觀察以及出資人對不確定性和風險的偏好兩種行為因素。從決策過程來看,首先每位投資者獲取并了解項目信息,然后基于PT模型評估項目的前景效用,最后作出支持決策。為了模擬上述的投資者的決策,模型分為兩個主要步驟:稀疏特征子集的選擇以及眾籌項目的評估與預測。考慮到眾籌平臺和項目創作者資源有限,使用權重稀疏性控制特征子集的大小,并評估這些特征如何影響項目評估與預測。
通過實證檢驗,本文確定了影響出資人支持行為的因素,并量化了投資者前景預期效用。從決策建模來看,本文提出的基于前景理論投資分析過程考慮了投資者在不確定性決策過程的行為特征,提供了關于決策者對風險和損失的感知方式的理論基礎,從而有助于更精確地模擬支持者的投資決策過程,實現了模型預測效果的提升。從特征選擇來看,本文提出的以稀疏特征選擇代替所有特征作為初始特征輸入能夠減少特征維度,使模型更集中地關注對決策產生影響的關鍵特征,避免了維度災難和過擬合的問題。這與特征選擇理論和機器學習中的維度縮減方法相一致,有助于提高模型的泛化性能,從而在實證指標上實現明顯的改進。
1)研究啟示
a)為眾籌平臺提供評估工具。通過深入識別和量化投資者行為因素,本文提供了一個綜合的眾籌評估與預測模型。分析結果揭示,投資者在作出決策時,其對不確定性和風險的偏好也起到關鍵作用。與傳統的基線模型相比,本文模型能更準確地預測眾籌成功的可能性,并在F1和Auc指標上表現出眾。因此,眾籌平臺在推薦項目時應考慮這些行為因素,這將有助于提高眾籌成功率并增加預期利潤。
b)為發起者提供策略指引。發起者應持續關注項目的動態特征,努力吸引投資者的關注,從而獲得融資資金。以往的研究,如文獻[6,12],主要從支持者的角度探討了如何預測項目的成功率。更深入地,本文模型結合了出資人的前景效用和項目相關特性,這種方法為發起者提供了一個動態工具,幫助其更好地理解和模擬潛在出資人的支持行為。隨著項目進展,特定的項目特征和投資者的偏好可能會發生變化,本文模型為發起者提供了新的策略思路,幫助他們應對這些變化,提高項目的成功率。
2)不足及未來研究方向
盡管本文為新興金融市場提供了有益的見解,但存在一些不可忽視的局限性,并留下了未來研究的可能方向。首先,建立了基于PT的出資人行為決策模型,探討了出資人行為因素如何影響眾籌的評估和預測。但在線眾籌市場上的出資人行為模式還未得到深入探討。為此,未來研究可以模擬資助人的行為模式,例如通過追蹤其資助記錄,從而為其行為決策提供更細致的見解。
其次,本文提出的眾籌評估模型聚焦于出資人行為決策,忽略了一些可能影響決策的外部因素,如眾籌項目頁面的大小、項目所處的位置,以及出資人瀏覽頁面的時間等。在未來的研究中,考慮這些因素并納入分析將使模型更為全面。
最后,盡管眾籌項目的圖片中包含了豐富的信息,由于技術挑戰,本文尚未能充分利用圖片中的信息。但根據某些研究,將用戶提供的照片與評論文本結合在預測上有更好的表現,如在線酒店評論的有用性方面。因此,未來有必要構建一個同時考慮眾籌項目圖片信息的眾籌績效分析模型。
參考文獻:
[1]顧永跟, 于再溥, 陶杰, 等. 基于眾籌預售和眾包生產的兩階段最優定價機制[J]. 計算機應用研究, 2023, 40(8): 2423-2428. (Gu Yonggen, Yu Zaipu, Tao Jie, et al. Two-stage optimal pricing mechanism based on crowdfunding pre-sales and crowdsourcing production[J]. Application Research of Computers, 2023, 40(8): 2423-2428.)
[2]黃健青, 黃曉鳳,殷國鵬. 眾籌項目融資成功的影響因素及預測模型研究[J].中國軟科學,2017(7): 91-100. (Huang Jianqing, Huang Xiaofeng, Yin Guopeng. Factors influencing the success of crowdfunding projects and research on predictive models[J]. China Soft Science, 2017(7): 91-100.)
[3]劉征馳, 周莎. 個體認知, 群體共識與互聯網眾籌投資績效——基于計算實驗方法的研究[J]. 管理評論,2022, 34(10): 24-36. (Liu Zhengchi, Zhou Sha. Individual cognition, group consensus, and Internet crowdfunding investment performance — a study based on computational experimental methods[J]. Management Review, 2022, 34(10): 24-36.)
[4]Afsaneh B, Hasti C, Sarah K. Deterrents of tourism business crowdfunding: aversion decision and aversion behavior[J]. International Journal of Hospitality Management, 2020,88: 102517.
[5]Kim M J, Hall C M. Investment crowdfunding in the visitor economy: the roles of venture quality, uncertainty, and funding amount[J]. Current Issues in Tourism, 2020, 23(20): 2533-2554.
[6]Du Qianzhou, Li Jing, Wang Gang, et al. Predicting crowdfunding project success based on backers’ language preferences[J]. Journal of the Association for Information Science and Technology, 2021,72(12):1558-1574.
[7]Kaur H, Gera J. Effect of social media connectivity on success of crowdfunding campaigns[J]. Procedia Computer Science, 2017, 122: 767-774.
[8]Chemla G, Tinn K. Learning through crowdfunding, forthcoming[J]. Management Science, 2019,66(5):3278.
[9]Strausz R. A theory of crowdfunding: a mechanism design approach with demand uncertainty and moral hazard[J]. American Economic Review, 2017,107(6): 1430-1476.
[10]Ryoba M J, Qu Shaojian, Zhou Yongyi. Feature subset selection for predicting the success of crowdfunding project campaigns[J]. Electronic Markets, 2020,31(3):1-14.
[11]Parhankangas A, Renko M. Linguistic style and crowdfunding success among social and commercial entrepreneurs[J]. Journal of Business Venturing, 2017, 32(2): 215-236.
[12]Xiao Shengsheng, Yue Qing. Investors’ inertia behavior and their repeated decision-making in online reward-based crowdfunding market[J]. Decision Support Systems, 2018, 111: 101-112.
[13]Kuhnen C M, Miu A C. Socioeconomic status and learning from financial information[J]. International Journal of Finance & Economics, 2017, 124(2): 349-372.
[14]Foucault T, Fresard L. Learning from peers’ stock prices and corporate investment[J]. Journal of Financial Economics, 2014, 111(3): 554-577.
[15]Kaniel R, Parham R. WSJ Category Kings-the impact of media attention on consumer and mutual fund investment decisions[J]. International Journal of Finance & Economics, 2017, 123(2): 337-356.
[16]Ahmad Z, Ibrahim H, Tuyon J. Behavior of fund managers in Malaysian investment management industry[J]. Qualitative Research, 2017, 9(3): 205-239.
[17]Sen Ri, Tumarkin R. Stocking up: executive optimism, option exercise, and share retention[J]. Journal of Financial Economics, 2015, 118(2): 399-430.
[18]Menkhoff L, Schmeling M, Schmidt U. Overconfidence, experience, and professionalism: an experimental study[J]. Journal of Economic Behavior & Organization, 2013, 86: 92-101.
[19]Wei Ju, Yang Yongxin, Jinag Mingzhu, et al. Dynamic multi-period sparse portfolio selection model with asymmetric investors’ sentiments[J]. Expert Systems with Applications, 2021, 177: 114945.
[20]Tversky A, Kahneman D. Advances in prospect theory[J]. Journal of Risk and Uncertainty, 1992, 5(4): 297-323.
[21]Wang Tianxing, Li Huaxiong, Zhou Xianzhong, et al. A prospect theory-based three-way decision model[J]. Knowledge-Based Systems, 2020, 203: 106129.
[22]Kahneman D, Tversky A. Prospect theory: an analysis of decision under risk title[J]. Econometrica, 1979, 47(2): 263-291.
[23]Zhang Haisu, Chen Weizhi. Backer motivation in crowdfunding new product ideas: is it about you or is it about me[J]. Journal of Pro-duct Innovation Management, 2018, 36(2): 241-262.
[24]Yang Yongxin, Zheng Yu, Timothy M H. Diversity and sparsity: a new perspective on index tracking[C]//Proc of IEEE International Conference on Acoustics, Speech and Signal Processing. Piscataway,NJ:IEEE Press, 2020.
[25]Dempster A P. Upper and lower probabilities included by a multi-valued mapping[J]. Annals of Mathematical Statistics, 1967, 38(2): 325-339.
[26]Colombo M G, Franzoni C, Rossi-Lamastra C. Internal social capital and the attraction of early contributions in crowdfunding[J]. Entrepreneurship Theory and Practice, 2015, 39(1): 75-100.
[27]Mollick E. The dynamics of crowdfunding: an exploratory study[J]. Journal of Business Venturing, 2014, 29(1): 1-16.
[28]Wu Wenqing, Fu Mingxia, Zhao Liming. Successful factors and herding phenomenon of crowdfunding[J]. Soft Science, 2016, 30: 5-8.
[29]Lars P M, Marc O R. Non-cooperative games with prospect theory players and dominated strategies[J]. Games and Economic Behavior, 2019, 115: 396-409.
[30]Zhou Xiaoyang, Wang Liqin, Liao Huchang. A prospect theory-based group decision approach considering consensus for portfolio selection with hesitant fuzzy information[J]. Knowledge-Based Systems, 2019, 168: 28-38.
[31]Zhu Jianjun, Ma Zhenzhen,Wang Hehua,et al. Risk decision-making method using interval numbers and its application based on the prospect value with multiple reference points[J]. Information Sciences, 2017, 385-386: 415-437.
[32]Wang Liang, Wang Yingming, Martinez L. A group decision method based on prospect theory for emergency situations[J]. Information Sciences, 2017, 418-419: 119-135.
[33]Liu Peide, Li Ying. An extended MULTIMOORA method for probabilistic linguistic multi-criteria group decision-making based on prospect theory[J]. Computers & Industrial Engineering, 2019, 136: 528-545.
[34]Bao Tiantian, Xie Xinlian, Long Peiyin. MADM method based on prospect theory and evidential reasoning approach with unknown attribute weights under intuitionistic fuzzy environment[J]. Expert Systems with Applications, 2017, 88: 305-317.
[35]Voorbraak F. A computationally efficient approximation of Dempster-Shafer theory[J]. International Journal of Man Machine Studies, 1989, 30(5): 525-536.
[36]Zhou Mi, Lu Baozhou, Fan Weiguo, et al. Project description and crowdfunding success: an exploratory study[J]. Information System Frontiers, 2018, 20(2): 259-274.