謝贛紅 陸思豪
(1.青海民族大學經濟與管理學院,青海 西寧 810007;2.廣西師范大學經濟管理學院,廣西 桂林 541006)
開放創新概念的提出對學術界和企業創新發展都產生了深刻影響。開放創新指企業不能僅依靠其內部創新,即很多大企業所依賴的垂直整合體系[1]或傳統營銷認為的企業創造價值然后傳遞給用戶[2],而是企業需要突破組織邊界,從外部吸納更多創新想法與解決方案,讓用戶成為與企業一起創造價值的群體,最終推動企業創新發展,實現創新成功[3]。對產品創新時,企業研發團隊會受實際生活中使用產品經驗影響,形成固定思維方式,阻礙創新[4]。因此企業讓更多外來者參與企業創新,有利于吸收適合的想法和方案[5]。
開放式用戶社區是企業實現開放創新機制的一種重要方式,在社區中志同道合的用戶之間相互交流各自的經驗、技術和知識等,增加了社區用戶提出創新想法的可能性。但社區中如果該類用戶創新過多,就會出現信息過載反而阻礙企業發展,企業績效會因此下滑[6],這是因為企業如果處理過多創新信息,成本會大幅提高,過多創新信息對企業接納用戶創新的能力形成巨大挑戰。所以為能夠更加快速、準確獲得最好的用戶創新想法或方案,必須識別出用戶社區中具有某一特征的人群,而最具這一特征的人群就是領先用戶。
領先用戶的概念于1986年Von Hippel首先提出[7],之后這一人群具有的特征從領先于市場趨勢和高預期收益這兩個主要特點延伸到社區資源分享、具有相關產品知識和產品體驗以及作為意見領袖等。也正是基于這些特征,該用戶群體既是用戶創新的重要組成部分,同時也能幫助企業開發更多具有商業吸引力的創新產品。領先用戶的創新優勢,還能幫助企業提高接納用戶創新信息與知識的能力。但領先用戶是稀缺的,需要在大規模的人口中篩選,在開放式用戶社區也不例外。所以,如何識別領先用戶成了關鍵問題。
傳統領先用戶識別方法包括大規模篩選法、廣播法、眾包法和金字塔法等。這里著重討論大規模篩選法以及金字塔法這兩種方法,因為這兩種方法影響廣泛且都出現在互聯網時代前,是企業識別線下領先用戶的主要方法。他們并不一定適用于線上開放式用戶社區,但作為最基本的方法,在無法掌握先進計算機方法的情況下,仍可作為備選的重要方法,所以需分析和掌握。
大規模篩選法是常見的,傳統的領先用戶識別方法,應用在許多實證研究中,通常是通過問卷調查、訪談等統計調查方式收集數據,對人群逐個調查訪問,從而篩選出領先用戶。
該方法優點是易于實施,使用廣泛,也較為成熟,所以操作簡單方便,研究者不用經過專業培訓。因此實施大規模篩選法的研究者可以迅速篩選和找到領先用戶。如果在線上開放式用戶社區中實施,則需與網站管理人員溝通,獲得許可后,在網站張貼問卷進行調查,之后再對問卷分析,篩選出領先用戶。但該方法具有過程瑣碎、成本高、效率低、難以執行等缺點。首先由于領先用戶的稀缺性,需要對足夠多的人群進行篩選;其次隨著待篩選人數越來越多,發放問卷與訪談工作會瑣碎繁雜,需要投入的人力物力也愈多,篩選成本隨之增加,篩選效率愈加低下[8],因此該方法難以實現有效執行,這是該方法矛盾之處。在一項實證研究中,待篩選的2 043人中最終篩選出的領先用戶僅22人,樣本效率低至1.1%[9],意味著樣本效率有很大提升空間。因此該方法無法適用于人數較多的線上開放式用戶社區。
金字塔法源自滾雪球法,滾雪球法是從少數具有稀有特性的人開始,指認自己可能認識的具有相似罕見特性的人,所以獲得的人群越來越多,雪球越滾越大。金字塔法則是基于少數具有稀有特性的人群,尋找到具有更多相似稀有特性的人,是從金字塔底部爬向頂部的過程[10]。
金字塔法效率高,工作量少。金字塔法的實證研究結果表明金字塔法的識別效率高,且如果在更加寬松的條件下,金字塔法工作量會繼續大幅減少,意味著金字塔法相較大規模篩選法在效率方面有了很大提升[11]。這是因為金字塔法是串聯的訪談或問卷調查過程,前面的調查結果串聯著之后的調查結果,即可以將前一次或前幾次的訪談或問卷獲得結果都用于下一次或之后所有訪談或問卷調查[12]。這種連續行為就是“爬山策略”,通過該策略,研究者最終可以達到最高點,即找到最具稀有特性的人群[13]。
但金字塔法從人群中通過“爬山策略”尋找領先用戶的特點,使其只能在樣本較小的情況下使用,如一些較為微觀的環境中或人數較少的某個組織或者群體中篩選。但考慮到領先用戶的稀缺性,在識別領先用戶時需篩選較多人數。而在線上開放式用戶社區中,因為金字塔法也是問卷調查或者訪談,所以很有可能漏掉領先用戶,或也受到研究者主觀偏差的影響,即研究者認為自己找到了最具稀有特性的人或者人群,但是實際上并非如此。所以使用金字塔法在線上開放式用戶社區中難以找到特定的具有稀有特性的人群。
互聯網的迅速發展,推動了在線社區、博客等社交媒體的出現和發展,且這些社交媒體逐漸成為領先用戶重要來源。而在線社區領先用戶不僅提出創新想法,還與社區其他用戶交流和分享知識[14],因此基于網絡志法識別領先用戶成為研究熱點。網絡志法是將原本的民族志和互聯網混合而形成的新方法概念,可以在在線社區等網絡社交媒介系統中收集數據并分析[15]。
首先,網絡志法收集到的數據客觀性強。網絡志法收集數據的方式與大規模篩選法、金字塔法通過問卷調查或者訪談獲得數據有一定區別,因為社區中用戶會就創新問題互相交流和分享,還會互相幫助,促進了集體創造力在社區中的實現,也為研究者觀察社區中用戶自然行為提供了條件。研究者在不影響用戶活動的前提下,被動接收用戶活動和對話[16],保證了數據的客觀和真實。此外,由于社區內用戶志同道合的特征,社區內用戶間比熟人社交具有更高認同感,以及由此產生用戶間的信任感,導致用戶間的交流反饋也是獨一無二的[17],因此相比于問卷調查和訪談,網絡志法可以獲得更多有價值的信息數據。最后,網絡志法相比傳統民族志在過程和復雜程度上更低,與其他傳統的領先用戶識別方法相比,效率更高、成本更低。在實證研究中,研究者使用網絡志法在德國可持續消費網站的食品板塊識別領先用戶[16],結果表明網絡志法有著更高的篩選效率,以及更低的篩選成本。
綜上,通過網絡志法,對用戶社區內部的公開數據進行分析這一過程,與當今的網絡技術發展相契合,值得推廣。有研究者對德國識別領先用戶的公司案例和項目使用的領先用戶識別方法進行研究[18],發現所有項目中有近一半都使用網絡志法,表明網絡志法在國外識別領先用戶領域的普遍性。
首先,網絡志法獲得的數據來源狹隘。該方法只對在線用戶社區進行關注,這種較窄的關注范圍會對未來創新的推廣造成一定限制。其次,網絡志法對研究者的要求較高。需要研究者有著敏銳的觀察力、豐富的經驗和較高的技能,因為分析網絡志的數據在很大程度上受到人主觀性的支配,不同的研究者面對同一個情景可能會有不同的觀察結果,只有通過準確的觀察,才能發現隱藏的領先用戶[15],否則可能會錯過。最后,網絡志法需要人工收集和分析數據,依然需要花費數周的時間[16],時間成本、人力成本高。
上述網絡志法的優點和缺點的分析表明網絡志法相比傳統識別方法更適用于線上領先用戶識別,但依然要花費大量時間和人力,需要更智能的方法分擔人力工作和減少工作時間,因此下面討論基于網絡志法的人工智能識別方法。
近年來,研究者發現使用計算機技術識別領先用戶也是很好的辦法,進化計算法就是其中的一個。該方法使用了計算機爬蟲技術爬取研究數據,之后使用多種優化算法模型識別領先用戶,所以被稱為進化計算法。這個方法基于網絡志法,同樣是對在線社區內的內容進行收集分析,但是在收集數據方面更加自動化和智能化,識別領先用戶則更加精準。
首先,進化計算法使用爬蟲技術收集數據,更加自動化、智能化。相比于人工進行數據收集,進化計算法使用了計算機爬蟲技術,這樣可以自動收集數據,節省了很多人力、時間等成本。其次,進化計算法分析數據的算法更加優化,識別領先用戶更加精準。數據分析使用了計算機的優化判別方法,這個方法除節省成本和提高識別效率外還解決了由領先用戶特點導致的零膨脹問題。由于領先用戶的稀有性,在大樣本中非領先用戶的比例會很高,這就會產生零膨脹現象,最終導致有參數估計的偏差[19],而優化判別方法可以通過優化分類判別解決該問題。在實證研究中,研究者使用模擬退火算法、遺傳算法和粒子群優化算法進行領先用戶識別,然后進行比較分析[20],結果表明遺傳算法和粒子優化算法的結果更優,這兩種算法進一步優化了分類判別,表明使用優化判別方法必要性。
進化計算法無法自我學習,不夠智能化和自動化。優化判別方法雖然屬人工智能,但是相比支持向量機、隨機森林等機器學習方法,該方法依然不夠智能化、自動化,無法實現機器的自我學習,只在收集數據方面實現了自動化、在分類算法上有了改進和優化。
FLUID是快速識別領先用戶方法(Fast Lead User Identification)的英文縮寫,是在網絡志法的基礎上,為了提高識別效率,降低識別成本,使用更加先進的計算機技術(主要包括數據挖掘、機器學習和深度學習等),自動收集數據并識別領先用戶的方法[21]。
首先,FLUID法精確度高。在以Twitter為媒介搜集數據的實證研究中,研究者分別通過隨機森林算法和序列最小化算法(SMO)生成分類模型,結果表明隨機森林算法支持的分類器結果明顯更好。同時,在驗證集總準確度達到了80%,而經過專家確認的驗證集精度達到了0.579,說明了FLUID法具有很好的精確性[21]。其次,FLUID法效率更高、成本更低。另一個在Twitter社交平臺使用FLUID法識別領先用戶的實證研究中,研究者使用決策樹C4.5算法對用戶進行分類,同時通過問卷調查收集被調查者數據作為訓練集[22]。最終結果表明,包括領先用戶在內的訓練集準確率為98%,而精確率則達到了90%,召回率則達到了100%,由此證實了決策樹C4.5算法支持的分類器有效性,同時驗證了FLUID法相比于問卷調查法,效率更高、成本更低。最后,FLUID法更加智能化、自動化。上述兩個實證研究都實現了機器的自我學習,收集和分析數據更加智能化和自動化,代替了人工重復性工作,減少了研究人員工作負擔。
以上的分析表明了FLUID法相較之前的領先用戶識別方法具有精確度更高、效率更高、成本更低和智能化、自動化程度更高的優勢,因此FLUID法可以幫助企業降低識別領先用戶的時間及其他資源成本,并大幅提高了領先用戶的識別效率。
首先,使用FLUID法的研究者需要進行跨學科專業培訓。FLUID法的困難之處在于該方法的應用是跨學科的。對于管理學的研究者來說,研究者需要對數據挖掘、機器學習等人工智能知識有著較為充分且深入的了解,并且掌握實際的數據分析操作,因此研究者需要通過較為專業的訓練,成為跨學科的實踐者。
其次,算法需要進一步比較優化。實證研究表明不同算法支持的分類器最終分類效果不同。在上述的實證研究中,研究者們使用了隨機森林算法、序列最小化算法以及決策樹算法,其中隨機森林算法和決策樹算法都表現出了較好的效果。這也表明需要對不同智能化算法繼續探究,使FLUID法在實際中能進一步推廣與應用。基于此,需要進一步探究使用FLUID法的具體內容,從而確保通過FLUID方法,采用不同算法,實現領先用戶識別。
領先用戶識別方法的發展歷程及趨勢如圖1所示。在互聯網興起前,大規模篩選法運用廣泛且相對成熟,且實行人員不需要經過專業培訓,但同時該方法篩選效率低下,成本高;相比于大規模篩選法,金字塔法效率更高、成本也低,但只適用于樣本量較小的情況,很難在樣本量較大的用戶社區中進行識別。而隨著互聯網的興起,融合民族志與線上用戶社區的網絡志法的出現,推動了領先用戶識別方法向著高效率篩選的方向發展,且網絡志法獲得數據更加的客觀,價值更高,獲取數據方式也變得愈加智能化,但是也提高了對實行人員的技術性要求;而不久之后人工智能的興起推動了領先用戶識別方法向著更加智能化和精確化的方向發展,進化計算法減少了識別誤差,提高了識別的精確性;而FLUID法則更加智能化、自動化,可以實現機器的自我學習,篩選效率也更高,但是對實行人員的跨學科應用水平提出了更高的要求,同時需要對算法進一步對比分析和優化。

圖1 領先用戶識別方法的發展歷程與趨勢
相比之下,FLUID法更加適合目前人工智能背景下的線上開放式用戶社區中的領先用戶識別,且效率更高、成本更低,雖然實行人員需要進行跨學科專業培訓,但是這也符合現在復合型人才培養趨勢。
5.2.1 可能性方案流程
FLUID法的流程主要總結為以下4個步驟:第一步確定識別的目標范圍,第二步選定領先用戶識別的地點,第三步自動識別領先用戶,第四步領先用戶參與到企業的創新過程中[22]。具體參考過往FLUID法流程,設定領先用戶識別流程:第一步確定識別的產品或品牌;第二步確定有關產品或品牌的用戶社區,可以具體到社區中的板塊;第三步選取領先用戶特征;第四步搜索并自動爬取社區中領先用戶特征數據,然后進行數據清洗;第五步通過機器學習模型進行數據分析,具體包括構建模型、劃分訓練集和測試集等;第六步檢驗識別方法的可靠性,通過網絡志法人工分類領先用戶和非領先用戶,與機器學習結果組建混淆矩陣;第七步確定領先用戶。其中第一、第二步選擇建立有線上開放式用戶社區的產品和品牌,即以品牌為中心的用戶社區或獨立社區,要求選取的社區中用戶的內容信息和行為數據源都是充分的,足以用來研究,如果選取的社區中數據不充分,那么需要從第二步返回到第一步重新選擇需要識別的產品或品牌;第四步搜索和爬取領先用戶特征數據,包括內容信息和行為數據兩個方面;第五步可以通過機器學習中不同的學習方式,包括監督性學習和半監督性學習,以及深度學習等,對比分析結果;第六步將使用網絡志法的人工分類結果與其對比,形成混淆矩陣是必要的,但如果在同一個社區中可靠性檢驗多次有效,那么就可以不再花費更多的時間和精力在人工分類上。
5.2.2 可能性方案提取的領先用戶特征
選取領先用戶特征是領先用戶識別方法的重要環節,影響著最終是否能夠正確識別出領先用戶。在過往的網絡志法中經常使用的領先用戶的特征包括:領先于市場的趨勢、對現有產品的不滿、擁有更多的與產品相關的知識、有相關產品的使用經驗、更高的用戶社區參與度以及是用戶社區中的意見領袖[23-24],而這些用戶特征也應用在其他領先用戶識別方法中。此外在FLUID法中經常使用的領先用戶特征有:中心性、活動性、相關性和情緒性[21]。因此可以將領先用戶特征進一步歸類為用戶集體性、用戶相關性、用戶情緒性、用戶專家性和用戶領先性。
首先,未來隨著人工智能技術的發展,特別是自然語言處理方向的進一步突破,將為在互聯網時代,需要更多從在線社區用戶發布文本內容中提取信息的FLUID法,提供更加強有力的支撐,同時也促進了對文本內容分析方法的多樣化,從而使研究者可以在海量的文本數據中更好更快地識別出領先用戶,而不僅僅是行為數據。其次,培養研究領先用戶的管理學者跨學科能力刻不容緩,需要進一步學習人工智能的不同方法,特別是自然語言處理、機器學習和大數據等,與管理學的研究方法深度融合,增強領先用戶研究的創新性,探索學科融合的前沿。