劉 暢,梅洪常
(重慶工商大學管理學院,重慶 400067)
隨著大數據在社會經濟發展中越來越重要,我國在“十三五”規劃(2016—2020 年)中明確指出大數據是一種基礎性戰略資源,其利于產業升級。大數據企業便是在此類國家政策的號召之下出現的新興企業,其業務集中于數據資源的采集、存儲、分析及應用[1]。為更好發揮大數據企業在產業升級中的作用,有必要認清我國大數據企業發展現狀。相關研究表明,雖然我國大數據企業增速快,有著巨大發展潛力[2],但趙傳仁等[3]學者研究發現近年來大數據企業的全要素生產率為負增長,并指出主要原因在于技術效率不足。因此本文主要從中低技術創新水平大數據企業的主要影響因素出發,以采取“補短板”方式提升我國大數據企業的整體技術創新水平,以改善大數據企業的生產力較低局面,進而增強大數據企業在產業升級和促進數字經濟與實體經濟融合中的重要作用。
目前直接關于大數據企業技術創新影響因素評價的研究較少。為進一步認識與提升大數據企業技術創新能力,本文基于技術創新理論和大數據數量極大(volume)、類型繁多(variety)、增長與處理速度快(velocity)及價值密度低(value)的4V 特點[4],并通過文獻研究,構建了大數據企業技術創新評價指標體系;然后通過層次分析法(AHP)找出影響大數據企業技術創新的主要影響因素;接著采用K-Means 動態聚類方法分析大數據企業整體發展情況,結合動態聚類指標的可操作性和合理性,選取大數據企業技術創新主要影響因素中的相關定量指標作為動態聚類指標,找出技術創新處于中低水平的大數據企業,再通過熵值法分析其技術創新的主要影響因素。通過AHP、K-Means 聚類和熵值法的集成應用,既更加明確地認識我國大數據企業技術創新能力的主要提升方向,又更了解我國大數據企業技術創新的整體格局,并可判斷出中低水平大數據企業技術創新的重心所在。
本文基于技術創新理論、大數據4V 特點和文獻研究構建大數據企業技術創新評價指標體系,采用層次分析法得出各指標權重情況,據此分析出大數據企業技術創新的主要影響因素。
層次分析法是一種系統分析方法,由美國運籌學家Saaty[5]于20 世紀70 年代提出,其優點在于對非結構化定性問題轉化成半定量分析,給多準則評價決策提供參考意義。AHP 的步驟是首先通過構建大數據企業技術創新評價指標體系的層次結構模型,再據此建立判斷矩陣,由通過一致性檢驗的判斷矩陣得出各指標權重結果。
2.1.1 構建評價指標體系的層次結構模型
本文構建的大數據企業技術創新評價指標體系的層次結構模型以大數據企業的技術創新評價為目標層,以技術創新理論在管理學、經濟學和社會學中的不同學科視角為準則層,以產品創新、激勵機制和知識資源等要素作為指標層。回顧技術創新理論發展概況,技術創新理論總體上依次經歷了經濟學、管理學和社會學3 個發展階段[6]16-22:首先1934 年熊彼特[7]4開始從經濟學視角研究技術創新,隨后學者們將他的技術創新理論部分分成產品創新與工藝創新兩個層面;然后隨著企業技術創新逐步居于企業獲取與維持競爭優勢的核心地位,大批學者開始從管理學視角研究技術創新,主要從縮小技術創新成果商業化層面來理解技術創新,國內學者則主要從協同創新角度進行思考技術創新;最后在技術創新研究的高度專業化,且需要企業之間建立起密切合作關系才能滿足技術創新需求的背景下,形成了社會學視角下的技術創新理論,也稱為技術創新社會網絡理論。社會學視角的技術創新重點關注外部知識的獲取和利用,學者們證明了知識對于企業競爭力提升的重要性[6]16-22。
本文結合大數據企業技術創新影響因素的實際情況,將技術創新分析視角細化為從管理經濟學、企業經營效益以及技術創新的社會網絡理論三方面,結合大數據4V 特點,并整合企業技術創新相關文獻[1-3,8],得出大數據企業技術創新評價指標體系的遞階結構模型如表1 所示。

表1 大數據企業技術創新評價指標體系遞階層次結構模型
2.1.2 建立判斷矩陣
判斷矩陣是基于遞階層次結構模型所得,作用在于判斷各個指標相對重要程度。根據表1,本文構建4 個判斷矩陣,具體見表2 至表5 所示。

表2 判斷矩陣A-B

表3 判斷矩陣B1-C

表4 判斷矩陣B2-C

表5 判斷矩陣B3-C
2.1.3 一致性檢驗
以B1-C判斷矩陣為例,求得各指標權重并進行一致性檢驗,求各指標權重步驟如下:先得出B1-C判斷矩陣每列之和,再將原有各矩陣元素分別除以每列元素之和,從而得出新的矩陣,再將矩陣每行相加得出最后通過歸一化得出指標權重,公式為:如表6 所示。

表6 管理經濟學視角下技術創新的B1-C 判斷矩陣指標權重
接著求最大特征根,公式為:


表7 判斷矩陣在不同階數下的RI 對應參照值
2.1.4 評價指標權重結果
通過對各個判斷矩陣的計算和一致性檢驗,得出各個指標權重,如表8 所示。從一級指標權重情況來看,技術創新的B3視角權重值最高,原因在于社會專業分工越來越集中,知識的重要性越來越重要,尤其是對于知識經濟時代下的大數據企業而言;其次是B2視角,隨著技術創新在企業競爭優勢獲取的重要性越來越大,企業慢慢通過內部優化來進行技術創新,大數據企業作為新興企業也離不開企業的經營管理;最后是B1視角,這是基于熊彼特[7]4-10創新視角的技術創新,是技術創新理論的最初階段,對于大數據企業,其重要性相對較小。
從二級指標權重情況看,知識資源權重值最高,原因在于知識對于大數據企業這樣的知識密集型企業,知識對企業的業績有著極其關鍵的影響;其次是大數據技術應用效益,大數據企業的數據收集、儲存、分析及應用能力是保證決策可靠的前提;接著是人力資源方面,大數據企業作為知識型企業,對優質人力資源的要求較高,其技術創新更加需要尖端人才的助力;關系網絡、產品創新、協同創新3 個指標權重情況大致處于同一層級,關系網絡反映了大數據企業知識和信息來源是否充足,產品創新是業績提升的重要因素,協同創新可以從側面反映大數據企業內部數據共享程度;激勵機制作為企業鼓舞士氣的重要法寶,對大數據企業技術創新起著輔助性作用;工藝創新、市場營銷和企業規模權重情況大致處于同一層次,工藝創新在大數據企業里體現較少,主要是企業人員合作方式的改進,市場營銷反映了大數據企業技術創新成果是否快速進行商業化以及得到市場認可的程度,根據文獻,企業規模和技術創新有著正相關關系,而大數據企業里企業規模對技術創新直接影響較小。

表8 大數據企業技術創新評價指標權重
基于AHP 所得的權重結果判斷,影響大數據企業技術創新的主要因素有以下6 個,其權重值之和達92%:一是知識資源量,如專利數、無形資產比例等;二是大數據企業的大數據技術綜合應用效益,體現大數據企業的綜合數據能力;三是大數據企業的人力資源情況,主要表現大數據企業的人才力量,技術創新直接來源于人才的努力;四是大數據企業的關系網絡;五是產品創新;六是協同創新。
根據AHP 得出的大數據企業技術創新的知識資源量等6 個主要影響因素,同時考慮動態聚類操作的可得性、簡便性及合理性,選取主要影響因素中合適的相關定量指標作為動態聚類的標準指標,再通過K-Means 算法得出大數據企業技術創新的整體狀。
動態聚類又稱為逐步聚類法,其與系統聚類、模糊聚類等方法都屬于聚類分析法的一種,對大樣本數據處理有較強優勢。K-Means 算法是動態聚類常用方法,其主要思想在于采用距離作為樣本相似性的評價標準,樣本距離與樣本相似度之間是正相關關系[9]。K-Means 動態聚類常采用歐式距離來度量樣本之間的相似度,兩個樣本i、j之間的歐式距離公式記為:

公式(2)中:i為樣本的第j個屬性指標(j=1,2,…,p)記為
K-Means 動態聚類的劃分原則在于使樣本和簇中心之間的距離最小。樣本與簇中心之間距離記為同時簇與簇之間的距離最大,簇與簇之間距離記為其中表示簇的聚類中心。聚類目的是實現組內距離最小化且組間距離最大化。用誤差平方和SSE 表示K-Means 動態聚類質量的目標函數,公式為:


K-Means 動態聚類計算過程如下,第一步隨機選取K個樣本作為初始聚類中心;第二步分別計算各個樣本到每個初始聚類中心的距離,并將各樣本分配到離自身最近的聚類中心;第三步重新計算出新的K個聚類中心。如果新計算出的聚類中心和初始聚類中心不同,則需不斷重復第二步與第三步過程,直到質心不變。
借鑒茶洪旺等[1]學者對我國大數據企業層級類型劃分方法及部分樣本,本文選取各個層級的上市大數據企業共19 家作為樣本,如表9 所示。

表9 我國大數據產業鏈代表性企業
本文所選19 家樣本上市大數據企業的數據均依據2017 年上市公司所公開披露的年報信息,以及從CCER 中國經濟金融數據庫整理所得。
首先選出動態聚類評價指標,然后將指標標準化,以消除量綱不利影響。
3.4.1 評價指標選取
結合層次分析法得出的知識資源量等6 個影響大數據企業技術創新的主要影響因素,考慮定量指標可得性和合理性基礎上,再結合文獻研究構建K-Means 動態聚類的評價標準指標[10-16],如表10所示。

表10 大數據企業技術創新整體水平動態聚類評價指標
3.4.2 指標標準化
由于各個定量評價指標的單位不同,為了消除量綱的影響,本文采用離差標準化方法進行指標的標準化。由于定量指標都是數量值越大越利于大數據企業進行技術創新能力提升,記標準化后的指標為:


表11 樣本評價指標數據預處理
本文借助SPSS 軟件計算,迭代兩次后收斂,并得出初始中心間的最小距離為1.846。運行結果分別如表12、表13 所示。通過表12 可知,第一類企業的總體均值為0.628 5,第二類企業的總體均值為0.382 5,第三類企業的總體均值為0.185,所以判斷第一類大數據企業技術創新整體水平“較強”,第二類大數據企業技術創新整體處于“中等”水平,第三類大數據企業技術創新整體居于“較弱”水平。

表12 樣本企業技術創新整體水平聚類結果
根據表12、表13 可知,處于大數據產業鏈各個層級的樣本企業的技術創新整體水平,實力較強的企業居于少數,只有1 家企業達到此水平,只占5.26%;居于中間實力的企業有2 家,占比為10.53%;大部分企業的技術創新整體水平處于較弱狀態,共有16 家,占比最高,為84.21%。本文得到的動態聚類分析結果與賽迪智庫于2017 年發布的我國大數據企業整體水平基礎畫像以及技術研發評估報告結果大致相符:從大數據企業技術創新評價指標總體均值來看,水平較強的大數據企業明顯高于其他類別大數據企業[17],技術創新整體水平處于“中等”和“較弱”的大數據企業之間差別較小,表明較弱大數據企業之間競爭激勵。

表13 樣本企業技術創新水平動態聚類結果
本文通過聚類分析發現,技術創新水平處于中下的樣本大數據企業占比達94.74%,因而提升這類大數據企業技術創新水平具有十分重要的經濟價值。提升技術創新水平較差大數據企業的技術創新能力,需要重點把握關鍵環節與方向,因而為進一步探析技術創新處于中低水平的大數據企業在技術創新上的主要影響因素,本文采用客觀性和有效性較強的熵值法進行分析。
熵值法作為一種客觀賦權法,依靠客觀指標數據進行實證研究,因而可靠性與科學性較強,多被學者應用于評價研究和求取各個指標權重的相關問題中。熵值法無須設置參數、函數及相關假設,操作簡便,因而應用范圍較廣,如田雪瑩[18]和蔡玉勝等[19]分別將熵值法用于我國城鎮化水平測度和京津冀區域發展質量評價研究中。本文采用熵值法,可以在一定程度彌補前文所應用到的層次分析法在非結構化定性問題中存在一定主觀性這一不足,為大數據企業技術創新水平提升提供了另一個觀察角度。
根據研究目的,本文以浪潮信息等18 家中低技術創新水平的大數據企業為樣本,以表7 中數值為數據來源。第一步是通過樣本數據建立初始指標數據矩陣,即以18 家樣本企業的每家企業的12 個指標構成一個18 行12 列的矩陣。第二步是進行指標數據再標準化,由于在K-means 動態聚類分析中已經對指標進行了離差標準化處理,熵值法計算部分直接省去第二步。第三步是計算各樣本指標的比重,公式記為:

式(6)中:Pij為各樣本指標的比重;ej為各指標的熵值。計算結果如表14 所示。
第四步是通過以下公式(7)計算各指標的熵值:

第五步是計算各個指標的有效性,公式記為:

第六步是算出各指標的有效性比重,即求出各指標權重,公式為:


表14 樣本中低型大數據企業技術創新影響因素權重
根據熵值法計算結果,樣本中低型大數據企業創新技術的最主要影響因素是關系網絡中的前五名供應商合計采購金額,這與前文采用層次分析法得到一級指標權重值最大的技術創新的社會網絡理論視角相符合。根據技術創新的社會網絡理論,大數據企業建立社會關系網絡,可以幫助其獲取外部先進的知識而增加自身數據庫資源;通過與供應商合作,直接購買獲取大數據企業自身業務及其他發展所需的資源。其中很重要的一項資源就是知識資源,通過直接購買獲取大數據企業所需的知識資源,這種方式與企業內部員工創造知識相比具有更高的效率:員工自身對知識的創造需要花費一定的培養成本(經濟成本和時間成本等),這種知識資源獲取方式的效果并非立竿見影,并且在一定程度上面臨失敗風險、增加沉沒成本;而大數據企業直接從外部獲取知識資源,這種知識獲取方式的針對性強、時間效率較高。其次權重值位居第二的是產品創新下的營業收入和大數據技術應用效益下的利潤總額。大數據企業的產品創新帶來的直接影響在于生產出新產品,或是對舊產品的功能升級,其直接帶動營業收入的增加;同時大數據企業在產品創新過程中慢慢積累了技術創新所需的經驗與知識,相關專利與發明的申請與授權則是知識經驗積累的典型證明,顯著影響著大數據企業技術創新水平的提升。大數據技術應用效益主要包括數據挖掘、儲存、預處理及分析和應用等方面的效益。數據本身作為一種重要資源,可以通過合理的挖掘與分析,得出其中有價值的數據資源,進而轉化成極具意義的知識資源,推動大數據企業技術創新水平的提升。而其中大數據技術應用效益則是衡量大數據企業將大量數據轉化為有用的知識資源的能力與效率,在績效上表現為能夠為大數據企業增加多少利潤。接著是協同創新下的碩博學歷員工數。協同創新是企業內部的一種知識分享機制,而知識的分享需要依靠人才彼此之間不斷的交流,人才數量越多越利于創新理念數量和創新效率的增長,也利于新知識的產生。根據熵值法計算結果,作為技術創新核心力量的人才并未處于一個較高的權重值狀態。結合本文采用碩博學歷員工數作為協同創新的代替指標,出現這種狀態的原因可能是碩博學歷員工雖然在一定程度上具有科研能力,但是其對大數據企業技術創新水平提升的作用還不是特別明顯。碩博學歷員工需要進一步提升相關技術創新能力;大數據企業自身也應認識到,企業技術創新并不是只看高學歷員工數量的多少,應該更加看重其質量,因此在人才引進時關注具有一定創新能力的高學歷人員,培養更多有實踐價值的技術創新人才。
本研究的實證結果表明,將層次分析法、K-Means 聚類和熵值法集成應用在分析大數據企業技術創新整體水平的主要影響因素以及中低型大數據企業技術創新的主要影響因素上具有可靠性。本文的結論如下:一是可以根據AHP 判斷出大數據企業技術創新的主要影響因素有知識資源量、大數據技術的應用效益、人力資源、和外界的關系網絡以及產品創新與協同創新,為我國大數據企業提升技術創新水平提供參考方向;二是采用K-Means 聚類分析發現大數據企業在技術創新上呈現“領先企業少而強,長尾企業多而弱”的非均衡格局,表明我國大數據企業整體技術創新水平需進一步提升;三是采用熵值法揭示中低技術創新水平的大數據企業的技術創新主要受到關系網絡(采購金額)、產品創新(營業收入)、大數據技術應用效益(利潤總額)、碩博學歷員工數和研發投入金額的影響。
根據相關結論,本文提出以下建議:第一,對于大數據企業研發投入占比普遍較低的問題,建議政府增加對大數據企業研發投入的補貼,為大數據企業增加研發投入營造良好政策環境;同時,大數據企業自身應該注重協同創新和合理的高管激勵對研發投入的正向促進作用。第二,對于技術創新水平較強的大數據企業存在無形資產占比較低問題,建議政府進一步完善知識產權保護等相關政策,以利于大數據企業無形資產的維護與增值;同時,此類大數據企業應建立與完善員工知識創造的相關獎勵制度(如加大對申請與獲取專利發明授權等方面的獎勵與考核),多開展企業內部知識經驗交流活動,注重不同崗位員工之間的知識交流和現有知識的整合,以利于新知識創造,進而利于大數據企業開發無形資產。第三,對于技術創新水平中等的大數據企業面臨碩博學歷員工數較少問題,建議政府深入改革相關體制以利于促進人才流動與培養;同時,大數據企業自身應加強與高校的合作交流,為碩博在讀生提供實習機會,并盡力了解與滿足碩博學歷人才的個性化內心需求,以吸引和留住高學歷人才。第四,對于技術創新水平較弱的大數據企業研發人員數較少和利潤總額偏低問題,建議政府結合此類大數據企業實際情況進行相關資源的合理配置;同時,大數據企業自身應加大與技術創新能力較強企業之間的合作創新,引進外部先進技術與知識資源,逐步實現由模仿創新到自主創新的轉變,注重企業內部員工的深造與技術創新能力的培養,逐步實現產學研相結合,進而提升綜合業務能力。