劉小玲,董 瑜
(1.中國科學院文獻情報中心,北京 100190;2.中國科學院大學經濟與管理學院圖書情報與檔案管理系,北京 100190)
創新是促進生產率提升、經濟增長以及提高人們生活水平的重要因素。OECD 等國際組織、各國政府以及學術界對國家和企業層面創新的測度和指標制定開展了大量工作,通常從研發投入和產出、監管政策、市場環境等角度測度創新,旨在評估創新對社會和經濟目標的貢獻,監測和評估創新政策的有效性,為政府的科技創新政策和企業創新戰略制定提供依據。隨著科學技術本身的顛覆性發展,科技創新的測度與分析也在經歷深刻變革,對決策者來說,進一步認識創新的性質、決定因素和對經濟社會的影響變得越來越重要,因此有必要對創新測度的研究進展和發展趨勢進行分析。本文在梳理創新內涵、創新測度理論基礎與模型、創新測度主要方法演變歷程的基礎上,探討了在科技變革、數字化、全球化等背景下創新測度面臨的挑戰及發展趨勢。
“創新”一詞最早由熊彼特[1]于1912 年提出,他認為“所謂創新就是把一種從來沒有過的關于生產要素的‘新組合’引入生產體系”,并將創新劃分為五種類型:引入新產品;引入新的生產方法;打開新的市場,對原材料和其他輸入開發新的供給源;在產業界創造新的市場結構。熊彼特的創新概念包含的范圍很廣,涉及技術創新及非技術的組織創新。20 世紀60 年代,隨著新技術革命的迅猛發展,“創新”的概念發展為“技術創新”,許多機構和個人給出了不同定義,如美國國家科學基金會(NSF)指出“技術創新是將新的或改進的產品、過程或服務引入市場”。
到20 世紀90 年代,科學技術的飛速發展以及服務業的繁榮使得創新的概念進一步演變和發展。經濟合作與發展組織(OECD)從1992 年開始發布國際性創新調查指南——《奧斯陸手冊》,對創新給出了較權威的定義,并在第二、第三、第四修訂版中不斷修正和豐富創新的內涵。第一版《奧斯陸手冊》中定義的創新主要指制造業的技術產品創新和工藝創新。在該手冊指導下開展的創新調查(如歐洲共同體創新調查)不斷彌補了《奧斯陸手冊》的框架在概念和方法方面的不足,并催生了1997 年的第二版手冊[2]。第二版《奧斯陸手冊》擴展到服務業的非技術創新等相關內容[3],但在創新的定義中仍使用第一版的技術產品和工藝創新。基于對創新調查結果的分析以及不斷變化的政策需要,2005年,OECD 再次對《奧斯陸手冊》進行了修訂,第三版手冊將非技術創新正式納入創新的定義[4],創新概念的范圍擴展出營銷創新和組織創新兩種新的類型。第三版手冊將諸如研發、資本支出和培訓等投入確定為“創新活動”,并指出有些創新活動本身是創新的,有些不是新穎的活動,而是實現創新所必需的。前三版手冊限定創新必須是已引入市場的,但是在隨后的十年中,人們提出了關于是否應修改“市場”限制以將其他經濟部門如政府機構、非營利機構和家庭等納入其中的疑問[5]。2018 年發布的第四版《奧斯陸手冊》進一步修訂了“創新”的定義:“創新是一種新的或改進的產品或工藝(或其組合)[6],它明顯不同于該創新主體先前的產品或工藝,并且已經將該產品提供給潛在用戶或新工藝已被其他創新主體使用”,其中“創新主體”由以往主要關注的企業擴展到任何部門中的任何機構,也不再要求創新需要“引入市場”,而是放寬至“提供給潛在用戶”,如一些家庭或個人為改善自身福利而改進商品或服務的行為也被認為是創新[7]68。此外,與上一版相比,第四版《奧斯陸手冊》中“創新”的定義包括創新活動,也包括創新活動產生的結果,企業的“創新”由以前的四種創新類型——“產品創新”“工藝創新”“組織創新”和“營銷創新”調整為兩種類型——“產品創新”和“業務流程創新”。
從“創新”內涵的演變歷程可以看出,隨著科學技術和經濟社會的發展,人們對“創新”的理解和關注重點也在隨之變化,熊彼特最初提出的“創新”包含技術創新和非技術的組織創新,后來人們主要關注制造業領域的“技術創新”,隨著服務行業的興起,逐漸擴展到更多類型的非技術性創新,如營銷創新、組織創新等。關注的創新主體也逐漸從企業擴展到所有經濟部門,并去除了創新需要“引入市場”的限制。此后,還有研究人員從創新內容和實現方式等不同角度提出更多創新的概念,如社會創新[8]、開放式創新等[9-10]。創新概念的發展和豐富也為創新測度方法和模型的持續改進提出了要求。
創新測度的理論基礎主要來自管理學和經濟學學科。管理學領域對創新的研究主要涉及創新如何改變企業在市場中的地位,以及如何產生創新理念。經濟學領域的創新測度涵蓋研究組織為什么要創新、驅動創新的力量、阻礙創新的因素以及創新對產業、市場或經濟的影響,這一類問題是當前創新測度研究關注的主要問題。Cantisni[11]學者從技術創新活動的開展過程和實現機制提出了技術創新過程模型。Rothwell[12]將企業“技術創新過程”的演變劃分為五代:技術推動模型;需求拉動模型;聯結模型或耦合模型;創新的鏈環-回路模型;創新系統模型。Kotsemir 等[13]58-63提出了下述六代創新模型:創新黑箱模型;創新線性模型;交互模型;創新系統模型;創新演化模型;創新環境模型。筆者認為Cantisni[11]提出的模型均可歸結為三類:創新線性模型、創新反饋模型和創新系統模型。
Godin[14]均提出了創新的線性模型,其中Rothwell[12]提出的第一代“技術推動型”和第二代“需求拉動型”模型均為典型的創新線性模型(圖1、圖2)。該模型假定,創新活動遵循“基礎研究-應用研究-商業化生產-走向市場”的線性發展過程,前一環節向后一環節逐步推進,誘導機制或動力來源分為技術推動和市場拉動兩類。

圖1 技術推動的創新過程模型

圖2 市場(需求)拉動的創新過程模型
Freeman[15]、Godin[14]認為,創新的線性模型最早在Bush 等[16]著名的《科學——沒有止境的前沿》一書中便有體現,蔡躍洲[17]明確提出科學(基礎研究)與經濟社會進步的因果關聯。原子彈及核電領域的創新活動實踐是創新線性模型的典型案例,該領域從基礎物理研究開始,經過大規模的實驗室開發,最終應用于軍事和民用目的。無線電、晶體管、計算機的發明和使用以及由此而引起的大量創新都屬于這種情況。“需求拉動型”創新線性模型認為對于大部分的企業和科研機構來說,市場需求型的創新在實際中占據很重要的位置,該模型是從生產需要或者市場需求開始,經過研究開發、生產和銷售,將創新引入了市場中。
在創新線性模型的基礎上進一步發展出創新反饋模型,Rothwell[12]的第三代“聯結模型或耦合模型”(圖3)、第四代“創新的鏈環-回路模型”(圖4)以及Kotsemir 等[13]59-60的第三代“創新交互模型”均屬于此類。如Rothwell[12]的第三代技術和需求雙重推動的聯結模型或稱耦合模型中,技術和市場共同影響技術創新的產生;第四代創新的鏈環-回路模型在創新過程的不同階段引入了前向和后向反饋循環,側重于對創新過程的描述。

圖3 聯接模型或稱耦合模型

圖4 鏈環—回路創新過程模型
在新經濟時代,創新過程變得更加復雜,創新線性模型和研究與試驗發展(R&D)統計調查體系很快遭遇到挑戰,一些國家不斷增加研發投入,但各國的技術進步和經濟增長等創新效果卻存在巨大差異[15]。技術創新已不再是單個企業的獨立創新活動而是必須在創新網絡中進行。學術界、政府機構等開始將視野拓展到研發體系之外,并逐步形成“國家創新體系(NIS)理論”。
20 世紀八九十年代,Lundvallb[18]45-48、Nelson[19]提出的創新系統理論強調創新不是一個線性的、連續的過程,而是涉及知識創造和使用中的許多互動和反饋。Rothwell[12]提出的第五代創新系統模型從系統動力學角度研究創新系統的集成及網絡化,強調技術創新各參與主體在技術創新過程中的重要作用。
Freeman[15]、Lundvalb[18]45-48創新經濟學家進一步提出國家創新體系理論,全面分析創新活動的各種影響因素。國家創新體系是一個國家內部創新活動相關主體以及相關的各種制度、政策在推動創新活動過程中相互作用形成的網絡體系。國家創新體系既包括企業、政府部門、大學、公共研究機構及科技創新中介機構等創新活動參與主體,也包括勞動市場、教育培訓體系、金融制度、規制結構等與創新活動相關的制度安排[20]。在后來許多學者的不斷探索和完善中,逐漸形成“創新系統”理論框架,美國的《創新美國》報告提出了“國家創新生態系統”(圖5)[21]。創新系統理論強調,創新不是孤立發生的,而是取決于參與創新過程并在其中扮演各種角色的許多不同類型參與者之間的相互作用[22]。

圖5 國家創新生態系統
20世紀50年代,在“創新線性模型”理論框架下,美國、OECD 等開始實施工業研究、R&D 等方面的官方統計與調查工作[8],并將研究活動分為三類:基礎研究、應用研究和試驗發展。1963 年,OECD推出測度科技活動的《弗拉斯卡蒂手冊》。從20 世紀50 年代開始,宏觀經濟學家就開始關注技術進步對經濟增長的貢獻問題,強調技術進步需要發明,而發明則需要R&D投入以及專利、論文等R&D成果,Solow[23]提出余值估算、全要素生產率測算。20 世紀80 年代以前,在“創新線性模型”理論框架下開展對各國創新能力的測度,主要是對各國技術創新投入(如研發經費投入、研發人員投入)和產出(如專利、出版物)指標進行比較分析,雖然在名義上談的是創新,實際上絕大多數測度的是研發。后來,人們認識到專利測度的是發明而非創新,而且創新活動不僅包含R&D活動,也包含大量的非R&D活動。
1992 年,OECD 和歐盟統計署(Eurostat)聯合開發了《奧斯陸手冊》,該手冊是OECD 向成員國推薦的測度創新活動、收集和解釋創新數據的指南,主要包括基本概念的定義、數據采集指南和創新統計數據的分類。以最新版《奧斯陸手冊》(2018 年)為例[6],該手冊涵蓋三部分內容,第一部分是“創新測度簡介”,包括對該手冊的介紹和創新測度相關概念的界定;第二部分是“測度商業創新的框架和指南”,包括測度商業創新的概念、測度商業創新活動、測度商業創新能力、商業創新和知識流、影響企業創新的外部因素測度、商業創新的目標和產出;第三部分是“采集、分析和報告商業創新統計數據的方法”,包括采集商業創新數據的方法、創新測度的對象方法、創新數據用于統計指標和分析等內容。該手冊自誕生開始,就已成為商業部門大規模調查研究創新性質和影響的參考指南,例如歐共同體創新調查(Community Innovation Survey,CIS)[24],歐盟成員國每兩年開展一次企業創新活動的調查,按企業類型收集創新能力、不同類型的創新和創新發展各個方面的信息,如目標、創新信息來源、公共資金、創新支出等。
20 世紀80 年代中后期,以國家創新體系理論為支撐發展出多種國家創新體系和創新能力測度方法與指標體系,通常從創新投入、創新產出、創新環境等方面尋找可以反映或影響創新能力的指標,并通過對各指標得分進行加權獲得綜合指數,以對各國的創新能力進行比較。目前,影響力較大的指標體系有歐盟委員會的“歐洲創新記分牌”和“全球創新記分牌”、世界經濟論壇的“創新能力指數”、世界知識產權組織的“全球創新指數”和瑞士洛桑管理學院的“科技競爭力報告”等[25]。
以“全球創新指數”(簡稱GII)為例[26],該評價模型由世界知識產權組織(WIPO)、美國康奈爾大學和INSEAD 國際商學院共同發布,2007—2019 年間已連續發布12 版,對全球100 多個國家/地區的創新能力分別按綜合指標和80 余項單指標進行排名和評價,以監測各經濟體在一段時間內的創新表現。GII 指標體系基于“創新”的廣義概念,不僅僅關注技術產品創新,同時也重視對商業模式創新、組織結構創新和服務創新等非技術創新的評價,特別是對知識密集型服務業、終端用戶和公共部門的創新、創新關聯、廣泛的創新產出和影響的測度。2019 年的GII 指標體系由2 個要素、7個子要素、21 個復合指標和80 個單指標構成(圖6),兩大要素分別為創新投入和創新產出,創新投入下的子要素包括制度、人力資本和研究、基礎設施、市場成熟度以及商業成熟度,創新產出下的子要素有知識和技術產出以及創意產出。每個要素、子要素和復合指標得分均為其下級指標得分的平均值,GII 綜合指數為創新投入和創新產出得分的平均值。創新效率為創新產出得分與創新投入產出得分之比。

圖6 2019 年“全球創新指數”指標體系
根據“創新”含義的變化、有關創新測度的最新研究以及可用數據的變化,GII 每年對指標體系進行調整和優化。從GII指標體系的發展演變歷程來看,大致可分為兩個階段。第一階段為2007—2010 年,這一階段為GII 的建立和發展期,指標體系的變動較大。第二階段為2011—2019 年,2011 年基本形成了沿用至今的指標體系,在子要素和復合指標層面的變化較小,大部分單指標的變化僅是計算方法或名稱的變更(圖7)。GII 的單指標數量在60~80個左右變化。2007 年的第一版和2008—2009 年第二版GII 指標體系劃分為三層,即要素、子要素和單指標,從2009—2010 年第三版開始,在子要素下新增一層復合指標,所有單指標劃分到各復合指標下。同樣從2009—2010 年的版本開始,通過創新產出指數和創新投入指數之比計算創新效率,以此反映創新投入對創新產出的影響。創新產出指標不斷調整,GII 創建之初,創新產出的子要素包括“知識”“競爭力”和“財富”,體現了科技論文和專利等創新活動的直接產出,也反映了創新活動通過影響經濟而產生的財富和國家競爭力的提高。在后來的版本中,有關“競爭力”和“財富”的指標相繼去除,同時,“創意產出”子要素增加“網絡創意”的相關指標。2012 年,創新投入下的“基礎設施”子要素增加“生態可持續性”復合指標及其三個單指標,指出綠色增長和創新將受到越來越多的關注。隨著ICT 技術的發展,創新形式和創新主體發生了變化,個人可以通過網絡更多地參與創造和創新活動,指標體系的調整體現了這一變化,2012 年,“創意產出”子要素增加了“網絡創意”復合指標,反映網絡創造力對創新的貢獻。

圖7 “全球創新指數”指標體系演變過程
科學技術快速變革、數字化、全球化等發展趨勢改變著各產業、領域的創新活動形式和性質,這為創新的測度帶來了挑戰。在科技持續快速變革的背景下,國家創新生態系統的特征越來越難以把握,使用傳統方法來構建指標,以及將投入、產出與社會影響關聯起來尤其具有挑戰[27]。還有許多其他創新活動無法通過目前的工具進行測度,有學者將其比喻為“暗創新”(dark innovation),并指出需要對其進行定義并設計測度方法[28]13,[29]62。
在知識密集型社會,創新呈現出多樣化的形式,但目前對企業的創新調查仍未能很好地涵蓋組織創新和營銷創新等非技術創新。服務業的創新活動性質及其組織和實施與工業部門非常不同,由于服務業產品和生產過程的無形性特征及其之間密切的聯系使得難以衡量服務創新產出。研發數據統計對服務業的創新測度尤其不利,有研究探索采用商標(品牌)反映服務業創新[30-31],但另一方面,即使是沒有或只有低水平創新的服務也可以得到商標保護,這限制了商標數據作為創新指標的價值。
數字技術的廣泛應用改變了企業的業務流程和工作方式,數字化環境下的創新也表現出不同的形式。第四版《奧斯陸手冊》就如何測度數字化環境下的企業創新提出了指導,如應從產品創新和工藝創新的角度認識信息的作用、將數據開發活動與軟件一起視為潛在的創新活動、應將數據管理能力視為關鍵的潛在創新能力等等。全球化影響了企業、大學、研究機構開展研發活動的形式,也改變了人們進行創新的行為方式。由于技術創新所需的成本較高,人們更傾向于采取基于協作、共享和從外部獲取知識的“開放”創新策略。目前,許多大型企業在中國、印度和巴西等新興經濟體擁有研發業務,研究機構更頻繁地通過直接的國際合作和網絡合作等不同形式開展研究項目。因此,在創新的測度過程中應更多地考慮全球化因素的影響。
從創新內涵的演變可以看出,創新是一種動態的、普遍的活動,按照聯合國國民賬戶體系(SNA)的定義,創新發生在經濟體的所有部門,包括企業、政府、家庭和為家庭服務的非營利機構。公共部門和家庭及個人等經常對產品或工藝進行改進,并生產、收集和傳播與創新相關的新知識,對于這一類型的創新測度仍有待進一步研究。
5.2.1 公共部門的創新測度
公共部門包括政府機構(各級政府的公共行政實體、監管機構和提供教育、衛生、安全等服務的政府機構)和公有企業,在公共部門創新的研究中通常只包括政府機構。如何鼓勵公共部門的創新,以提高資源利用效率和公共服務質量,越來越受到政策關注。2008—2009 年,北歐國家開展了第一次專門針對公共部門創新的大規模調查[32],此后,歐盟于2010 年通過“創新晴雨表(innobalometer)”進行公共管理部門的創新調查[33],澳大利亞于2012 年實施了“澳大利亞公共部門創新指標項目(APSII)”[34],并于2015 年對澳大利亞醫療保健行業的產品、服務、組織和傳播創新開展大規模調查,這些調查對于理解什么是公共部門創新、公共部門如何進行創新,以及制定用于促進公共部門創新的指標具有重要意義。OECD 就公共部門的創新測度也開展了一些工作,如“公共部門創新觀察站(The Observatory of Public Sector Innovation)”[35]、“科技創新電子展望(STI e-Outlook)”[36]、已舉行三屆的“藍天論壇”以及《奧斯陸手冊》的發布和多次修訂[37]。“公共部門創新觀察站”旨在收集關于公共部門創新的觀察數據,但未對公共部門創新進行界定。《奧斯陸手冊》第四版將“創新”的定義擴展到四個部門,為公共部門和家庭的創新測度和解釋提供指導性意見邁出了第一步,但仍主要關注商業部門,并未對公共部門創新數據的采集和解釋提出具體的操作性建議。
盡管在公共部門創新的測度方面,學術界和政府機構進行了很多探索,但仍有許多尚待解決的問題。一般而言,服務創新的許多特征也適用于公共服務創新,但是,公共服務和私人服務之間也存在差異,公共服務本身之間也存在許多差異,如公共部門不在市場框架內運作,具有規避風險和恐懼失敗的特征。公共部門創新具有多重目標,如提高服務質量、獲得社會成果和贏得信任,任何一種產出衡量指標都可能無法完全體現公共部門的創新績效。Bloch[38]、Gault[39]討論了將公共部門創新納入創新定義的問題,指出公共部門和企業之間的差異可能會影響其創新活動的開展,例如公共部門缺乏市場選擇機制。Arundel 等[40]總結了《奧斯陸手冊》的主題與公共部門創新調查要求之間的差異,包括創新定義、創新活動、創新支出、知識來源、合作、驅動因素、目標與產出、阻礙因素等。未來還需要進一步認識公共服務本身的性質、公共部門開展創新活動的環境以及與公共部門內部和外部其他參與者之間的聯系等。
5.2.2 家庭和個人的創新測度與研究
根據第四版《奧斯陸手冊》對創新的定義以及相關學者的研究,如果家庭或個人向潛在用戶提供新產品或顯著改進的產品,則可以將其歸類為創新者。相對企業和研究機構等組織的創新測度,目前對家庭個人的創新測度和研究還較少。Gault[7]121-125對這一領域的文獻進行了綜述,認為在不同國家可以進行家庭或個人創新活動的大量案例研究。Hienerth 等人[41]研究了測度個人創新的方法。Gault[5]認為,家庭或個人的創新可分為不同類型,那些為自己的利益而改進商品或服務,或者開發出他們無法獲得的商品或服務的家庭和個人,如果以一定價格出售其商品,則應被視為屬于企業;如果他們免費提供產品或有關如何生產產品的知識,則可以像對待公共部門一樣對待它們。
個人的教育水平、創業天賦和其他特征是影響創新的非常重要的因素,個人之間、機構之間及個人與機構之間的關系也值得深入探討。Litan 等[29]89-90 學者均強調應加強對個人的相關數據進行收集,研究創新、創業與個人職業生命周期等之間的關系,為企業、研究機構在雇傭員工的決策方面提供支撐。如Mackie[28]33-34指出,自主權有利于提升科學家的生產積極性,促進個人獨立和自主的政策是從管理實踐層面提高創新績效的工具之一。Mackie[28]54指出,個人是傳遞知識尤其是隱性知識的有力載體,可以通過匹配大學保存的記錄和人口普查數據來了解受過高級訓練的個人(如博士)在企業中的任職情況,研究他們對企業創新的影響。Mackie[28]57還指出,在全球經濟中,測度受過人才的國際流動也十分重要。
在當前的創新測度中還存在一些創新活動缺乏對應的指標和數據,以及指標數據的統計口徑、調查方法不一致等問題,如由于各國研發經費數據的統計口徑和分類方法不同導致一定程度上不具有可比性,在創新形式逐漸多樣化的背景下,專利數據并不能完全代表創新等。
5.3.1 研發經費數據
研發經費數據用于測度創新已有較長的歷史,但其僅能作為間接衡量創新的指標,并非所有創新都基于研發。研發經費數據和測度指標還在一定程度上缺乏國際可比性。各國的研發經費支出數據受到本國研發調查覆蓋范圍的影響,如各國通常按照各自的分類標準對調查的企業進行分類,此外,各國采用的抽樣和估算方法可能不同,例如,美國在高校的研發經費支出方面,人文科學被排除在外,私人非營利部門的研發經費支出僅包括當前支出,因此其研發經費支出數據在某種程度上可能被低估了[27]。
研發經費支出的產業和地理劃分方法也影響了各國數據的可比性。一些國家按“主營業務”對企業的研發經費支出進行分類,而一些國家按照“產品分類”收集研發經費支出,即按最終應用的產業分類,可能劃分到多個產業。《弗拉斯卡蒂手冊》建議采用“主營業務”分類方法,但建議那些在多個活動上進行研發的企業按產品所屬產業對研發經費進行劃分,然而并非所有國家都采用這種方法。在調查中要求被調查者將其研發活動按照不同國家地區或區域進行細分也帶來了國際可比性問題。當研發活動的資助、執行和研發服務貿易涉及多個國家時,難以確定研發經費支出、執行和產生影響的地理位置。
此外,大多數報告創新情況的企業并沒有提供研發經費支出。許多由初創公司開發和引入的創新可能與正式的研發沒有關聯,或者研發活動未被記錄。信息和通信技術的進步使得創新過程的性質和影響因素發生了變化,如搜索服務、電子商務網站和蘋果的iTunes 商店等創新更多地受到數據、組織模式等創新資產投資而非研發投資的影響。
5.3.2 專利數據
許多研究討論了專利與創新之間的聯系,并用專利代表創新成果,但目前關于這個問題仍然存在爭議。專利最明顯的缺點是它們是發明而不是創新的指標,專利標志著新技術原理的出現,而不是商業創新。OECD 的報告指出[42],必須謹慎使用從專利記錄中獲得的信息,例如,專利的價值分布是偏態的,許多專利沒有工業應用,只有少數專利具有實質性價值[43];許多發明不具有可專利性,或者發明者選擇使用商標、版權或商業機密等其他方法保護它們;有一些專利只是企業用于商業談判的籌碼[44];不同國家和行業的專利傾向不同;各國專利法規的差異導致很難對其專利數據進行比較等。無條件地分析專利數據可能導致錯誤的推斷和誤導決策,應提高數據質量和分析技術,根據具體情況如行業類型等確定是否應將專利視作創新產出的指標。
5.3.3 不同來源數據的質量問題
數字化改變了創新測度數據的產生、收集和使用方式。目前創新數據的采集主要通過調查來完成,然而,由于調查回復率低和成本高,可以考慮通過行政記錄的和其他客觀的方法來更好地采集數據,獲得日常活動或其他非研究目的產生的數據,如交易數據、關于創新的報告、招聘廣告、商標數據、用戶數據、社交媒體數據等。Mackie[28]59提出可以利用大學行政數據如資助項目、人力資源、采購記錄等數據來幫助理解研究和創新過程。相比調查數據,客觀數據被操縱而喪失真實性的可能性更小,但也需要關注客觀數據尤其是網絡數據的質量問題通常需要利用自然語言處理、機器學習等技術對其進行處理。統計部門則需要增加這些數據的可獲取性。在使用這些數據時還存在一些其他問題,如數據集可能存在研究人員未意識到的缺陷和偏差,常規標準難以評估大數據技術和分析方法,以及難以向決策者和公眾解釋這些數據和技術。
隨著科學技術和經濟社會的飛速發展,創新的內涵也經歷了不斷擴展和豐富的演變過程,從最初的產品創新和工藝創新擴展到更廣泛的組織創新和營銷創新。同時,人們對創新過程的認識也不斷深入,先后提出創新的線性模型、反饋模型和創新系統模型,并基于這些模型發展出創新調查與統計方法、不同的國家創新體系及創新能力測度框架。在知識密集型社會,隨著科學技術變革和數字化、全球化的加劇,創新活動的形式和性質隨之變化,企業之外的創新主體如公共部門、家庭和個人等受到越來越多的關注。原有的創新測度數據和指標如研發經費支出、專利數據等在國際可比性、是否能準確反映創新等方面仍存在缺陷,有必要在大數據環境下發掘新的創新測度數據來源,并利用先進的信息技術和工具對其進行收集、處理和分析,從而更準確地測度創新活動。