□ 文 百度發展研究中心
開放式創新打造中國數字經濟未來
□ 文 百度發展研究中心

一段時間以來,谷歌、臉書、百度等互聯網公司紛紛將旗下的深度學習平臺開源。去年9月,百度宣布開放“百度大腦”,以此幫助開發者更快、更高效地將自身業務與人工智能結合,讓人工智能成為數字經濟時代的“新電力”。如同一百年前的電力給人類經濟和社會帶來的變革一樣,相信互聯網公司在人工智能等領域的開放式創新,也將給中國數字經濟的發展注入強勁動力。
開放式創新是與封閉式創新相對的一種新的創新范式,是指組織在進行創新時既使用內部創新也使用外部創新,讓知識可以跨越組織的邊界流入和流出。開放式創新的主要模式包括:由外而內的開放式創新、由內而外的開放式創新以及將兩者結合起來的開放式創新。
20多年來,隨著互聯網的不斷普及,開放式創新和數字經濟就像一對孿生兄弟,兩者的萌芽、發展和繁榮幾乎都是同步進行的。
上世紀80年代末至90年代初,互聯網逐步從校園走向社會,數字經濟進入萌芽階段。為了讓人們能用上計算機以及網站能夠運行,開源的操作系統Linux和網頁服務器Apache應運而生。Linux脫胎于UNIX但又擁有免費和開源的優勢,在開源軟件愛好者和商業公司的大力推廣下,已成為開源軟件的杰出代表。而Apache更是由于其跨平臺、安全性和可擴展性,成為使用最廣泛的網頁服務器。Apache基金會還孕育了大量優質的開源項目,在金融、航天、出版、醫療、基礎設施等各個領域發揮著重要作用。
90年代后期,PC互聯網時代的到來讓數字經濟從萌芽進入到快速發展的階段。早在1996年,美國學者尼葛洛龐帝就提出了著名的論斷:“計算不再只是與計算機有關,它決定我們的生存”。在PC互聯網時代,網頁是當時絕大多數用戶接觸互聯網的最主要入口。作為當時最流行的網頁瀏覽器之一,開源軟件Firefox的出現,打破了微軟IE的壟斷局面,二者的競爭使用戶能夠不斷獲得更好的上網體驗,從而為數字經濟的發展奠定了重要基礎。
隨著PC互聯網向移動互聯網的過渡,互聯網從虛擬世界走入實體世界,開始逐步與各行各業深度融合,讓數字經濟的發展走上了一個新臺階。在移動互聯網時代,開放式創新的理念和做法已成為主流。以智能手機操作系統為例,蘋果的iPhone在智能手機普及中發揮了舉足輕重的作用,而iPhone之所以能夠流行,除了得益于其優秀的設計和功能外,通過開放SDK開發包建立起的繁榮的開發者生態功不可沒。對于長期保持封閉性的蘋果而言,這是前所未有的開放式創新之舉。而基于Linux的開源操作系統Android,更是已在全球超過八成的智能手機上運行,并擴展到電視、汽車、可穿戴設備等多個平臺。
開放是數字經濟的基礎,而軟件領域的開源僅僅是一個先導,接踵而至的數據、內容、技術等的進一步開放,繼續推動著數字經濟的商業模式、生產方式等不斷發展和變革??梢哉f,開放式創新不僅與數字經濟共同成長,更是數字經濟蓬勃發展的深層動力。
(一)開放式創新孕育數字經濟新商業模式
開源是開放式創新的重要形式之一,前文所述的Linux、Apache、Firefox都是開源軟件的優秀代表。開源軟件免費、自由的特性,使之在誕生之初并沒有太多的商業參與,但是時至今日,商業參與已成為推動開源的重要力量,并孕育出多種成功的商業模式。
以Linux為例,IBM、英特爾、甲骨文等大公司每年都花巨資支持Linux開源社區的運作,而在1999年,提供開源解決方案的Red Hat和VA Linux公司先后在美國成功上市,更是創造了極為轟動的開盤紀錄。人們之所以看好Linux的價值,就是因為其成功的商業模式。例如,企業級計算對可用性、可靠性、安全性的要求很高,而IBM將其王牌產品大型主機與Linux的軟件融合并捆綁銷售,就可以把企業級計算能力和開源技術兩者的優勢充分地結合。除此之外,還有特殊功能模塊定制模式、增值服務模式、開源換流量模式、企業特性軟件收費服務模式等多種多樣的商業模式。
(二)開放式創新帶來數字經濟新生產方式
眾包是開放式創新的重要形式之一,而在知識內容的生產方面,眾包模式也取得了重要成果。以采用眾包模式生產內容的百度百科為例,截至2016年9月底,百度百科已有一千三百多萬個詞條,成為全球最大的中文百科全書,共有近600萬人進行了一億多次的編輯。百度百科的新知識生產方式改變了傳統百科全書的運作模式和傳播方式,基于共享、共建、共知的基本理念,充分調動廣大用戶的積極性和創造性,是對知識社會條件下用戶參與、大眾創新的生動詮釋。
不僅在知識內容的生產領域,眾包模式已為各個領域的創新提供了解決方案。以電子地圖的生產為例,地圖上的POI點數據量大、變化頻繁,單靠一家公司自己生產需要投入巨大的人力物力。百度地圖推出了名為“地圖淘金”的眾包式POI采集產品,通過發放獎勵鼓勵用戶做采集,用戶只要用手機拍下店鋪的門臉,按照一定的格式上傳到百度地圖上,通過審核就可以掙錢。據統計,2015年,地圖淘金實現了一年內回收數據1500萬,新增POI點340萬個,讓單條POI采集的成本下降了300%,大大提升了地圖數據更新的頻次和覆蓋范圍,為地圖用戶帶來了更好的體驗。
以眾包為代表的開放式創新的生產方式,將原本只能由特定企業和機構才能完成的任務,向自愿參與的所有企業和個人進行分工,最大限度地利用大眾力量,將人力資源優勢轉化為人力資本優勢,以更高的效率、更低的成本完成產品和服務的生產,并創造便捷創業、靈活就業的新途徑,匯聚數字經濟發展的新動能。
(三)開放式創新催生數字經濟新研發手段
開放式創新的模式可以節省研發成本、縮短研發周期、提高研發效率已成為共識,大量企業都已經或正在完成以自身研發資源為主向統籌利用內外部資源、形成內外協同的研發網絡方向轉變。更重要的是,這一模式將大大降低研發門檻,使每一個具有科學思維和創新能力的人都可參與研發和創新,最終構建一個繁榮的技術研發生態系統。例如,在深度學習領域,百度的PaddlePaddle、Facebook的Torch、Google的Tensor Flow、微軟DMTK等工具都已經開源,這些開源工具在語音識別、自然語言理解、計算機視覺等領域有廣泛的應用潛力,大大節省了開發者的時間和精力,降低了深度學習在各個行業的應用門檻。

百度開源的PaddlePaddle分布式并行深度學習平臺,不是某一種深度學習算法的實現,而是一種可以靈活支撐多種機器學習算法需求的架構。PaddlePaddle支持多機多GPU計算,支持海量數據和數十億參數規模,具有高性能、易用和持續迭代等優勢?,F有的深度學習平臺一般是通過單機方式進行訓練,但當數據或者模型規模增加后必然要進行分布式訓練。PaddlePaddle的設計采用了單機模型并行、多機數據并行的方式,可以開展億級模型規模以上、大規模數據量的分布式訓練。
PaddlePaddle平臺在百度內部使用3年多的時間里,幫助百度在搜索優化、人臉識別、圖像識別等技術和應用方面帶來巨大的效果躍升,成為“百度大腦”的核心技術。例如,在圖片搜索產品中,對違法違規圖片識別和過濾的錯誤率降低了超過50%,對互聯網搜索內容的凈化起到了關鍵的作用。在圖像識別和搜索推廣領域,在一年內使機器訓練速度分別提升了20倍和30倍,很好地滿足了大規模數據并發計算方面的需求。
(四)開放式創新創造數字經濟新發展動力
大數據應用是數字經濟的重要實踐領域,大數據應用的發展需要整合和利用政府、企業和公眾等多種來源的數據,將上述數據融合進行增值開發和創新應用,為人類生產生活服務,已成為數字經濟新的發展動力。


在政府數據開放領域,美國聯邦政府開放的數據集已經超過18萬個,帶動公共管理、醫療服務、零售業、制造業、位置服務、社交網絡、電子商務等7個領域所產生的直接和間接價值已達每年2萬多億美元。
融會貫通是大數據增值利用的最佳方式,將政府、企業和公眾的數據進行融合是必由之路,百度公司在交通領域的實踐就是一個典型案例。百度在與各地交通部門開展“互聯網+交通”戰略合作的過程中,將百度大數據技術和地圖資源與各地交通部門和企業的數據進行融合,并以接口化的形式免費向社會開放,建立了百度地圖開放平臺。目前該平臺已經成為涵蓋地圖制作、數據展現和產品推廣等功能的綜合性平臺。百度地圖匯集了4000多萬個POI點、4億km路況,每天響應全球300多億次定位請求,已為80萬開發者的超過300萬個APP提供了服務,并且為物流配送、房地產、上門服務等行業提供了一體化解決方案。例如,在物流行業,以鷹眼服務及物流解決方案為基礎,百度地圖在系統派單、分單系統、運力動態調度、運輸配送等方面,正幫助物流行業轉型,推動中國物流產業進入智能、綠色、高效、安全的新時代。
綜上所述,開放式創新帶來的數字經濟時代新的商業模式、生產方式、研發手段等,已推動形成開放、協同、共贏的潮流,為經濟、技術和社會的發展提供了更為廣闊的空間,最終將形成一個新的經濟和社會生態系統。我們越來越清晰地看到,組織的邊界正在模糊化,價值創造模式還將不斷創新。借此,生態系統的各個參與者將繼續完成從擁有資源到使用資源的轉變,從獲取能力到貢獻能力的轉變,這不僅將為參與者帶來新的機會、創造新的營收來源,還將提升整個數字經濟生態系統的競爭力。在生產要素的規模驅動力減弱、創新成為驅動發展新引擎的中國經濟新常態下,開放式創新帶來的整個數字經濟生態系統的理念轉型和模式升級,將為中國經濟創造源源不斷的發展動力。

百度公司創始人、首席執行官李彥宏認為,互聯網的發展包括三個階段,“第一幕是1994年開始的PC互聯網,第二幕是移動互聯網大潮對于我們生活的改變。下一幕就是人工智能。這是繼移動互聯網之后一個更加激動人心、更加能夠給我們帶來各種各樣想象、各種各樣可能性的新時代”。未來,人工智能將成為數字經濟的核心技術。正如150年前的電氣化變革人類世界一樣,人工智能也將掀起一場新的經濟社會革命。智能將成為和電一樣的公共基礎資源,融入每個企業的研發、生產、銷售等全過程,也融入每個人的日常生活。
人工智能作為未來數字經濟的核心技術,其發展高度依賴于開放式創新,改進人工智能技術的唯一方式就是充分發揮整個產業界和科學界的力量。例如,斯坦福大學和普林斯頓大學研究人工智能的專家合作發起了ImageNet計劃,利用眾包平臺讓人們一起標記這些圖片用來訓練機器的圖像識別能力,已有來自世界167個國家的近5萬名志愿者篩選、排序、標記了接近10億張備選照片,朝著讓計算機理解世界的目標邁進了重要的一步。
為了推動中國人工智能技術的突破和產業的發展,百度將在開源深度學習平臺和開放“百度大腦”的基礎上,繼續致力于開放人工智能研發能力,與各界一起開放共享研發資源、匯聚全球頂尖人才、加大資金投入力度、推動人工智能成果轉化和產業化應用,共同開創中國數字經濟的未來?!?/p>
(轉載自《中國數字經濟理論與實踐》)