邱國棟,任 博
(東北財經大學 工商管理學院,遼寧 大連 116025)
18世紀以來,世界多次發生重大科技革命,對社會生產力、經濟結構及國際競爭格局產生了深遠影響。源于人類及人類社會對于實踐活動的客觀需要,新一輪科技革命正在孕育興起。新時期科技革命具有智能化、生態化特征[1],其正在對人類社會帶來難以估量的影響。人工智能是新一輪科技革命和產業變革的重要驅動力量,加快發展新一代人工智能事關我國能否抓住新一輪科技革命和產業變革機遇。在此背景下,2018年,經國務院批準,世界人工智能大會(WAIC)正式創辦。2022年9月,第五屆世界人工智能大會(WAIC)智能社會論壇指出,以新一代人工智能為核心的新興技術正在推動經濟社會各領域從數字化、網絡化向智能化加速躍升,人類快速步入智能社會。智能社會意味著顛覆性技術的廣泛推廣與情境應用,從哲學層面審視,技術進步通常表現為人類改造自然的能力和人類潛在能力的增強[2],即技術可供性理論所言及的技術向特定用戶群體提供面向目標行動的可能性[3]。本質上而言,機器學習是新興智能技術的關鍵進入路徑,如何在理論層面詮釋并體現其核心內涵與價值,即機器學習與行動者之間的作用關系,以支持個人、組織甚至人類社會在適應技術環境深刻變化的同時,持續增強實踐應對能力、彰顯競爭優勢效能,成為社會各界廣泛關注的話題。
實踐界與理論界均證實了學習、能力及其它變量間的相互作用關系。其中,從理論層面看,殼牌石油策劃經理蓋亞斯(RiedeGes)認為學習能力是勝過競爭對手的唯一持久的競爭優勢;于克信[4]指出,企業家和高層管理者需要學習、共享知識,強化融于企業核心能力之中的戰略領導能力,從而促進企業獲取動態競爭優勢;易凌峰等[5]認為,提高組織學習水平和知識管理質量,是增強企業核心競爭力的內部路徑。從實踐層面看,機器學習已被廣泛應用于決策支持、人臉識別及數據檢測等相關領域。尤其是谷歌公司(Google)旗下基于機器學習技術開發的智能圍棋程序AlphaGo曾多次戰勝人類頂尖棋手,進一步顛覆了人類對于機器學習的主觀認知,為本文研究帶來重要啟示。首先,機器學習能夠與行動者能力建立某種聯系,且這種聯系并非單純基于人的主觀思辨與推斷,而是立足于“實踐-理論”雙重驗證基礎之上;其次,相較于傳統學習方式,機器學習對于行動者能力提升具有獨特發生機制。然而,通過對國內外現有文獻進行梳理發現,鮮有學者針對上述問題開展具體研究。
綜上所述,本文認為社會變革要求“組織跟隨技術變”,智能時代要求“組織結構跟隨智能變”[6],應用智能技術的人工智能體是構成新型組織的核心要素之一。從人工主體智能化實現過程與目標看,機器學習是人工智能的核心,是計算機獲取學習能力和智力的方法或途徑,其并非對人類學習(個體學習、組織學習)的根本替代,而是模擬和實現人類的部分學習功能[7],是人類開展實踐活動的輔助性技術工具,為人類提供認識世界的新思路、新工具和新方式[8]。機器學習作為新時期特定的學習方式,可以產生某種機器知識,并提升科學知識生產效率[9],進而釋放行動者自身能力。所以,從理論構建層面看,對機器學習與行動者能力關系進行探索,既能反映現實世界對于現代管理理論發展的推動性,又能體現現代管理理論對于新現象研究的必要性。基于此,本文以谷歌AlphaGo為研究案例,基于技術可供性理論,運用扎根理論研究方法,系統分析機器學習對行動者能力的作用機理。研究結論有助于促進我國各層次主體在新經濟形勢下提高自我能力、建立差異化競爭優勢、增進競爭效能,進而以中國式智慧、中國式方案探尋中國式現代化道路,全面推進中華民族偉大復興。
20世紀70年代末,美國生態心理學家吉布森在其著作《The Ecological Approach to Visual Perception》一書中提出可供性理論,意為動物與環境的互補性;Turvey等[10]肯定了可供性理論在心理學領域的應用前景。首先,可供性理論為精確制定和測試相關行為及感知假設提供了一個分析框架;其次,可供性理論提出一種整合心理學現象和機制的方法,且沒有屈服于任何一種片面性觀點;最后,可供性理論有望讓心理學重回尋求合法關系的軌道。20世紀90年代初,Gaver[11]延續吉布森(Gibson)關于可供性的基本主張,提出技術可供性的概念,意指行為主體與所處技術環境之間的連接關系[12]。為適應社交生活中復雜的“新興社會—技術”關系,Nagy &Neff[13]提出想象可供性概念,即用戶可能會對通信技術、數據和媒體抱有一定期望,這些期望在實踐中會決定他們如何處理這些技術以及他們認為應該采取哪些行動。
伴隨著新興技術的逐步興起與廣泛應用,技術可供性理論得到社會各界的普遍關注。其中,羅玲玲、王磊[14]認為可供性與技術之間的關系是值得深入挖掘的“富礦”,設計界應用可供性的繁榮只是表面,要追溯這一繁榮背后的緣由需要深入技術才能找到;謝衛紅等[3]全面梳理技術可供性知識結構,指出技術可供性是應用最廣泛的一種可供性。尤其是近10年來,以數字技術為代表的新一輪信息技術革命進一步豐富了技術可供性內涵。因此,從演進路徑看,“技術可供性”源自心理學“可供性”概念[12],其更注重技術與技術使用者之間的互動關系[11]。
綜上所述,本文認為技術可供性體現用戶對于技術的感知和期望,并反映技術給予用戶的可能效應,通常呈現于用戶與技術之間的交互作用過程。該理論加深了人類對技術社會屬性的理解,為深入挖掘并建立人與技術之間的可持續發展關系奠定了堅實的理論基礎。
(1)機器學習的內涵。從狹義角度看,機器學習是一類算法,屬于計算機科學的一個子領域;從廣義角度看,它是一種綜合計算機科學、工程學、統計學等多學科知識的新技術[15]。機器學習基于大量數據特征值,不斷優化計算程序的性能標準,讓程序實現“學習”,進而發現數據特征并展開統計預測任務[16]。機器學習是新一代信息技術(人工智能)的一個前沿分支學科,同時也是實現人工智能的重要途徑[17]。按學習形式劃分,機器學習主要包括監督學習、半監督學習、無監督學習和強化學習。按學習方法劃分,機器學習主要包括傳統統計機器學習算法和深度學習算法[18]。由此可見,廣被提及的深度學習是機器學習基于特定算法技術的一種學習模型[19]。
(2)機器學習的興起。機器學習的興起與AI技術發展密不可分。從歷史發展看,人工智能經歷了誕生期(20世紀40-50年代)、黃金期(20世紀50-70年代)、低谷期(20世紀70-80年代)、繁榮期(1980-1987年)、蕭條期(1987-1993年)及回暖期(1993年至今)6個階段。從智能程度看,人工智能經歷了推理期、知識期、學習期3個階段[20]。其中,學習是響應人類為實現計算機智能化發展的客觀需要。因此,對于機器學習的技術起源可追溯至1950年(圖靈指出機器學習的可能性)。20世紀50年代中后期,基于神經網絡的“連接主義”、基于邏輯表示的“符號主義”以及以決策理論為基礎的學習技術相繼出現,時至20世紀80年代,機器學習成為一個獨立學科領域,各類學習技術得以蓬勃發展。
(3)機器學習的應用。目前,機器學習在公司數量、融資金額等方面遙遙領先[21],并被廣泛應用于經濟學、政治學和社會學領域[22]。其中,就經濟學而言,機器學習在大數據背景下對于豐富經濟數據多樣性、提高經濟預測準確性、改善平均處理效應及效應異質性具有重要作用[15]。就政治學而言,大數據利用回歸模型、決策樹、神經網絡等各類機器學習算法,能夠在復雜社會系統中實時預測政治傾向、政府開支、政府決策等特定現象或趨勢[23]。就社會科學而言,機器學習有助于拓展研究視野、獲得潛藏指標、啟發理論假設、助力因果推斷、實現數據增生,進而推動理論創新[16]。
綜上所述,在工業4.0背景下,人工智能和機器學習融入工作流程[24],機器學習在實踐層面表現出對人類認知勞動的極大輔助作用,諸如提升科學知識生產效率、提取和傳遞默會知識、產生某種機器知識等[9]。尤其是基于深度神經網絡的機器學習一定程度上實現了人類建模能力的外化(學習能力實質上就是選擇信息和建模的能力)[25]。總體而言,現有研究已經初步證實機器學習對于行動者部分能力具有提升作用。
學術界對行動者及行動者能力內涵的界定不盡相同。為更好地開展本文研究,需要對相關概念作出準確界定。關于“行動”,現代漢語詞典將其解釋為“為達到某種目的而進行的活動”;Bergen &Santo[26]認為,行動是指目標實現的過程。關于行動者,行動者網絡理論認為,行動者包括在相互結成的網絡中具有能動性的所有“人”和“非人”[27];王芳[28]從社會學角度出發,將行動者定義為人(個人與法人)。關于行動能力,其主要在環境教育領域得到關注,并被定義為成功做某事的本領[26]。Jensen &Schnack[29]認為,行動能力是指在現在和將來采取行動并對自身行動負責的能力;Eraut[30]對能力的理解更加深刻,他認為Capability是一個人思考或做所有事情的能力,Competence是指針對特定工作或工作類別完成任務預期標準所需要的能力,Additional Capability是指通過進一步學習拓展當前能力的額外能力,上述3種能力分別代表行動者的期望能力、現實能力和獲取能力;Wanda等[31]從可持續發展角度出發,重新界定行動能力,認為其是指可持續發展中的行動力(ACiSD),ACiSD由個人能力和人際能力的平衡組合組成。其中,個人能力要求對可持續發展充滿熱情,致力于尋找解決方案,了解可持續發展問題和行動的可能性,具有遠見和批判性思維,是一種對個人能力的積極感知。人際能力增加了為建議選擇提供論據的意愿、對他人和文化觀點的開放性、促進合作的溝通技能以及對團隊能力和集體支持可持續發展行動效果的信心。
本文主要探究新興技術(機器學習)對人類的影響作用,將行動界定為以目標為導向所采取的行為舉止,行動者是指包含個體與群體層面的人。借鑒相關學者對能力的定義,將行動者能力界定為行動者(人)基于可持續發展理念,在努力實現特定任務目標過程中所具備的對目標結果負責的能力。
通過對相關文獻進行梳理,本文在洞徹技術可供性理論發展脈絡、理論意義與實踐啟示的基礎上,對機器學習、行動者、行動者能力概念進行界定。本文認為,在新一輪科技革命背景下,機器學習是人類學習能力的外化表現,機器學習與行動者之間的關系符合技術可供性理論內涵,即行為主體與技術主體通過互動產生一個或多個支持主體目標的可能性[3]。然而,兩者之間如何相互作用、彼此促進,從而持續提高行動者能力有待深入探討。據此,本文構建基于技術可供性理論的研究框架,如圖1所示。
圖1 基于技術可供性理論的研究框架Fig.1 Research framework based on technology affordance theory
案例研究通過突出情境、展示過程和揭示關系講述引人入勝的故事[32],適合對某一復雜和具體問題進行全面考察,能夠建立新理論或者對現存理論進行修正[33]。其中,單案例研究可對廣為接受的理論進行反駁,并對先前未有的科學現象進行探索(毛基業等,2008)。“更好的故事”往往偏向于單案例研究,尤其是基于過程理論的單案例研究[32]。本文基于科技變革情境,以可驗證的方式對技術可供性視角下“機器學習與行動者能力”這一獨特、前所未有的社會現象作出系統性解釋。即運用歸納邏輯發現相關經驗規律,采用單案例研究方法陳述相關概念或變量之間的邏輯關系,屬于理論構建研究。目前,扎根理論是國際上公認的比較科學的質性研究范式[34],其借助經驗發現,通過歸納而非演繹進行理論建構[35-36]。因此,本文運用扎根理論方法對所選單案例進行探索性研究。
(1)案例選取原則。本文案例選取遵循理論抽樣原則,案例選取是從案例研究中構建理論的一個重要方面[37]。為更好地揭示研究問題,應選擇典型案例,而非隨機案例(葉康濤,2006)。典型案例一般具備3個特征:一是案例結果出乎意料或者反直覺;二是現有理論不能解釋該案例或認為該案例不可能存在;三是可為以往沒有研究過的現象提供重要啟示(李高勇,2015)。基于以上原則,本文選取谷歌AlphaGo作為研究案例,原因在于:首先,深度學習是AlphaGo的主要工作原理,而深度學習是機器學習的一個分支,該案例能夠突出研究情境,符合理論抽樣原則;其次,圍棋因其復雜性而被稱為人工智能最具挑戰性的經典游戲,而AlphaGo是第一個擊敗人類職業圍棋選手、圍棋世界冠軍的計算機程序,結果出乎意料,具備典型性特征;再次,開發人員讓AlphaGo與自身不同版本進行數千次對抗,每次都能從錯誤中吸取教訓。而且,隨著時間推移,AlphaGo不斷進步,在學習和決策方面變得越來越強大,這種現象對現有社會科學理論具有極大挑戰。綜上所述,以谷歌AlphaGo作為研究案例構建本土管理理論,充分響應了案例研究從“好的故事”到“好的理論”[32]這一重要課題。
(2)案例進化過程。在AlphaGo誕生之前,計算機與人類較量幾乎獲得除圍棋之外所有棋類游戲的勝利。原因在于,圍棋作為一種博弈類游戲,雖然游戲規則簡單,但棋局情形復雜,被認為是人工智能最大的挑戰。為攻克上述難題,DeepMind研究團隊創建了AlphaGo,使其成為截至目前最強大的“圍棋選手”。本文根據所搜集到的資料,梳理AlphaGo的進化歷程,如圖2所示。
圖2 AlphaGo進化歷程Fig.2 Evolution of AlphaGo
第一階段:對戰機器(早期)。為檢驗、評估AlphaGo的具體性能,研究者使其與多種計算機程序進行比賽,在495局比賽中贏得494局,勝率為99.79%。其中,在與CrazyStone、Zen、Pachi三種當時最強大的商業程序對局中,勝率分別為77%、86%和99%,凸顯了一種將高級搜索樹與深度神經網絡相結合的計算機程序的強大對弈能力。
第二階段:對戰人類(2015—2017年)。2015年10月,AlphaGo Fan與蟬聯2013—2015年三屆歐洲圍棋冠軍的棋手樊麾對戰,以5∶0獲勝;2016年3月,AlphaGo Lee與韓國著名棋手李世石對戰,以4∶1獲勝;2017年1月,AlphaGo Master在相關網站注冊賬號,與人類頂級玩家在線對戰,獲得60場連勝的驕人戰績;2017年5月,AlphaGo Master與中國九段選手柯潔對戰,以3∶0獲勝。賽后,Demis Hassabis宣布AlphaGo不再與人類棋手對戰,自此退役。
第三階段:自我升級(2017—2020年)。2017年10月,DeepMind公司發布AlphaGo Zero,其在沒有游戲先驗知識且只有基本游戲規則輸入的情況下,通過強化學習形式與自己對戰。最終,僅用時3天便超越AlphaGo Lee;用時21天,能力達到AlphaGo Master水平;用時40天,超過AlphaGo的其它版本。2018年12月,DeepMind公司發布AlphaZero,用時4小時,便超越國際象棋程序Stockfish;用時2小時,便超越日本將棋程序Elmo;用時30小時,便超越圍棋程序AlphaGo Lee。2020年12月,DeepMind公司發布MuZero,無需被告知游戲規則便可掌握圍棋、國際象棋、將棋和雅達利(Atari)。
案例研究可以容納豐富多樣的數據源,包括訪談、檔案數據、調查數據、民族志和觀察資料等[38]。根據數據來源的原始性,主要包括一手數據和二手數據兩種類型。訪談是搜集豐富經驗數據的高效方法,但其通常會引發“下意識”反應,即數據偏見,而限制偏見的一個關鍵方法是組織大量知識豐富的信息提供者(來自不同層級、職能領域、群體和地理區域的組織參與者以及來自其它相關組織的參與者和市場分析師等外部觀察者),使他們從不同角度看待焦點問題[38]。二手數據具有較高程度的可復制性、客觀性以及較低的獲取成本(蘇敬勤等,2013)。因此,為確保研究結論信效度,本文同時運用兩類數據進行研究。
考慮到新冠肺炎疫情的影響,本文主要借助騰訊問卷調查系統(wj.qq.com)向互聯網領域從業者及相關專家發放調研問卷,以獲取一手數據資料。結果顯示,在參與調研的人群中,36人為本科學歷、57人為碩士學歷、5人為博士學歷,且多數人畢業于知名高校并就職于華為、中興、小米等科技型公司,反饋意見能夠滿足本文對問卷調研專業性與代表性的要求。與此同時,AlphaGo作為新一輪人工智能發展的代表性成果,在世界范圍內產生持久、深遠的影響力,目前已引起各界人士的廣泛關注,相關新聞媒介、學術期刊及官網平臺擁有大量可供查閱的質性材料,為本文獲取二手數據創造了便利條件。
綜上所述,本文通過網絡調研法獲取一手數據,通過非參與式觀察法獲取二手數據,同時運用兩種數據對核心問題展開研究,在實踐層面具有可操作性,在理論建構層面具有科學性。本文數據來源與編碼情況如表1所示。
作為探索性研究方法,扎根理論遵循歸納性邏輯思維,在編碼環節主要包括一級編碼(開放式登錄)、二級編碼(關聯式登錄)和三級編碼(核心式登錄)3種程序[39]。為保證數據分析的嚴謹性,本文參照賈旭東、衡量(2016)對于質性數據的分析思路,并結合Gioia等[40]提出的“一階—二階—聚合”數據分析方法,對獲取的經驗資料進行編碼分析。一是結合研究興趣,基于既有文獻和現實情境涌現確定研究問題(機器學習與行動者能力)。二是以谷歌AlphaGo、互聯網領域從業者及專家作為理論抽樣樣本,收集相關數據并予以整理和記錄。三是對所獲數據進行開放性編碼(一級編碼)、選擇性編碼(二級編碼),確保核心范疇出現。其中,在一級編碼過程中擯棄主觀偏見認識,將原始語句概念化、范疇化,最終形成包括AI方法約束、AI方法創新、程序性能測試在內的14個一階概念;在二級編碼過程中堅持辯證思維邏輯,對相關概念、范疇進行抽象提取,最終形成包括AI路徑探索、AI路徑實踐、知識輸入學習在內的7個二階主題。四是對研究筆記進行理論性編碼(三級編碼)、理論初構,并對數據、模型及文獻進行反復比較,最終構建與研究主題高度相關的理論模型。其中,在三級編碼過程中把握理論敏感度要求,對二階主題進行歸納分析,最終形成包括機器學習賦能、行動者能力提高、行動者能力精進在內的3個聚合構念。
表1 數據來源與編碼Tab.1 Data sources and codings
綜上所述,本文基于技術可供性視角,遵循扎根理論建構程序[34],對谷歌AlphaGo的時序發展變化過程進行深入分析,探究智能模式情境下機器學習與行動者能力之間的互動關系。
本文基于所掌握的一手數據和二手數據,圍繞AlphaGo進化過程的3個關鍵節點(對戰機器階段、對戰人類階段、自我升級階段),對機器學習與行動者能力這一核心問題進行深入分析。其中,對回收的98份有效調研問卷進行統計分析發現,92人認為機器學習能夠提高行動者能力(占比93.9%)。進一步分析發現,在AlphaGo對戰機器階段,行動者呈現機器學習賦能這一主觀認知;在AlphaGo對戰人類階段,行動者的能動作用提高了自身能力;在AlphaGo自我升級階段,技術迭代促使行動者能力進一步精進。
眾所周知,AlphaGo并不是人類創造的第一款圍棋程序。20世紀60年代,計算機圍棋逐漸興起,隨著應氏杯、奧林匹亞杯及北美杯等各類正式計算機圍棋大賽的舉辦,眾多圍棋愛好者紛紛參與程序編寫,各類程序相繼付諸實踐,有力推動了人工智能在圍棋領域的應用。2006年,Coulom開發的計算機程序CrazyStone首次在計算機奧運會上獲得九路圍棋冠軍;2008年,王一早開發的計算機程序MoGo首次在九路圍棋中達到段位水平;2012年,加藤英樹開發的計算機程序Zen在十九路圍棋中以3∶1的成績戰勝約翰特朗普;2014年,日本圍棋九段棋士衣田紀基讓四子負于CrazyStone;2015年,Facebook開發的計算機程序DarkForest表現出與人類相似的下棋風格和驚人實力[41]。縱然計算機圍棋程序進步飛速,但圍棋作為一種復雜的策略型博弈游戲,在AlphaGo面世之前,業界普遍認為計算機程序與人類職業棋手相差甚遠。石田芳夫認為,其它軟件與職業選手實力相當至少還有10年(N3)。正如AlphaGo開發團隊DeepMind所言:“為捕捉游戲的直觀元素,我們需要一種新方法(N4)。”由此可見,戴密斯·哈薩比斯團隊已經認識到其它圍棋AI程序方法的局限性,因此將高級搜索樹和深度神經網絡相結合,使用“價值網絡”評估棋盤位置,使用“策略網絡”選擇走法,通過深度神經網絡結合人類專家游戲中的監督學習和自我游戲中的強化學習進行訓練[42],利用這種搜索算法,AlphaGo以99.8%的勝率擊敗了其它圍棋程序[42]。2016—2017年,眾多圍棋AI紛紛效仿AlphaGo架構實現飛躍性發展(N3),充分體現了機器學習在AI路徑實踐過程中的賦能引領作用(見表2)。
機器學習可以幫助行動者更好地理解并學習重要元素(N1)。首先,基于正向思維對研究案例予以審視,自人機大戰以來,職業棋手、社評專家及相關企事業機構借助不同方式表達了機器學習對于行動者能力的提升作用。其中,《連線》雜志曾經指出,樊麾在以“教練”身份與AlphaGo進行對弈訓練期間,其棋力水平大漲(N3);李世石認為,阿爾法圍棋非常出色,對圍棋了如指掌(N3);棋圣聶衛平曾稱呼AlphaGo為阿老師(N3);而柯潔所在團隊于2018年正式引入由騰訊人工智能實驗室(AI Lab)研發的AI程序“絕藝”輔助日常訓練,其多次幫助國家圍棋隊斬獲世界冠軍,并得到中國圍棋協會主席高度認可(N2)。其次,基于求異思維對研究案例予以審視。以往人們普遍認為AlphaGo是直接與人類職業棋手執子對弈,但通過相關報道可以發現,2015—2017年,AlphaGo無論是以線下方式與樊麾、李世石及柯潔等職業棋手對戰,抑或是以Master為名在知名圍棋網站與國際高手過招,其背后均存在一位不為人知的落子代執人——黃士杰。對于黃士杰博士本人而言,其雖然自幼熱愛、學習圍棋,并在相關賽事斬獲佳績,但專業能力尚處于業余水平,卻憑借AlphaGo代言人身份屢屢戰勝世界名將,并獲得引人注目的斐然成績。由此可見,AlphaGo的出現顛覆了人們對于人工智能甚至人機關系的傳統認知。在某一特定情境下,早期人類對于機器的智慧輸出大于機器對于人類的智慧輸入,而后期人類對于機器的智慧輸出卻小于機器對于人類的智慧輸入,即人類在與機器交互過程中存在“智慧逆差”“智慧順差”現象,這間接證明在知識輸入學習、知識創造輸出及知識轉化運用過程中,機器學習或運用機器學習的人工智能體對知識主體與知識受體具有凝結與反轉作用。綜上所述,機器學習能夠在短時間內獲取、掌握人類經過數千年實踐積累所形成的經驗策略,并以創造性機器經驗反向指導人類,進而提高行動者自我能力(見表3)。
表2 AlphaGo對戰機器階段機器學習賦能的典型證據Tab.2 Typical evidences of machine learning empowerment in the stage of Alphago combating machine
表3 AlphaGo對戰人類階段行動者能力提高的典型證據Tab.3 Typical evidences of enhanced actor competence in the stage of Alphago combating mankind
續表3 AlphaGo對戰人類階段行動者能力提高的典型證據Tab.3(Continued) Typical evidences of enhanced actor competence in the stage of Alphago combating mankind
2017年5月,AlphaGo在中國烏鎮圍棋峰會以3∶0的成績與屆時世界頂級棋手柯潔完成比賽。賽事結束后,AlphaGo創始人戴密斯·哈薩比斯宣布該AI程序不再與人類職業棋手對決,但它會繼續進行自我強化升級。2017年10月,DeepMind發布了新版程序AlphaGo Zero,不同于AlphaGo先前版本的學習方式,AlphaGo Zero不再受限于人類知識,其從完全隨機的棋局開始與自己對弈,取得強于所有先前版本程序的優異表現,并發現新知識、非常規策略和創造性招式(N4)。2017年底,DeepMind推出進化版本AlphaZero,從頭開始自學如何掌握國際象棋、將棋和圍棋,并在每一種情況下都擊敗了世界冠軍計算機程序(N4)。2020年12月,最新程序版本MuZero面世,它不僅學會了圍棋、國際象棋和將棋,而且在無需被告知任何游戲規則情況下精通一系列視覺復雜的雅達利游戲(N4)。盡管如此,不能簡單將AlphaGo在棋類游戲或視覺游戲上的成功歸結為機器學習對于人類能力影響作用的極限。正如戴密斯·哈薩比斯所言,要打造能探索宇宙的終極工具,就需要讓AlphaGo實現通用人工智能(N3)。實際上,DeepMind團隊自2016年便將AlphaGo與醫療領域相結合,其所創建的AlphaFold人工智能系統能夠準確預測蛋白質結構(N4),作為支持研究人員努力的強大工具,是迄今為止人工智能對于推進科學知識所作的最重要貢獻(N4),也是機器學習為人類創造利好并極限激發行動者能力的有力證據(見表4)。
表4 AlphaGo自我升級階段行動者能力精進的典型證據Tab.4 Typical evidences of the actor competence improvement in the self-upgrading stage
本文立足于“機器學習與行動者能力”這一核心問題,基于技術可供性視角,對谷歌公司(Google)旗下前沿人工智能公司DeepMind所開發的AlphaGo進行扎根理論分析,得出如下結論:
(1)機器學習具備技術可供性特征。機器學習作為新一代科技革命浪潮下的前沿引領技術,是計算機認識世界、改變世界的進入路徑,是特定對象(管理主體)作用于其他對象(管理客體)的新式工具、手段及程序方法,推動包含人、資源、機器人這一高階組織形式的形成[6]。在實際管理活動中,機器學習能夠有效驅動人工智能基于人類經驗或完全自主的重組并革新組織內部知識結構,創造并輸出新知識和新策略,為個人或組織提供一種或多種面向并實現既定目標的可能性。因此,機器學習能夠賦予并激發技術使用者額外潛能,符合現有研究對于技術可供性概念的界定。
(2)機器學習能夠提升行動者能力。受各種因素影響,人類所擁有并表現出來的實際能力存在閾值,但受益于人類的非限制性信念(從行動到結果對所經歷的事情始終抱有“有助、有望、有價值”的堅定信念),使得機器學習技術取得長足進步與發展。從某種意義上講,機器學習并不是一種體現人類科技發展水平的象征,而是一種滿足人類對知識獲取需要、趨近人類主觀意志的獨特學習方式,其擴大并加深了人類對于客觀世界所存“開源知識”的觸及范圍與理解程度,進而提高了特定對象的行動能力。
(3)技術迭代助力行動者能力精進。隨著科學技術的不斷發展,人工智能學習方式發生根本性改變,從基于已知訓練樣本完成學習任務的監督學習轉向無需已知訓練樣本完成學習任務的非監督學習。對于AI程序而言,學習方式改變釋放了其在實踐過程中主動獲取認識和經驗的潛能,而“機器認識”“機器經驗”成為機器學習創新認識客觀世界的重要基礎。對于行動者而言,依托機器對客觀世界的創新性認識,將為人類帶來新啟發、新思路和新技能,對行動者本人產生“創造性破壞”效應,即行動者能力將在單一目標取得“點式精進”成效,在多種目標取得“線式精進”甚至“面式精進”成效。
上述研究結論全面展現了行動者與機器學習之間的作用關系。一是機器學習與技術可供性理論的核心內涵高度契合;二是機器學習符合行動者的主觀認知,其能夠賦予行為主體更大的可能性;三是行動者與機器學習之間具有不可否認的能動作用。一方面,人類對于生產實踐的需要推動科學技術不斷進步;另一方面,新興技術發展提高并精進了行動者的行動能力。據此,本文構建技術可供性視角下機器學習與行動者能力理論模型,如圖3所示。
圖3 技術可供性視角下機器學習與行動者能力理論模型Fig.3 Machine learning and actor competence theory model from the perspective of technology affordance
(1)概念界定與視角驗證。本文通過對國內外文獻庫進行檢索、查閱與梳理,厘清了技術可供性理論演化路徑。在此基礎上,結合學者對技術可供性概念的界定,進一步剖析技術可供性理論的基本內涵,對于深入理解“技術”與“可供性”的內在聯系具有重要意義。與此同時,本研究運用科學研究方法驗證機器學習的可行性,為后續相關領域引入并應用機器學習視角開展深入研究奠定了堅實的理論基礎。
(2)機制解析與理論延伸。發展人工智能已成為當今社會主流趨勢,而機器學習則是開啟人工機器或人工系統智能化的重要驅動力。當前研究主要集中于概念詮釋、機制探索及應用展望等方面,其應用主要分布在新聞傳播、工業設計及在線教育等領域。本文對人工智能領域代表性企業開展研究,基于底層邏輯詮釋智能時代技術可供性的本質與形態,基于過程邏輯解析機器學習提高并精進行動者能力的作用機制,基于頂層邏輯發現并構建符合時代特征的“機器學習與行動者能力”理論模型,進一步完善了傳統技術可供性理論并延伸了其適用范圍。
(1)研發層面:強化基礎學科建設,夯實科研攻堅力量。世界頂尖科學家協會主席羅杰·科恩伯格指出,基礎科學是人類進步的希望;中科院院士劉維民認為基礎科學是科技發展的重要基石;中科院院士朱日祥表示,基礎研究是科技創新的源泉。由此可見,基礎科學對于構建國家核心競爭力具有不可替代的作用。2020年,為選拔適用于國家重大戰略需求且綜合素質過硬或基礎學科拔尖的人才隊伍,教育部啟動實施招生改革試點工作——強基計劃。該計劃施行以來成效顯著,但受多種因素影響,我國基礎科學研究較之歐美發達國家仍有差距。因此,應適時將“強基計劃”升級為“強基戰略”,在規制層面指導社會各層次教育機構及相關部門強化數學、物理、化學等基礎學科建設,激發拔尖創新人才對于前沿科技及關鍵領域的探索熱情,夯實我國創新驅動發展戰略下的科研攻堅力量,進而維護、增進并實現國家利益與發展目標。
(2)轉化層面:完善政策法規體系,助力科技成果轉化。戴密斯·哈薩比斯、大衛·席爾瓦及黃士杰在開展AlphaGo項目研究之前,已經投身于與計算機科學有關的學科研究很多年。可見,基礎科學研究具有長期性、復雜性及不可預見性等特征,主要體現在科研成果產出上。其中,長期性需要直接或間接調配使用自我經驗與他人經驗,在某種意義上體現為一種遞歸函數效應;復雜性需要直接或間接選擇控制解釋變量與無關變量,在某種意義上體現為一種多重回歸效應;不可預見性需要直接或間接絕對收斂目標集合與結果集合,在某種意義上體現為一種柯西分布效應。因此,為進一步提升科技項目攻堅轉化成效,政府應結合基礎科學研究的本質,在風險容忍與激勵補償層面建立并完善相應法規機制,降低機構或個體研發風險,并堅定基礎研究者的科研精神與科研信心。
(3)應用層面:重視新興技術應用,提高行為主體能力。首先,本文回答了“機器能思考嗎”這一源自圖靈時代便廣受計算機、人工智能相關領域關注的核心問題。機器學習作為一種實現人工智能從無到有、由弱至強的關鍵路徑,其在原始資料搜集、分析、判定層面為人類應對現實世界中普遍存在的非確定性問題提供了強有力支撐;與此同時,機器學習所表現出來的創造性行為也突破了人類固有的思維限定,上述現象是“機器思考”的集中體現;其次,近年來人們愈發擔心人類被機器所取代,需要明確的是,機器學習并不能被狹隘定義為專屬于機器的學習途徑,而是一種為滿足并服務于人類發展需要的學習方式。基于此,管理者應擯棄偏見,始終遵循自然事物發展規律,深刻認識到機器學習對于管理方法、管理模式及管理效益的賦能引領作用,重視機器學習及其它新興技術的運用,提高行動者解決所屬行業難題的能力,進而促進相關領域健康、穩定發展。
(1)人類的“熱思維”決定其正確理解世界萬物皆有其道的含義。因此,針對自然規律這一隱性開源知識,推動科學進步是外延人類行動能力的必要過程。而計算機的“冷思維”決定機器學習是認識自我、改變自我、提高自我的進入路徑,本質上是以學習試錯方式趨近并滿足人類的主觀意志。因此,針對人類社會出現的困點問題,應在主觀認知層面認識到科技創新對于增強社會文明主體能力的重要驅動作用。
(2)本文基于定性研究方法,探索并分析機器學習與行動者能力之間的內在聯系,未來將基于成熟量表、新開發量表檢驗兩種變量及其與其它變量之間的作用關系,以進一步揭示機器學習、大數據及人工智能等新興技術對于行動者能力的作用機理,進而提升相關部門、企事業單位及社會團體的管理決策成效。
(3)高端技術在服務于人類社會的同時,也為不軌分子提供了變相操作或博弈對抗的可能。因此,相關部門應加強從業者思想道德教育,推動反制技術研發,完善市場監管體系,優化刑罰懲治舉措,防范算法合謀、信息竊取、網絡攻擊等高科技犯罪或非道德行為的滋生與蔓延,確保市場主體公平競爭、市場機制高效運行、營商環境平和穩定。
(4)中共二十大報告指出:“我們要堅持推動高質量發展,加快現代化經濟體系建設,著力提升產業鏈供應鏈韌性和安全水平。”會議強調,沒有堅實的物質技術基礎,就不可能全面建成社會主義現代化強國。供應鏈金融對于國家戰略目標的順利實現具有重要支撐作用,而本研究所取得的階段性成果能夠為相關學者帶來一些啟示,進而助力中華民族偉大復興。