








摘 要:人工智能及控制設備在生產中的應用,對勞動者就業具有替代效應。當前國內研究大多以職業的人工智能替代風險作為測算對象,較少直接關注異質勞動者的人工智能就業替代風險。本文基于工作任務方法,利用中國勞動力動態調查(CLDS)數據,選取勞動者個人特征、工作任務和從事職業特征三方面輸入變量,運用機器學習模型測算每一勞動者個體的替代概率。依據個人特征將勞動者劃分為12個異質性群體,對比分析異質勞動者群體的就業替代風險。結果表明:(1)我國處于低、中、高替代風險等級的勞動者份額依次為52.9%、24.2%和22.8%;(2)“使用互聯網”工作任務、所從事職業的“學歷要求”和“培訓要求” 三個變量對勞動者的替代風險影響較大;(3)受教育程度低的勞動者群體的平均替代概率較高,其中處于23~35歲勞動者的替代概率最低;(4)職業流動是化解勞動力市場總體替代風險的有效途徑,但其效用對勞動者個體是非對稱的;(5)部分高風險勞動者的替代風險傾向于固化,需警惕其替代風險轉化為失業風險。
關鍵詞:
人工智能;勞動者就業;人力資本水平;替代風險;工作任務方法
中圖分類號:F241.4;TP18
文獻標識碼:A文章編號:1007-2101(2024)02-0066-11
收稿日期:2023-05-02
基金項目:
國家社會科學基金一般項目“人工智能驅動的職業流動模擬及2035年勞動力市場技能短缺狀況預估研究”(22BTJ032)
作者簡介:
孫望書(1992-),女,遼寧鐵嶺人,東北財經大學博士研究生;孫旭(1974-),女,遼寧大連人,東北財經大學教授,博士。
作為近年來最重要的原始技術變革,人工智能及相關技術深刻改變勞動力市場的技能需求,這引發了人工智能發展對勞動者就業替代的全球性討論。“機器換人”“技術性失業”是否會大規模發生?哪些勞動者的工作崗位最容易被人工智能所取代?21世紀初,Autor等[1]觀察過去幾十年美國勞動力市場的結構性轉變,提出工作任務框架和“程序性”假設——人工智能及控制設備能夠在生產活動中替代勞動者執行“常規認知型”和“常規操作型”任務①,解釋美國中等收入勞動者人數相對減少、低收入和高收入勞動者人數相對增加的就業“空心化”現象。“人工智能在常規任務中對工人勞動的替代作用強于非常規任務”這一經驗事實,為執行不同類型任務的勞動者的就業替代風險提出了參考。
隨著人工智能及其控制設備對人類體力和腦力勞動的替代范圍和程度不斷擴大和加深,學者對未來人工智能引致的更復雜的就業替代問題開展了前瞻性探討。其中,Frey和Osborne[2]、Arntz等[3]針對美國勞動力市場,分別在職業和工作任務微觀層面測算了人工智能的就業替代風險,兩項研究具有廣泛的國際影響力,“職業方法(Occupation-Based Approach)”和“工作任務方法(Task- Based Approach)”成為測算人工智能就業替代風險的代表性方法。
“職業方法”是以職業為對象的測算方法,Frey和Osborne[2]開創性地測算了美國702種職業的人工智能就業替代概率。研究基礎方面,Frey和Osborne[2]通過系統闡述大數據背景下機器學習相關領域的前沿技術、應用場景和相對優勢指出,
感知和操縱、創造性智能和社交智能三項任務的智能化技術瓶頸將難以在未來十至數十年間突破。因此,一項職業要求工人執行此三類工作任務的程度越高,該職業的就業越難被人工智能替代。實證階段首先選取美國職業信息網絡(The Occupational Information Network,O*NET)中每種職業的9項屬性(Element),作為反映執行三類工作任務必要程度的輸入變量。再結合人為標注的70類職業的人工智能替代概率,利用高斯分類模型測算出美國702類職業的人工智能就業替代概率。最后基于“同一職業內所有勞動者的替代概率相同且等于該職業的就業替代概率”假設,將職業的替代概率轉換為每一位勞動者的替代概率。根據2010年勞工職業分布統計數據測算,美國47%的勞動者面臨高替代風險(替代概率大于0.7)。
“工作任務方法”是以一組工作任務為對象的測算方法。在“職業方法”的基礎上,Arntz等[3]認為由于同一職業下勞動者執行的工作任務可能存在差異,人工智能對各工作任務組合的替代概率也并不相同,故而面向每組工作任務,即每位勞動者測算其人工智能就業替代概率。實證階段利用“國際成人能力評估計劃(PIAAC)”受訪勞動者數據構建廣義線性模型,模型的被解釋變量是Frey和Osborne[2]測算的勞動者從事職業的就業替代概率,解釋變量包括勞動者執行的工作任務,以及勞動者個人特征、工作環境、技能需求方面的42項特征。模型計算了每位受訪勞動者的人工智能替代概率擬合值,沿用Frey和Osborne[2]劃分風險的經驗標準,受訪勞動者中具有高替代風險的勞動者占比為9%。結論引申為美國勞動力市場中有9%的勞動者面臨高就業替代風險,這一水平遠低于Frey和Osborne[2]的測算結果。
一、文獻回顧
(一)“人工智能的就業替代風險”國內外研究進展
在“職業方法”和“工作任務方法”的啟發下,不少學者進行了人工智能就業替代風險的多國本土化研究和國際比較研究。“職業方法”方面,一些學者假設各國職業的替代概率相同,通過職業代碼轉換將美國職業的就業替代率對應到本國標準職業類別中[4-6]。也有學者依據本國職業特征,或考量本國人工智能發展階段,自行選取輸入變量、訓練集職業和標注替代概率,采用適宜的模型擬合和測算本國職業的就業替代概率[7]。“工作任務方法”方面,Nedelkoska和Quintini[8]利用PIAAC調查,選取10項工作任務為輸入變量,建立邏輯回歸模型測算加拿大受訪勞動者的人工智能替代概率。此外也有其他預判人工智能技術沖擊下勞動者就業結構性變化的研究方法,如牛津經濟研究院[9]基于專家定量估計的人工智能時代勞動力市場對各項工作任務的需求變化,預估各職業勞動者就業規模的變化份額。
國內學者對我國勞動力市場的人工智能就業替代風險展開分析。基于“職業方法”,李磊和何艷輝[10]將美國職業的就業替代概率匹配到我國240個職業類別中,發現我國約76%的勞動者具有高就業替代風險。龔遙和彭希哲[11]遵循“職業方法”的研究思路,首先基于“智能體工作能力等級”框架,從O*NET中選取16個職業屬性作為輸入變量,利用隨機森林分類器對美國967類職業的人工智能就業替代概率進行再測算。隨后將美國職業的替代概率再測算結果對應到我國國家職業資格管理數據庫的職業大類、中類和小類中,發現我國15.11%的勞動者具有高替代風險。基于“工作任務方法”,王林輝等[12]利用中國勞動力動態調查(CLDS)中4 321名個體勞動者的填報數據,根據我國人工智能發展現狀設定訓練集職業,選取15項任務屬性作為輸入變量擬合機器學習算法,測算出我國約20.92%的勞動者具有高替代風險。范長煜和唐斌斌[13]運用探索性潛類別分析(ELCA)方法,面向工作任務對象,利用2018年廣東省制造業企業調查數據,測算出我國制造業一線工作崗位中54.24%易被人工智能替代。
(二)“人工智能的就業替代風險”研究比較
本文所列研究對人工智能就業替代風險等級的劃分均沿用Frey和Osborne[2]的經驗標準,然而從研究發現上看,無論面向國際或國內勞動力市場,多項研究的人工智能就業替代風險測算結果都顯現出很大差異,造成差異的原因可能是多重的。
第一,研究方法不同。“職業方法”考察一項職業執行工作任務的平均水平,而“工作任務方法”則考慮職業下工作任務(組合)的變異。Autor和Handel[14]認為“職業方法”可能高估職業的就業替代風險,作者認為兩個方法的本質區別在于前者視同一職業下的勞動者為同質,因而人工智能可能替代職業的全部崗位,而后者考慮同一職業下勞動者的異質性,人工智能可能只替代職業下的部分崗位,但這不意味著“職業方法”測算的勞動力市場替代風險一定高于“工作任務方法”。
第二,選取訓練集職業和標注替代概率的標準不同。構建訓練集是擬合機器學習算法前的重要工作,需要在全部樣本中選取一部分,人為標注標簽0或1,代表該樣本完全不能夠被人工智能替代就業或完全能夠被替代。Frey和Osborne[2]在選取訓練集職業和標注替代概率時組織一批人工智能領域研究專家,前瞻性討論未來十至數十年間人工智能發展以替代工人勞動的技術可行性,選取他們“最有信心”斷定的70個職業,將其中33個職業的替代概率標記為0,37個職業的替代概率標記為1。因而,Frey和Osborne[2]及后續多數引用這一訓練集的研究均是面向人工智能發展前景、基于技術可行性測算的替代風險。王林輝等[12]在構建訓練集時考慮了我國與發達國家人工智能技術發展程度的差異,認為我國整體技術發展仍處于追趕世界前沿技術階段,因此將Frey和Osborne[2]認定的19個0標簽職業下的勞動者樣本標注為0。再利用技術專利、新聞咨詢和機器人數量三方面佐證材料,判斷13個職業在當前技術條件下人工智能具備完全替代工人勞動的可行性,將這些職業下的全部勞動者樣本標注為1。王林輝等[12]測算了基于我國當下技術可行性的人工智能替代風險。
第三,輸入變量包含的維度不同。Frey和Osborne[2]、Nedelkoska和Quintini[8]在選取輸入變量時緊密圍繞三項“存在技術瓶頸的工作任務”,僅以職業或勞動者執行的工作任務維度作為模型輸入。王林輝等[12]提出同時考慮工作任務中容易被人工智能替代和難以被替代兩方面程度,他們選取15個工作屬性,如閱讀能力、普通話能力、合作能力等作為輸入變量。Arntz等[3]模型的輸入變量既包含工作任務維度,也包含勞動者的個人特征、工作環境、技能需求維度,從回歸結果上看,在全部42個輸入變量中,有39個變量在0.1水平上統計顯著。“工作任務”方法下增加輸入變量的信息維度,補充了職業下勞動者特征的變異性,能夠體現勞動者在就業沖擊下的相對競爭。增加輸入變量維度還可能有助于提升模型的擬合水平,同時也可能造成變量間共線性問題。
第四,數據、模型等方面的差異。采用數據源的生成時間、樣本的代表性差異可能影響替代概率的測算結果和分布。另外,采用不同模型擬合訓練集,以及模型參數的設置,都可能影響模型擬合和泛化的結果。
對于人工智能就業替代概率的后續分析和論述,當前研究大多在職業層面開展,如歸納高、中、低就業替代風險職業的特征,分析職業的就業替代風險與職業屬性的關系,分析職業的就業替代風險對職業的就業份額、工作時長等影響。以勞動者為對象,解答“哪些勞動者可能被人工智能替代就業”問題的研究結論相對欠缺。對此,本文首先以勞動者為研究對象,考慮其在勞動者市場及職業內部的異質性,利用“工作任務方法”測算勞動者的人工智能替代概率。隨后基于測算的替代概率,從兩個方面考察勞動者的人工智能就業替代風險。第一,利用個人特征將勞動者劃分為異質性群體,比較分析各勞動群體當前的替代風險。第二,基于勞動者的職業流動史,分析異質勞動群體通過職業流動化解替代風險的潛力。本文的邊際貢獻主要有:第一,利用“工作任務方法”測算人工智能替代概率,充分考量勞動者異質性,豐富輸入信息維度,選取個人特征、工作任務和職業特征三方面輸入變量,測算結果更能體現人工智能技術沖擊下我國勞動力市場的就業相對競爭。第二,以勞動者為研究對象,提示異質勞動群體的人工智能就業替代風險。第三,關注職業流動對于吸收勞動力市場就業替代風險的能力,分析異質勞動群體化解替代風險的潛力,預示具有潛在“技術性失業”風險的勞動群體,并為部分具有高替代風險的勞動者指明可能降低風險的職業流動路徑。
二、樣本與模型
(一)數據來源
勞動者樣本來自中國勞動力動態調查(CLDS)最新發布的2018年調查數據。CLDS是中山大學發起的以勞動力為主題的全國性跟蹤調查,覆蓋范圍包括全國29個省份(除西藏、 海南、中國香港、澳門、臺灣外),建立了以勞動人口為調查對象的綜合性數據庫。CLDS問卷中設有“工作狀況”和“工作史”調查部分,調查內容涵蓋勞動者人口基本信息、教育經歷、掌握技能情況,工作場景中執行的工作任務類型,勞動者所從事職業的工作環境、技能要求等,以及勞動者的職業流動歷史。CLDS數據支持國內多項勞動力市場就業態勢研究和技能需求變遷研究[15-17],是具有一定影響力和公信力的微觀勞動數據源。在2018年開展的最新一輪調查中,CLDS關注時下人工智能及自動化設備在生產活動中可能帶給勞動者的沖擊,在問卷中增設相關問題,調查勞動者所在工作單位是否正在使用人工智能及相關技術或設備、人工智能是否對勞動者的日常工作造成影響等。本文以2018年CLDS調查數據為主要數據源,因為其不僅契合本文研究目的,還具備較此前調查信息維度更廣、調查內容更貼切的獨到優勢。
CLDS調查根據勞動者當前的就業狀態,將勞動者分為雇員、雇主、自雇和務農四種就業方式,對四類勞動者分別設置了差異化調查內容。本文的主要研究對象是以雇員方式就業的勞動者,樣本量為4 262人,涵蓋以GB/T 6565—2015《職業分類與代碼》標準編碼的223類5位職業碼。雇員樣本的職業大類分布如表1所示,職業分布與我國2018年全國經濟普查中的職業(非農業)結構比較接近。以雇主、自雇兩種方式就業的勞動者,其替代風險可能受到市場因素和主觀因素共同作用;在我國城鄉二元經濟結構中,農民身份和農民職業大多是非市場化的,因此雇主、自雇、務農勞動者的替代風險不適用于一般分析,故不納入測算樣本。
(二)構建和擬合模型
模型的輸入變量方面,選取CLDS問卷中的20個問題,生成20個輸入變量,涵蓋勞動者個人特征、工作任務和從事職業特征三方面。勞動者個人特征方面,選取勞動者的性別、年齡2項人口基本信息,受教育程度、是否獲得專業技術資格證書、收入能力和外語能力4個變量反映勞動者技能特征。工作任務方面,選取管理下屬、繁重的體力勞動、頻繁移動身體、快速反映思考或腦力勞動、使用互聯網5個任務變量,以及工作任務內容自主性、工作進度安排自主性、工作強度安排自主性3個反映任務常規程度的變量。職業特征方面,選取職業的學歷要求、經驗要求、技能要求、培訓要求4個變量,以及根據2018年調查增設的2個問題——工作單位是否正在使用人工智能技術、工作有沒有被人工智能技術改變生成的人工智能應用程度變量。
標注訓練集樣本的替代風險標簽,參照王林輝等[12]的訓練集構建方案,將裝卸搬運和運輸代理服務人員、倉儲人員、紡紗人員、針織人員、印刷人員、橡膠制品生產人員、塑料制品加工人員、包裝人員共8個職業下的119個勞動者樣本標注為1,將基層群眾自治組織負責人、企業負責人、建筑工程技術人員、西醫醫師、中醫醫師、律師、高等教育教師、中等職業教育教師、中小學教育教師、幼兒教育教師、工藝美術與創意設計專業人員、生活照料服務人員、美容美發和浴池服務人員共13個職業下的432個勞動者樣本標注為0。
考慮到輸入變量間可能在受教育程度方面存在共線性,為了降低共線性影響,構建模型時采取兩方面措施。第一,采用對變量共線性不敏感的隨機森林(RF)算法構建擬合模型[18],同時構建邏輯回歸(LR)和支持向量機(SVM)模型檢驗擬合結果的穩健性。第二,對受教育程度等多分類定序變量進行離散化處理,處理為“高”“中”“低”三水平分類,以降低輸入變量間的相關性。模型擬合階段,利用訓練集的輸入變量和0-1類別標簽,在合理取值范圍內調整參數使模型對數據的預測精度最高。模型泛化階段,在模型中輸入全部勞動者樣本的特征變量,模型輸入樣本中每一位勞動者的替代概率。本文在Python環境下構建模型,經十折交叉驗證,RF、LR、SVM模型的預測精度分別為0.870、0.864、0.862,三個模型測算的勞動者替代概率具有較高的準確性和穩健性。
三、勞動者的就業替代概率測算結果與分析
(一)勞動者的就業替代概率分布
圖1為RF、LR和SVM三個機器學習模型測算的勞動者替代概率分布直方圖,其中橫軸為就業替代概率,縱軸為勞動者占樣本份額。三個模型測算的勞動者替代概率分布特征相似,均呈現右偏的“U”型分布;在橫軸左側,即替代概率較低的一側,三個模型均顯示處于[0,0.1]區間的勞動者最多,占樣本比例依次為30.8%、34.7%和35.9%。在橫軸的中間部分,RF和SVM模型顯示分布在(0.5,0.6]區間的勞動者人數較少,占比依次為5.6%和3.8%,LR模型則顯示分布在(0.3,0.4]區間的勞動者人數較少,占比為6.1%。在橫軸右側,RF和SVM模型顯示分布在替代概率較高一側的勞動者占比呈現升高趨勢,兩模型處于(0.9,1]區間的勞動者占比分別為7.5%和10.9%;LR模型則顯示分布在此區間的勞動者人數最少,占比為5.9%。總體上看,我國勞動者的替代概率較低,但仍有部分勞動者具有較高的替代概率。
遵循Frey和Osborne[2]的替代風險劃分標準,將替代概率劃分為[0,0.3]、(0.3,0.7]和(0.7,1]三個區間,分別代表低、中、高就業替代風險。表2報告了三個機器學習模型測算的處于低、中、高風險等級的勞動者占比,以及三個模型的均值。從表2中得知,三個模型測算的低風險勞動者占比均不低于50%,處于中風險的勞動者占比約為24.2%,處于高風險的勞動者占比約為22.8%。
(二)輸入變量的貢獻率
由于三個機器學習模型中隨機森林模型的預測精度相對較高,后文以隨機森林模型的測算結果作為樣本中每一位勞動者的替代概率。表3報告了20個輸入變量的貢獻率,代表輸入變量對測算勞動者就業替代概率的相對重要性。從表3得知,全部輸入變量中重要程度最高的變量為使用互聯網、學歷要求和培訓要求,貢獻率依次為10.12%、9.89%和9.79%。這三個變量都是勞動者技能的直接體現。在勞動者個人特征方面,貢獻率最高的變量為受教育程度和年齡,貢獻率分別為8.66%和5.78%;在工作任務方面,貢獻率最高的變量為使用互聯網和繁重的體力勞動,貢獻率分別為10.12%和7.97%,兩個變量分別鮮明地代表了與人工智能互補和替代的兩種工作任務類型;在職業特征方面,貢獻率最高的變量為學歷要求和培訓要求,其次是技能要求,貢獻率為6.02。以上變量均顯示出勞動者人力資本水平是影響其就業替代風險的根本因素。
四、異質勞動者的就業替代風險
(一)勞動者個人特征與就業替代風險分析
基于隨機森林模型測算的勞動者替代概率,分析勞動者6項個人特征變量與就業替代概率的關系,如表4所示,變量根據貢獻率由高到低順序呈現。分析表4得知,勞動者的受教育程度與其替代概率呈負相關,受教育程度越高的勞動者平均替代概率越低,且分布更為集中,相應地具有高替代風險的勞動者占比也越低。勞動者年齡區間上,處于23~35歲勞動者的替代概率最低,其后隨著年齡升高,平均替代概率也升高。年齡處于16~22歲勞動者的替代概率高于23~35歲勞動者,這很可能是由于他們相對欠缺工作經驗。勞動者的收入能力與其替代概率呈負相關。男性勞動者的平均替代概率高于女性勞動者,原因可能在于男性勞動者執行常規操作型任務的比重相對較大,而女性勞動者相對較多執行溝通、服務等工作任務。是否獲得專業技術資格證書、外語能力是兩個具體顯示勞動者專業技能的變量,從表4中可以看出,獲得專業技術資格證書的勞動者,平均替代概率明顯低于未獲得專業技術資格證書的勞動者;類似地,具有高外語能力的勞動者,平均替代概率明顯低于低外語能力的勞動者。
(二) 異質勞動者群體的就業替代風險
根據勞動者個人特征中貢獻率最高的兩個變量,受教育程度和年齡的交互,將勞動者劃分為12個異質群體,分別測算每個勞動者群體的就業替代風險,對比分析群體間替代風險的差異。表5顯示了12個異質勞動者群體的平均替代概率和群體中高風險勞動者占比。
替代概率最高的群體是低等受教育程度的36~65歲勞動者,原因在于他們不僅人力資本水平較低,適應新技術、與之形成技能互補的潛力也較弱;其次是低等受教育程度的16~35歲勞動者,相對于同等受教育程度的年長勞動者,他們的替代風險較低,但平均替代概率和高風險勞動者占比仍遠高于全社會平均水平。中等受教育程度4個年齡層的勞動者群體平均替代概率彼此相差不大,且均與全社會平均水平較為接近,高風險勞動者占比則低于全社會高風險勞動者占比。其中,36~45歲勞動者中的高風險勞動者占比最低,這可能得益于經驗的積累和較高強度的工作。高等受教育程度4個年齡層的勞動者群體平均替代概率和高風險勞動者占比均明顯高于全社會平均水平。其中,16~22歲勞動者樣本人數較少,主要原因在于這一年齡段人群多數尚未接受或完成高等教育,因而該勞動者樣本的替代概率代表性稍差;高等受教育程度的36~45歲勞動者人力資本水平最高,其平均替代概率在全部12個群體中屬最小。同等受教育程度下23~35歲勞動者和46~65歲勞動者的平均替代概率差距不大,但46~65歲勞動者中的高風險勞動者占比略高于23~35歲勞動者。
同一年齡層不同受教育程度的勞動者,就業替代風險有明顯差距,受教育程度越高,替代風險明顯越低。總結而言,低等受教育程度的所有勞動者都具有很高的替代風險,其中35歲以上勞動者的替代風險尤為突出。
五、異質勞動者化解就業替代風險的潛力
(一)勞動者職業流動與就業替代風險
微觀職業流動是指勞動者從一個工作崗位轉移到另一個工作崗位,全部勞動者的微觀職業流動構成勞動力市場的宏觀職業流動,是一種重塑勞動力市場就業結構的調節機制。目前相關文獻已經表明,在受到外生沖擊(如金融危機)時,勞動力市場的職業流動有所加劇,對于吸收不對稱需求沖擊[19-20]具有一定效用。盡管技術變革是一種特殊的細粒度、不對稱、長期性事件,不能夠完全被視為外生沖擊,但分析職業流動調節勞動力市場就業替代風險的能效具有學術和應用價值。宏觀層面,促進和引導職業流動,能夠化解勞動力市場的大規模失業風險。微觀層面,職業流動是勞動者個體在技術沖擊下,規避失業風險的首要選擇。評判異質勞動者的就業替代風險,不僅需要掌握勞動者當前的替代風險,還需考量勞動者通過職業流動化解替代風險的潛力。
CLDS詢問勞動者的既往工作史,雇員樣本中有1 972位勞動者有職業流動經歷,占全部樣本的46.3%,其余勞動者則自進入勞動力市場起一直從事當前職業。分析勞動者替代概率與其職業轉換行為是否具有相關性,可對有職業流動經歷的勞動者群體和無職業流動經歷的勞動者群體特征進行對比觀察。考慮到不同工作年限勞動者的職業經歷可能差別很大,在此控制了年齡因素。表6列出了不同年齡層勞動者的職業經歷和替代概率。從表6中可以看出,在各個年齡層,有職業流動經歷的勞動群體的人工智能就業替代風險均高于無職業流動經歷的勞動群體,勞動者的職業流動行為可能與其替代概率相關,替代概率較高的勞動者更傾向于職業流動。從表6中也可以看出樣本中有無職業流動經歷的勞動群體在一個崗位上的平均工作年限存在區別,職業流動也可能是受到流動機會的影響。
針對有職業流動經歷的勞動者,觀察其在職業流動前后替代概率的變化情況。由于勞動者的就業替代概率是面向當前職業崗位測算的,需結合勞動者所在的特征群體、職業和職業流動時間,估測其在上一份職業崗位上的替代概率。首先,以職業—特征勞動群體為測算單位,考慮到小樣本的代表性問題,將職業分類標準調整為職業中類,測算每一中類職業下各特征勞動群體的平均就業替代概率。然后,根據勞動者職業流動的時間(缺失值以平均水平計),計算出勞動者在從事上一份工作時的年齡,假設職業轉換前后勞動者的最高學歷不變,以勞動者在上一份職業時所屬勞動群體在該職業中的平均就業替代概率,作為勞動者職業流動前的就業替代風險。基于勞動者職業流動前后的就業替代概率進行后續分析,發現這些有職業流動經歷的勞動者,職業流動前的平均替代概率為0.429,流動后平均替代概率下降到0.395。由此可見,職業流動有效降低了勞動力市場總體的就業替代風險。
觀察勞動者的職業流動具體情況發現,職業流動前處于低替代風險的勞動者,大多數(74.8%)在職業流動后仍處于低風險,極少數(3.2%)流動后替代概率升高至高風險等級。對于職業流動前處于中風險的勞動者,流動后仍為中風險的占多數(37.8%),職業流動后成為低風險和高風險勞動者的占比分別為33.0%和29.2%。這表明中風險等級勞動者的替代概率具有波動性,容易向低風險或高風險進行轉移。至于流動前處于高風險的勞動者,有43.6%在職業流動后仍處于高風險,30.9%的勞動者流動后替代概率下降至中風險等級。這意味著高風險勞動者的就業替代風險是相對容易固化的,應尤為警惕高風險勞動者的替代風險演化成為失業風險。
(二)異質勞動者的職業流動方向分析
職業流動勞動者群體中,職業流動后替代概率降低的勞動者,或稱“向風險降低方向職業流動”的勞動者有1 131人,占比為57.4%;替代概率升高的勞動者,即“向風險升高方向職業流動”的勞動者有841人,占比為42.6%,即多數勞動者通過職業流動降低了替代風險。探究職業流動前后異質勞動者的替代風險變化情況,如圖2所示。相較于職業流動勞動者群體的總體水平(圖2中虛線),16~22歲勞動者職業流動后向替代風險升高的方向進行職業流動,而23~35歲勞動者則傾向于職業流動后風險降低。女性勞動者的職業流動相較于男性勞動者,更傾向于向替代風險降低方向的職業流動。受教育程度和收入能力方面,隨著勞動者受教育程度或收入能力水平等級升高,逐步傾向于向替代風險降低的方向進行職業流動。有專業技術資格證書的勞動者傾向于向替代風險降低方向流動,無專業技術資格證書的勞動者則傾向于向替代風險升高方向職業流動。類似地,外語水平等級較高的勞動者傾向于向替代風險降低的方向進行職業流動,外語水平等級較低的勞動者則正好相反。由此可見,盡管職業流動有助于降低總體替代風險,其效用對與勞動者個體而言是不對稱的。
(三)高風險勞動者降低替代風險的職業流動路徑
高風險勞動者的潛在失業風險令人擔憂。表7列舉了勞動者平均替代概率最高的10個中類職業,稱為“高風險職業”,其中9個為生產制造及有關職業,1個為社會生產服務職業。根據職業流動歷史數據,找到高風險職業勞動者有機會流向且平均替代概率較低的職業,作為該高風險職業特定的“避風港”職業。勞動者從高風險職業向其特定的“避風港”職業流動,有助于降低其就業替代風險。
發現“避風港”職業,需要分析勞動者可能在哪些職業間發生流動。基于有職業流動經歷的勞動者樣本,將其職業流動記錄中前一時期從事的職業作為行,后一時期從事的職業作為列,或稱流出職業為行,流入職業為列,統計出一張二維職業流動表。職業流動表中單元格內頻數(fij)的大小直觀反映了行職業i與列職業j之間的流動情況,頻數越大說明兩種職業之間的職業流動越頻繁。同時考慮總頻數(f..)、行頻數(fi.)和列頻數(f.j)對fij的影響,以fij與期望頻數f'ij的比值作為反映行職業i向列職業j流動機會的度量,當比值大于1時,認為職業i勞動者“有機會”流動到職業j。
表7列舉了高風險職業及其特定的“避風港”職業,從中可以看出高風險職業特定的“避風港”職業也主要是生產制造和社會生產服務職業。需要說明的是,“避風港”職業是基于職業流動歷史數據總結的,對于勞動者個體而言,進入“避風港”職業的前提是能夠滿足該職業崗位的技能等需求。表7還顯示一些高風險職業,如“采礦人員”“化學原料和化學制品制造人員”,只對應很少的“避風港”職業,這些職業的勞動者可能面臨職業流動困境,就業替代風險傾向于固化。
六、總結與討論
人工智能及相關技術對工人勞動的替代作用在過去幾十年間已有所體現。針對人工智能對未來勞動者就業沖擊的影響,Frey和Osborne[2]與Arntz等[3]開創性地提出了基于職業和基于工作任務兩條不同的預測思路。當前國內相關研究,無論采用職業方法或工作任務方法,大多把職業作為研究對象,測算“職業的替代概率”,再假設同一職業內所有勞動者的替代概率相同,根據職業結構將職業替代概率轉換為宏觀層面上勞動者替代的份額;一些研究甚至將“職業的替代概率”解讀為“職業的就業減少份額”預判勞動者的替代份額。文本沿用Arntz等[3]的研究思路,直接以勞動者為對象,測度每一位勞動者的人工智能就業替代概率。首先,利用來自CLDS最新發布的2018年微觀調查數據庫,從中選取勞動者個人特征、工作任務和從事職業特征三個方面的20個指標作為輸入變量;隨后,構建符合我國人工智能技術發展階段的訓練集;最后,分別擬合邏輯回歸(LR)、支持向量機(SVM)和隨機森林(RF)三個機器學習模型,測算樣本中每一位勞動者的替代概率。測算結果表明,我國勞動者的替代概率呈現右偏的“U”型分布,處于低、中、高替代風險等級的勞動者占比依次為52.9%、24.2%和22.8%。
在全部輸入變量中,使用互聯網、學歷要求和培訓要求三個變量對勞動者替代概率的重要性最突出。此外,勞動者個人特征方面,受教育程度和年齡對其替代概率的影響最大;工作任務方面,使用互聯網、繁重的體力勞動兩項工作任務的貢獻率相對較高;職業特征方面,工作的技能要求貢獻率也很高。這說明體現勞動者人力資本水平的教育、經驗、技能等是影響其就業替代風險的根本因素。
勞動者個人特征與其就業替代風險存在相關關系。處于23~35歲的勞動者平均替代概率在所有年齡層中最低;男性勞動者的平均替代概率高于女性勞動者;勞動者的受教育程度、收入能力與其替代概率呈負相關;獲得專業技能資格證書以及外語水平高的勞動者,平均替代概率低于無專業技術資格證書或外語水平低的勞動者。異質勞動者群體中,受教育程度低且年長的勞動者替代風險最高,其次是受教育程度低的年輕勞動者。兩個群體的替代風險值得格外關注。
職業流動有助于降低勞動者群體的替代風險,但職業流動對勞動者個體替代風險的影響是不對稱的。高風險勞動者的替代風險是傾向于固化的,較難通過職業流動來規避潛在失業風險。相對而言,23~35歲的勞動者傾向于向替代風險降低的方向進行職業流動,而16~22歲勞動者的職業流動則與之相反。女性勞動者較男性勞動者更容易通過職業流動降低風險;類似地,受教育程度高、收入能力高、擁有專業技能的勞動者相對更容易通過職業流動降低替代風險。基于職業流動歷史數據,發現了部分高風險職業的“避風港”職業。向“避風港”職業進行流動,有助于降低勞動者的就業替代風險。
本文分析對象為勞動力市場中以雇員形式就業的勞動者。此外,我國還有大批務農勞動者,僅從務農勞動者的個人特征、主要從事繁重的體力勞動和頻繁移動身體兩項工作任務、職業自主性差、培訓等要求低特征上看,農民勞動者的平均替代概率估計值約為75.5%,處于高就業替代風險的務農勞動者占比為67.1%。從測算結果上看,務農勞動者的替代風險遠高于雇員勞動者,個人特征層面也表明他們難于向替代風險降低的方向進行職業流動。務農勞動者群體的潛在失業風險值得關注,有待進一步討論。
注釋:
①Autor等的論文討論計算機(Computer)對勞動的替代,下文Frey和Osborne、Arntz等的論文分別使用“計算機化”(Computerisation)和“自動化”(Automation)表達替代勞動之意。本文將計算機及其他載體,通過模仿人類功能、結構和行為進行生產活動都歸屬于人工智能替代工人勞動的范疇,因而不在引用上述研究時區別用詞。
參考文獻:
[1]AUTOR D H,LEVY F,MURNANE R J.The Skill Content of Recent Technological Change:An Empirical Exploration[J].Quarterly Journal of Economics,2003(4):1279-1333.
[2]FREY C B,OSBORNE M A.The Future of Employment:How Susceptible Are Jobs to Computerisation?[EB/OL].(2013-09-17)[2023-05-02].https://www.oxfordmartin.ox.ac.uk/downloads/academic/The_Future_of_Employment.pdf.
[3]ARNTZ M,GREGORY T,ZIERAHN U.The Risk of Automation for Jobs in OECD Countries:A Comparative Analysis[C/OL].Paris:OECD Social,Employment and Migration Working Papers,(2016-05-16)[2023-05-02].https://www.oecd-ilibrary.org/social-issues-migration-health/the-risk-of-automation-for-jobs-in-oecd-countries_5jlz9h56dvq7-en.
[4]PAJARINEN M,ROUVINEN P.Computerization Threatens One Third of Finnish Employment[C/OL].Helsinki:ETLA Briefs,(2014-01-13)[2023-05-02].https://www.etla.fi/wp-content/uploads/ETLA-Muistio-Brief-22.pdf.
[5]PAJARINEN M,ROUVINEN P,EKELAND A.Computerization Threatens One-Third of Finnish and Norwegian Employment[C/OL].Helsinki:ETLA Briefs,(2015-08-22) [2023-05-02].https://www.etla.fi/wp-content/uploads/ETLA-Muistio-Brief-34.pdf.
[6]BRZESKI C,BURK I.Die Roboter Kommen:Folgen der Automatisierung für den deutschen Arbeitsmarkt[J].INGDiBa Economic Research,2015,30:1-7.
[7]DAVID B.Computer Technology and Probable Job Destructions in Japan:An Evaluation[J].Journal of the Japanese and International Economies,2017,43:77-87.
[8]NEDELKOSKA L,QUINTINI G.Automation,Skill Use and Training[C/OL].Paris:OECD Social,Employment and Migration Working Papers,(2018-03-08)[2023-05-02].https://www.oecd-ilibrary.org/employment/automation-skills-use-and-training_2e2f4eea-en.
[9]OXFORD ECONOMICS.The AI Paradox: How Robots Will Make Work More Human[R/OL].London:Oxford Economics,(2018-02-26) [2023-05-02].https://www.oxfordeconomics.com/resource/the-AI-paradox/.
[10]李磊,何艷輝.人工智能與就業——以中國為例[J].貴州大學學報(社會科學版),2019(5):13-22.
[11]龔遙,彭希哲.人工智能技術應用的職業替代效應[J].人口與經濟,2020(3):86-105.
[12]王林輝,胡晟明,董直慶.人工智能技術、任務屬性與職業可替代風險:來自微觀層面的經驗證據[J].管理世界,2022(7):60-79.
[13]范長煜,唐斌斌.半數崗位易替代:警惕“機器換人”的技術性失業風險——基于2018年廣東省制造業企業調查數據的分析[J].學術論壇,2020(3):9-17.
[14]AUTOR D H,HANDEL M J.Putting Tasks to the Test:Human Capital,Job Tasks,and Wages[J].Journal of Labor Economics,2013(S1):S59-S96.
[15]魏下海,張沛康,杜宇洪.機器人如何重塑城市勞動力市場:移民工作任務的視角[J].經濟學動態,2020(10):92-109.
[16]楊一純,李汪洋,謝宇.農民轉型與中國工業化:“工業化轉型職業”的特征、成因與后果[J].勞動經濟研究,2021(5):3-32.
[17]胡晟明,王林輝,趙賀.人工智能應用、人機協作與勞動生產率[J].中國人口科學,2021(5):48-62+127.
[18]BREIMAN L.Statistical modeling: The two cultures[J].Statistical Science,2001(3):199-215.
[19]ARPAIA A,KISS A,PALVOLGYI B,et al.Labour mobility and labour market adjustment in the EU[J].IZA Journal of Migration,2016(21):1-21.
[20]POHLIG M.Occupational Mobility in Europe During the Crisis:Did the Social Elevator Break?[J].Research in Social Stratification and Mobility,2021,72:1-16.
責任編輯:彭 青
Whose Job will AI \"Steal\"?
——Employment Substitutable Risk of Heterogeneous Workers
Sun Wangshu, Sun Xu
(School of Statistics, Dongbei University of Finance amp; Economics, Dalian Liaoning 116025, China)
Abstract:
The application of artificial intelligence and control equipment in production has a substitutable effect on the employment of workers. At present, most domestic researches focus on the artificial intelligence replacement risk of occupation as the measurement object, and pay less attention to the substitutable risks of heterogeneous workers. Based on the task-based approach, we use the data from China Labor-force Dynamics Survey (CLDS), select input variables including individual characteristics, tasks and occupational characteristics of respondent workers, and use the machine learning model to calculate the substitutable probability of each individual worker. According to individual characteristics, these workers are divided into 12 heterogeneous groups, and the substitutable risks of heterogeneous labor groups are compared and analyzed. The results show that: (1) The proportion of workers at low, medium and high substitutable risk levels in China is 52.9%, 24.2% and 22.8% respectively. (2) The three variables of \"using the Internet\" task, \"education requirements\" and \"training requirements\" of the occupation have a greater impact on the substitutable risk of workers. (3) The average substitutable rate of workers with low education level is higher, and the substitutable risk of workers aged 23~35 is the lowest. (4) Occupational mobility is an effective way to defuse the overall substitutable risk of the labor market, but its effectiveness is asymmetric for individual workers. (5) The substitutable risks of some high-risk workers tend to solidify, so it is necessary to guard against the transformation of their substitution risk into unemployment risk.
Key words:
artificial intelligence; employment of laborers; level of human capital; substitutable risk; task-based approach