邱澤奇
內容提要 過去40年是數字社會發展的40年。數字技術的社會化應用改變了社會經濟發展的基本動力,形成了與工業社會具有本質區別的數字社會,并使數字社會進入了飛躍發展的階段。數字社會與工業社會的本質差異至少可以從個體與社會的關系、社會分化機制兩個維度管中窺豹。然而,社會學研究在方法上未能有效跟上數字社會發展的時代步伐。雖然有人在20世紀90年代就提出了計算社會學的概念,但直到大約10年前,社會學研究方法的突破還依然停留在概念上。今天,ABM的應用和數據挖掘技術的發展為社會學研究方法的突破帶來了轉機,形成了計算社會學發展的兩條演進路徑,其應用正處于相向而行的態勢之中。
自從大數據(big data)概念從商業應用向學術研究傳播以來,社會學界對數字技術變革影響社會變遷的反應也隨即展開,其中的一個反應是計算社會學的興起。不過,計算社會學的發展并非線性式的一帆風順,而是與數字社會的發展相伴隨。一個直觀的事實是,小布倫特早在1993年便使用了計算社會學(computational sociology)概念,并認為計算社會學是社會學下一個千年的希望[1]Brent,Edward E.,"Computational Sociology:Reinventing Sociology for the Next Millennium",Social Science Computer Review,1993,11(4),pp.487-499.。可是,小布倫特的文章沒有發表在社會學期刊上,而是發表在了計算機類期刊上。這篇文章發表之后,無論是計算社會學概念還是小布倫特的文章都沒有在社會學界引起任何反響,直到當下為止,谷歌統計的文章被引次數也只有6次。眾所周知的事實還有,一段時間內,計算社會學無論是作為社會學的一種方法,還是作為社會學的子學科,都不僅沒有像小布倫特倡導的那樣蓬勃發展,甚至沒有引起主流社會學家們的足夠重視。直到近10年來,隨著數字社會的極速發展,運用大數據觀察和探討社會發展變遷的計算社會學才凸生顯現,并吸引了人們越來越多的關注。
假設計算社會學概念出現在20世紀90年代初期[1]小布倫特的文章是我們查到的最早提出計算社會學概念的文獻。由于沒有窮盡文獻,故以假設論。,那么值得探究的是,一個有力且正確的洞察為什么在沉寂了近30年之后才形成學術潮流?本文試圖把計算社會學的演進放在數字社會發展環境里,探討數字社會發展帶給計算社會學的機會以及計算社會學的演進過程。
用社會學期刊文章的眼光看,小布倫特的文章可以被認為是一篇糖水文章,嘟囔著社會學的經典八卦,如定性與定量、理論與方法、微觀與宏觀等等,既沒有獨到的證據鏈,也沒有經過嚴密論證的學術觀點。可是,我們卻不能因此否認文章的學術洞察力和洞察的正確性。他從計算機算力(computational power)和應用軟件的發展出發,與總體社會復雜性研究建模與計算能力的需要類比,推演出計算社會學概念,倡導社會學家們應該想得大一些,合作規模大一些,共同探索和把握之前的社會學家們沒有機會探討的社會現象和規律。非常遺憾的是,小布倫特限于想象力,沒有告訴社會學同行們計算社會學到底是一種怎樣的學問,可以怎樣去探索和發展。一句話,小布倫特從計算機科學的發展直觀地聯想到社會學進行大規模建模和計算的需要,認為大規模計算應該能發現非常不一樣的社會規律,它將給社會學下一階段的發展提供機會。
現在看來,小布倫特的洞察和倡導是正確的。可是,他的倡導發出之后,為什么沒有很快獲得社會學界的反饋?在我們看來,最直接的影響因素是數字社會發展的階段性,即20世紀90年代初期是數字社會發展的初始期。計算機的商業應用雖早在20世紀60年代已經開始,可直到20世紀90年代還處在機構性組織應用階段,不僅沒有產生巨量數據,僅有的數據社會學家們也難以接觸到。
我們知道,計算機只是數字社會發展的必要條件,充分條件是互聯網絡。計算機網絡雖在20世紀60年代就已經發明,卻一直限于軍事和科研用途,直到1990年才出現向社會擴散的第一個充分條件,即網頁瀏覽器的發明[2]蒂姆·伯納斯-李在1990年發明了第一個網頁瀏覽器World Wide Web,此瀏覽器后改名為Nexus。。1993年圖形界面萬花筒(Mosaic)瀏覽器的出現為互聯網絡的社會化應用提供了大眾可以使用的工具。可是,僅有瀏覽器,沒有網絡設施和設備接入服務,瀏覽器也只是一個沒有意義的單機玩具。1994年互聯網接入商業服務的出現為數字社會的發展集齊了基本條件,即終端(計算機)、網絡和瀏覽器(網絡人機界面)等三駕馬車,讓行動者有了實現互聯互通的機會,互聯網的社會化應用才真正出現了[3]最早接入互聯網的社會性應用出現在美國麻省的萊星頓(Lexington)和劍橋(Cambridge)社區。。中國科學院高能物理研究所1993年開通了與美國西海岸的第一條專線,標志著中國正式接入互聯網世界,1997年北京瀛海威有限公司提供互聯網接入服務,標志著互聯網在中國進入社會化應用,數字社會正式進入其發展軌道。
在技術擴散和流行現象研究領域,有一條著名的S曲線,它把一項技術、潮流或時尚的流行劃分為五個階段。以目標人群為分母,以采用或使用人群為分子,計算采用某項新技術或進入某個潮流或時尚人群占目標人群的比例,用這個占比劃分發展階段。第一階段為前2.5%階段,即先行種子階段。在這個階段,只有愿意嘗新的約2.5%者會一試。第二階段為前13.5%階段,即前流行階段。在這個階段,有約13.5%者會采用或使用,形成流行前的先鋒征兆。第三階段為前34%階段,即流行拐點階段。這個階段,已有1/3者會采用或使用,形成因網絡效應產生三度影響進而讓擴散加速的格局[4]〔美〕尼古拉斯·克里斯塔基斯、詹姆斯·富勒:《大連接:社會網絡是如何形成的以及對人類現實行為的影響》,簡學譯,中國人民大學出版社2013年版,第39頁。。跨過這個拐點,如果沒有其他干擾,流行將變得不可避免。第四個階段為后34%階段,即后流行拐點階段。這個階段已有2/3者會采用或使用,形成了流行的初步飽和。此后,流行的速率明顯降低。第五階段為后16%階段,即流行高原階段,剩下的不一定會采用或使用[1]關于S曲線,參見〔美〕埃弗雷特·M.羅杰斯:《創新的擴散》,辛欣譯,中央編譯出版社2002年版,第244—245頁。。
由此我們說,過去的40年正是向數字社會的轉型階段。自工業革命以來,工業生產的革命性組織方式催生了金融市場,即對社會影響巨大的企業都在金融市場上[2]〔日〕板谷敏彥:《世界金融史:泡沫、戰爭與股票市場》,王宇新譯,機械工業出版社2018年版,第125—130頁。〔奧〕卡瑞恩·克諾爾·塞蒂娜、〔英〕亞歷克斯·普瑞達主編:《牛津金融社會學手冊》,艾云等譯,社會科學文獻出版社2019年版,第37—38頁。。上市公司的市值排名不只標示著企業的價值規模,也指示技術和行業發展的潮流和社會的取舍,上市公司市值世界前十的排序,對理解主導性社會力量具有風向標意義。根據公開數據,在市值排名世界前十的公司中,1990年有6家銀行,1家通信硬件公司;2000年有7家通信硬件公司,1家互聯網公司;2010年有4家能源公司,2家互聯網公司,2家銀行;2020年有7家互聯網公司,2家金融公司[3]依據公開數據整理,2020年的數據來自普華永道(PwC)官方網站。系統的敘述,參見徐清源:《數字企業平臺組織的結構、行動和治理》,北京大學博士論文,2021年。。過去40年,主導力量的轉換顯示了數字社會發展的線索。那就是,在21世紀之前,數字社會處于萌芽期。進入21世紀后,先是網絡基礎設施的發展,接著是終端設施設備的發展,然后是數字社會的真正來臨,一個直接指標是,2021年臉書系社交應用總月度活躍的用戶數達到34.5億,占世界總人口的43.7%,早已邁過了數字技術擴散的拐點,意味著數字技術真正進入了人們的日常生產和生活。
中國的經歷表明,以互聯網絡設施設備等硬件為基礎,以組織和個體應用為目標,數字技術快速邁過其擴散拐點,進入數字社會的騰飛階段[4]主要綜合自中國信息通訊研究院:《中國數字經濟發展白皮書》,中國信通院,http://www.caict.ac.cn/kxyi/qwfb/bps/;中國互聯網絡信息中心:《中國互聯網絡發展狀況統計報告》,中國互聯網絡信息中心,http://www.cnnic.net.cn/hlwtzyj/hlwxzbg/。在敘述中,對兩類報告均參考了其初期和近兩年的數據。。在經濟領域,2020年數字經濟增加值為39.2萬億元人民幣,占GDP的比重躍升至38.6%,一下子越過了技術擴散起飛的臨界點,進入數字經濟的騰飛期;預計2025年數字經濟占GDP的比重將超過50%[5]在2021年的博鰲亞洲論壇上,經濟學家李稻葵和國家網信辦做出了相似的預測。,中國真正進入數字經濟時代。
在社會領域,中國上網人口從1993年的153人極速上升至2020年近9億人。其中,有99%使用移動終端上網。在不到十年時間里,中國完成了從傳統互聯網向移動互聯網的演化。到2020年,中國已擁有世界上規模最大的光纖網絡、數量最多的4G和5G基站、覆蓋人口最廣泛的數字技術用戶,電子商務應用覆蓋了最不可能覆蓋的所有832個前國家級貧困縣,數字教育設施設備覆蓋了所有中小學,包括最難覆蓋的偏遠地區自然村寨教學點。從發展進程看,在剛剛過去的“十三五”期間,中國上網人口增加了43.7%,是上網人口增加最集中的時期。從人群結構看,在上網總人口中,60歲以上上網人口的占比比60歲以上人口占總人口的比重高出11.0個百分點;城鄉上網人口占比差距正在快速縮小[6]主要綜合自中國信息通訊研究院:《中國數字經濟發展白皮書》,中國信通院,http://www.caict.ac.cn/kxyi/qwfb/bps/;中國互聯網絡信息中心:《中國互聯網絡發展狀況統計報告》,中國互聯網絡信息中心,http://www.cnnic.net.cn/hlwtzyj/hlwxzbg/。在敘述中,對兩類報告均參考了其初期和近兩年的數據。。
在政務領域,從建站到聯網,省部級政務接入國家政務平臺的比例快速上升,居民跨行政區辦理業務的便利性獲得極大增強。在政務平臺上,實名注冊個人數達7.74億,法人達7.27億。審批等行政許可事項實現網上受理和最多跑一次的比例達82.13%;一半以上行政許可事項平均時限壓縮超過40%;政府事項網上可辦率超過了90%[7]主要綜合自中國信息通訊研究院:《中國數字經濟發展白皮書》,中國信通院,http://www.caict.ac.cn/kxyi/qwfb/bps/;中國互聯網絡信息中心:《中國互聯網絡發展狀況統計報告》,中國互聯網絡信息中心,http://www.cnnic.net.cn/hlwtzyj/hlwxzbg/。在敘述中,對兩類報告均參考了其初期和近兩年的數據。。不僅如此,政府作為機構還直接參與“社交”,幾乎所有社交平臺,都有政府號。數字連接正推動中國治理體系和治理能力的現代化。
根據國際電聯(ITU)的數據,以互聯網個人用戶為統計口徑,世界上盡管還有近一半人口沒接入互聯網,可是從數字技術擴散視角出發,數字社會早已跨過了其進入騰飛階段的擴散拐點,并把人們帶進了一個嶄新的數字時代。
隨著世界邁進高度互聯的數字社會,人類行為生產痕跡數據的來源大大增加,從計算機和手機使用,包括通信、文檔交換、生產、交易、教育、健康、醫療等,到物聯網關聯的各類傳感器,產生數據的設施設備呈幾何級數增加,網設施設備的數量早已遠遠大于人類人口的數量。數字設施設備數量的極速增長,帶來的結果之一是數字數據量呈幾何級數的快速增長。2010年人類積累的數據大約2ZB,遠遠超過了人類過去幾千年積累的數據。2020年則達到了64.2ZB,10年間,人類積累的數據量便增加了30多倍。預計到2025年會達到181ZB[1]IDC,Statista,"Volume of Data/Information Created,Captured,Copied,and Consumed Worldwide from 2010 to 2025(in Zettabytes)",Statista,Statista Inc.,7 Jun 2021,https://www-statista-com.ezproxy.gavilan.edu/statistics/871513/worldwidedata-created/.。
與傳統社會學研究使用的文獻數據、訪談數據、抽樣調查數據、統計數據等容量和數量相比,數字社會可以用于社會研究的數據量已是一個天文數字,是社會學家們憑借過去近百年積累的經驗和技術無力運用的,也因此對社會學研究的方法提出了尖銳的挑戰。不僅如此,人類對數字技術和巨量數據的各類應用[2]如生產、生活、政務、管理等各領域、各方向的應用。正深刻地改變著社會,從個體與社會的關系,到社會設置、經濟生活、社會生活、政治環境等,再到社會分化的底層邏輯,都在發生深刻且本質的變化。
以社會學知識中的個體與社會關系為例。在數字社會之前,從發生學視角觀察,個體-社會關系的締結是經由已經存在的行動者實現的,即以人為媒。從生物性出生到社會性出生,從意識塑造、行為內化、文化內化到價值觀內化,個體-社會關系的建構和發展都以人為媒。社會學的概念“社會化”試圖歸納的便是個體-社會關系建構的復雜社會過程。在個體成長中,活動空間的地方性使得個體從社會化開始便是屬地的,便是嵌入已經存在的社會勢力如派系之中的,也因此被動地獲得著自己的社會地位或身份,由此,形成了在地方性社會中個體及其與社會關系特征的公開性,并隨時間的延續還塑造了關系的系統性。正如涂爾干反復強調的,社會是外在于個體、對個體具有強制性的力量[3]〔法〕涂爾干:《職業倫理與公民道德》,渠敬東譯,商務印書館2017年版,第66—67頁。。的確,個體的身體和情感等社會特征來自地方性社會。在個體真正成為一般意義的社會行動者后,又將其還給了社會。
然而,數字社會從本質上改變了個體-社會的關系締結方式。數字連接的實現讓個體-社會關系的建構可以跳出地方性社會,進而擺脫以人為媒的過程。個體運用數字連接可以直接建構與社會的關系。作為生物性個體,人們依然出生在地方性社會,依然在地方性社會成長,依然與家庭、身邊的同伴發生連接。與此同時,作為社會性個體,從有能力使用數字工具開始,人們便有機會與地方性社會之外的廣大社會建立聯系,建構屬于個體自己的“社會”,而不再是被動地接受地方性社會強加的關系。當然,以數為媒的社會與以人為媒的社會之間不存在一條界限清晰的鴻溝,而是彼此交集地混雜在一起。盡管如此,對個體-社會關系的建構而言,從社會意識塑造、行為內化、文化內化到價值觀內化,個體-社會關系的建構和發展,都有了另一種完全不同的選擇,即以數為媒。以數為媒賦予了個體一種本質上不同的機會,個體可以是自己的,同時又是世界的,而不僅僅是地方的;個體依然嵌入在已經存在的社會中,可這個社會也不再是地方的,而可以是部分身份或資格的、場景性的、離散的。在數字社會,個體可以只把自己的數字屬性交給社會而保留自己的實體屬性,當然也可以兩者都交給社會。只是,這個社會絕不再只限于地方性社會。
如果說以人為媒的個體-社會關系中的個體是地方性社會系統的,那么,數字社會疊加的以數為媒的則是世界性社會系統的。個體可以不再受到地方性社會的約束而擁有一個自己的、世界性的舞臺,形成社會行動者的泛在連接。
與此同時,數字社會改變的不只是個體-社會關系,而是整個因工業化、市場化、城市化建構的社會體系,包括由政治、經濟、社會關系體系形塑的社會分化機制。如果說,數字連接在個體-社會這一元關系(metaconnection)上改變了社會的底層組織邏輯,那么,泛在連接作為自變量給社會整體帶來的機制性影響也是社會學關注的最重要變量,或可以歸納為社會分化的革命性變革。
在20世紀下半葉的社會學研究中,社會學家們樂此不疲的努力是沿著布勞-鄧肯模型[1]Blau,P.M.,Duncan,O.D.,The American Occupational Structure,New York:John Wiley and Sons,1967.,在主權國家范圍內討論匯集在個體身上的因素主導的社會分化。殊不知,在這類研究中有兩個默認的前提假設是值得懷疑的(因為在其他社會不一定存在)。第一,給定制度。理論與實證研究都證明,制度是影響社會分化的主導變量,只有在制度穩定的前提下,其他因素的影響力才有機會釋放[2]邱澤奇、劉世定:《社會板塊結構的變遷》,《中國社會科學》(內部文稿)2013年第6期。。像美國那樣制度相對穩定的社會在世界上并不是主流。第二,給定技術。理論與實證研究同樣證明,在給定制度的前提下,技術變革也是影響社會分化的主導力量,只有在技術變革相對穩定且連續的前提下,其他因素的影響力才會對社會分化產生有效影響[3]Kohler,Timothy,A.et al.,"Greater Post-Neolithic Wealth Disparities in Eurasia than in North America and Mesoamerica",Nature,2017,551(7682),pp.619-622.。可是,即使像美國那樣制度相對穩定技術變革也是活躍的社會,也未必如此。《財富》雜志對上市公司市值排名的歷史數據顯示,前十公司的名單每十年都有本質變化,正如,前文述及過去40年市值排名世界前十公司名單的變化也證明了沒有“常青藤”公司,其根本影響因素正是技術變革。
一旦我們從美國社會學“主流”跳出來,向布羅代爾[4]〔法〕費爾南·布羅代爾:《日常生活的結構:可能和不可能,十五至十八世紀的物質文明、經濟和資本主義》,顧良、施康強譯,商務印書館2017年版,第1—3頁。學習,甚至超越布羅代爾,從更加長遠的歷史觀察社會分化的事實,就會發現,人類正是因元關系地理范圍的不同,才有不同的社會分化機制。以最簡約方式歸納這個不同,我們可以將整個人類的歷史劃分為三個階段:家庭化連接的散點社會,職業化連接的區塊社會,以及數字化連接的個體社會。
在散點社會,如分散的鄉土社會,社會分化以家庭為單位。分化的結果是以家庭為單位的、在極小地理空間的家庭社會經濟地位結構,最終形成的是由外在權力賦予或因經濟力量獲得的家庭政治地位。一個家庭在當地擁有的權勢大小取決于一個極小的相對獨立地理空間的以權勢衡量的社會結構。在不同空間之間,家庭的權勢不具有通約性,甚至不具有可比性。
在區塊社會,如相對獨立卻又有可能連接的城市社會,社會分化以個體為單位,家庭社會經濟地位對個體有影響,卻不像散點社會那樣直接賦予個體身份,而只能為個體提供基礎和便利,這也是布勞-鄧肯學術潮流納入家庭社會經濟地位變量的理論基礎。在給定制度的前提下,個體社會經濟地位的獲得依靠其職業在社會分工體系的地位獲得第一次機會,再通過受教育程度和技能的適配性獲得第二次機會。與散點社會的社會分化不同,在區塊社會的社會分化中,政治地位分化與經濟地位分化不再緊緊相連,而各有自己的路徑。當然,在不同的制度體系下,政治地位與經濟地位的分離程度也不相同。在經歷了資產階級革命的制度中,旋轉門制度把兩者聯系在了一起,不過,這一聯系,也僅限于精英階層。在沒有經歷資產階級革命的制度中,政治地位與經濟地位至少在制度上不具有可兌換性。分化的結果是以個體為單位的、在更大地理空間如城市的個體社會經濟地位結構,最終形成的是由行業相對地位賦予的個體經濟地位,個體在區塊空間的經濟地位高低取決于在一個與其他區塊有關聯卻又相對獨立的地理空間的以收入和財富衡量的社會結構。一個典型隱喻是,個體手握相同數量財富居住在不同城市便具有不同的社會經濟地位。
在個體社會,如當下正在發展的數字社會,社會分化依然以個體為單位,家庭社會經濟地位對個體依然有影響,可相比于區塊社會,如果個體希望沿襲區塊社會的分化路徑,其影響路徑依舊存在。除此之外,個體還有新的路徑,即泛在連接帶來的讓個體繞過政治地位和經濟地位而直接進入社會分化或獲得社會地位的路徑。如果說散點社會的社會分化路徑是政治路徑,在政治、經濟、社會三角中政治地位具有主導性,區塊社會的社會分化路徑是經濟路徑,在政治、經濟、社會三角中經濟地位具有主導性;那么,個體社會的社會分化路徑則是社會路徑,在政治、經濟、社會三角中社會地位具有主導性。如果政治地位是權力的大小,經濟地位是資本的多少,那么,社會地位便呈現為流量的巨細。在給定制度環境里,個體可以不再依靠家庭社會經濟地位、行業產業地位,而依靠個體特征獲得流量進而獲得社會地位,流量甚至可以穿透勞動分工體系、穿透主權國家體系,成為人類社會共識的社會地位標準。分化的結果是,個體社會地位的高低取決于以個體為單位的、理論上可以在世界范圍內至少在連接范圍內的以流量衡量的社會地位結構,最終形成的是由圈子賦予的個體社會地位,即在一個圈子社會結構里的社會地位。
散點社會和區塊社會的社會分化形成的是一個地理空間的整體性社會結構,個體社會的社會分化形成的則是平行的、跨域地理空間的部分性社會結構。圈子性社會結構是數字社會與之前的社會結構的本質區別。
值得進一步說明的是,從散點社會到個體社會,支撐社會分化機制變化的還有個體生活保障安全的逐步增強。如果說在散點社會和區塊社會的社會分化底層邏輯中還有人類生存威脅帶來的影響,即家庭和個人努力爭取政治地位和經濟地位的動力來自對家庭或個體生計保障的考量,那么,在個體社會,個體爭取社會地位可以被理解為是純粹對自我特征社會性認同的努力。
數字社會的本質特征之一是個體社會的發展。個體化的發展和社會行動者之間的高度互聯,加上普遍滲透的物聯網傳感器的使用,讓人類社會在極短的時間內進入高度復雜性時代。讓我們再次回到更加長遠的歷史來觀察當下的數字社會。散點社會延續了萬年之久,區塊社會雖然發端久遠,真正興盛且對人類社會產生實質性影響也只是在第一次工業革命之后的不到300年。可是,如前述及,即使我們把瀏覽器發明的1990年當作數字社會元年,數字社會也不過短短40年時間。可是,即使只觀察個體-社會關系和社會分化機制的變遷,數字社會也呈現出高度復雜性。
遺憾的是,社會學家們好像被數字社會的發展遠遠地甩在了后面而未特別覺醒。在經歷了20世紀60—70年代的繁榮后,社會學在20世紀80年代進入沉寂期,在理論和研究方法的發展上均陷入停滯。在理論上,宏大理論敘事在被推倒之后,理論發展陷入停滯;在研究方法上,二戰后繁榮的實證研究路徑遇到了社會復雜性的挑戰。社會學理論與研究方法都在尋找下一個發展的突破口。按常理,社會學家們應該為數字社會的發生與快速發展做好了準備,且積極擁抱數字社會的來臨;可事實是,社會學家們并未預見數字技術帶來的革命性社會變革,無論是對社會復雜性的幾何級數躍升還是對計算機科學帶來的算力高速發展,都視而不見。倒是未來學家們不斷推測未來趨勢,卻也只把眼光停留在當時美國面臨的能源危機和持續經濟增長乏力難題上[1]參見〔美〕阿爾溫·托夫勒:《第三次浪潮》,朱志焱、潘琪譯,生活·讀書·新知三聯書店1983年版,第130—132頁、第376—377頁。〔美〕丹尼爾·貝爾:《后工業社會的來臨:對社會預測的一項探索》,高铦等譯,商務印書館1984年版,第509—512頁。。沒有人敏銳感到一場真正社會革命的來臨。
直到21世紀曙光初現,左翼社會學家卡斯特出版信息社會三部曲[2]卡斯特的信息社會三部曲,參見〔美〕曼紐爾·卡斯特:《網絡社會的崛起》(另兩部為《認同的力量》《千年的終結》),夏鑄九等譯,社會科學文獻出版社2001年版,第1—5頁。,才給人們刻畫了一個因互聯網高度互聯而改變的社會。遺憾的是,卡斯特只是刻畫了普遍連接帶來的影響,卻沒有洞察互聯網社會的本質變化是因人類社會高度互聯帶來的數據積累與應用的革命性影響。我們認為,因數字技術而改變的社會不單純是網絡社會。網絡只是發生了相對于散點社會和區塊社會的社會連接形態改變。其實,社會網絡是自社會誕生以來就有的社會連接形態,只是隨著時代的發展,網絡規模有大小之別而已,其本質上還是網絡。無論是村寨的人際網絡還是電信技術發明之后的電報網絡和電話網絡,都是網絡。只有當網絡連接數字化,社會才真正發生了本質改變,個體-社會關系的變化只是一個可以體驗和想象的例子。因數字技術而改變的社會也不單純是信息社會,信息社會歸納的是信息生產、分發、配置、整合等信息很活躍的社會[3]Soll,Jacob,The Information Master:Jean-Baptiste Colbert's Secret State Intelligence System,Ann Arbor:The University of Michigan Press,2009.,信息社會可以不基于數字技術,也不對社會帶來本質改變。只有當信息活動源于數字技術又回歸數字技術,信息被埋藏于巨量數據之中,社會才發生了本質改變,數字社會分化機制的變化也只是本質改變的一部分。
簡單地說,要理解數字社會的特征,在研究方法上,源起于工業社會的思辨和實證等研究路徑還可以沿著既有路徑前行,卻已顯然力有不逮。社會學學科的發展亟須在研究方法上進行突破以趕上數字社會的發展潮流,開發適用于巨量數據和高度復雜性分析的研究方法,以及基于新研究方法的研究策略和路徑。
社會學家們對社會復雜性的警覺自社會學誕生之初就已經存在,從涂爾干到布勞[4]喬天宇、邱澤奇:《復雜性研究與拓展社會學邊界的機會》,《社會學研究》2020年第2期。,都認為社會學方法在應對社會復雜性上有困難。如在具體研究中區分微觀社會學和宏觀社會學只是應對復雜性不得已的選擇。盡管社會學家們始終在探索應對社會復雜性的方法策略和技術。但遺憾的是,讓社會學有能力應對社會復雜性的愿望始終未能實現。自小布倫特的文章之后,1995年才有人感到計算機技術擴散的影響,建構了計算社會學的“理論-經驗-計算”三角模型[5]Hummon,Norman P.,Thomas J.Fararo,"The Emergence of Computational Sociology",The Journal of Mathematical Sociology,1995,20(2-3),pp.79-87.。顯然,這是從社會學統計方法衍生出來的模型,尚沒有關注巨量數據給社會研究方法帶來的影響和壓力。
一晃又是7年,直到2002年社會學主流期刊終于刊登了第一篇以計算社會學為主題的文章。梅西和惠勒雖然沒有明確指出卻隱晦地告訴讀者,傳統社會學研究在方法上是“因素”(factors)的研究,即使在計算機出現后,社會學家們也只是用計算機提高因素關系的計算效率,包括仿真計算。基于數字技術的影響已經讓社會結構和社會秩序超越了人居地理空間,基于行動者動態的研究需要引入一種新方法。為此,他們介紹了基于行動者建模(agent-based modeling,ABM)的方法[1]Macy,Michael W.,Robert Willer,"From Factors to Actors:Computational Sociology and Agent-Based Modeling",Annual Review of Sociology,2002,28(1),pp.143-166.。這是自計算社會學概念提出以來第一個實質性進展,即計算社會學有了可用的方法工具。
或許是得益于文獻的擴散效應,社會科學領域其他學科尤其是人類學、經濟學、政治學、心理學等[2]加上社會學,在社會科學領域通常也被稱之為社會學科學的“五大學科”(big five)。學科的計算方法轉型也快速跟進,形成了一個新的概念:計算社會科學(computational social science,CSS)。2009年拉澤爾等人的文章預示了計算社會科學的誕生[3]Lazer,David,et al.,"Computational Social Science",Science,2009,323(5915),pp.721-723.計算社會科學的發展可參見張小勁、孟天廣:《論計算社會科學的緣起、發展與創新范式》,《理論探索》2017年第6期。。10多年之后,拉澤爾等人再次撰文探討計算社會科學的機會和發展遇到的障礙[4]Lazer,David,et al.,"Computational Social Science:Obstacles and Opportunities",Science,2020,369(6507),pp.1060-1062.,這也意味著計算社會科學的發展并非一帆風順。
與梅西和惠勒的路徑不同,拉澤爾等人從數字技術帶來的巨量數據出發,提出了從數據中挖掘人類個體或群體社會行動模式的策略,即數據挖掘(data mining)策略。在社會科學中,數據挖掘不是一個新概念,早在1983年經濟學家就提出了數據挖掘概念[5]Lovell,Michael C.,"Data Mining",The Review of Economics and Statistics,1983,65(1),pp.1-12.,只不過那時這個概念還沒有把巨量數據納入視野。隨著20世紀90年代數據量的積累,商業公司開始進入數據挖掘領域以獲取商業利潤,提出了數據庫挖掘(database mining)概念。隨后,研究者將數據庫挖掘簡化為數據挖掘,且出現了許多平行概念,如知識發現(knowledge discovering)、數據考古(data archaeology)等。隨著1995年第一屆數據挖掘與知識發現國際會議(KDD-95)的召開,數據挖掘正式進入學術界,成為運用巨量數據探討人類社會規律的方法,也成為計算社會學發展的另一條路徑。
簡言之,從20世紀90年代初期提出計算社會學概念到21世紀初梅西和惠勒提出第一條方法路徑,再到10年之后的拉澤爾等人提出的第二條方法路徑,計算社會學完成了從概念到研究實踐的工程工藝過程。從21世紀的第二個十年開始,計算社會學沿著這兩條路徑在快速發展。
在ABM領域,隨著從單主體互動模型向多主體互動模型(ABMs)的發展,ABM在社會學領域的應用日漸擴展,方法也日臻成熟。斯卡佐尼歸納了ABM在社會學的應用場景和方法路徑,從模型復證和多層效度入手,形成了系統的方法實踐邏輯和知識。由此ABM路徑也被引入國內,并在社會科學領域獲得了廣泛的應用,正如在社會學領域應用于對交通出行、社交行為、社會信任、不平等效應、公共政策的評估等[6]相關文獻通過中國知網的主題詞檢索和關鍵詞檢索均可獲得,為節省篇幅,恕不一一列出。。呂鵬等人還基于群體智能、社會動力模型以及多主體仿真等方法,探討了在面臨群體性共同危險(如恐怖襲擊)情況下,個體見義勇為、勇斗歹徒(如英雄行為)的人群動力學機制[7]Peng Lu,et al.,"Swarm Intelligence,Social Force and Multi-Agent Modeling of Heroic Altruism Behaviors under Collective Risks",Knowledge-Based Systems,2021(214),https://doi.org/10.1016/j.knosys.2020.106725.。為探討ABM模型的多用性,我們還嘗試用ABM檢驗實證研究的結論[8]邱澤奇、黃詩曼:《熟人社會、外部市場和鄉村電商創業的模仿與創新》,《社會學研究》2021年第4期。。
鄉村電商是過去10年中國鄉村發展的一大景觀。2009年阿里巴巴發現了3個淘寶村[9]淘寶村是阿里研究院發明的概念,可參見阿里研究院網站。,2020年淘寶村的數量增長到5425個,加上運用其他電商平臺從事電商經營的電商村,中國的電商村預估超過萬個,總數量超過了中國行政村總數的2%,覆蓋了大多數前國家級和省級貧困縣和貧困村。我們知道,電商經營是有數字素養門檻的新技術,受教育程度不高的村民又是如何了解并掌握新技術、運用新技術促進鄉村發展的呢?我們從實地調查中獲得的結論是,一些外出打工的年輕人在城市里習得運用計算機、互聯網甚或電商經營技術,回到村里在線上銷售村里的產品,形成了鄉村電商的星星之火。鄉村的熟人社會特征讓任何一種賺錢的門道都有可能在村內經由親屬和鄰里網絡形成社會學習氛圍而快速傳播,讓任何一個想學習的村民都有機會學習、模仿和創新,由此構成了電商技術的社區擴散。其中,在給定外部市場無限的前提下,有人帶回電商技術且經營電商是必要條件,有人愿意學習、模仿和創新是充分條件。
可是,關于星星之火究竟如何變成燎原之勢的,我們只能聽村民講過去的故事。由于社會學傳統研究方法無法復證村民的故事,因而無法將村民故事中抽象的規律變成可復證的知識。運用ABM仿真,我們不僅重現了村民的故事,還發現了新的知識,那就是村民網絡密度和關系強度對社會學習有效性的潛在且具實質性的影響,即兩者的影響隨村民學習能力的增強而被放大。當村民吸收異質能力、模仿與創新潛力、創造能力都處在中高強度時,三者的互補性效應不僅創造了顯著的個體收益和群體收益,且整體收益分配也沒有出現典型的冪律分布(強者愈強、弱者恒弱),而是出現了“涓滴效應”,即先富帶后富。隨著網絡密度的減小或整體關系強度減弱,收益創造和收益分配的兩個社會學習效益都明顯減弱;當網絡特征趨近于陌生人社會時,即便給定相同的能力設置,收益創造和收益分配的兩個社會學習效益也趨于消失,即三類學習能力的互補效用無法發揮。
對比僅利用鄉村調查數據的實證研究,ABM仿真在檢驗實證研究結果的基礎上還創造了一項對比實驗,用于觀察和檢驗熟人社會作為一種環境對電商技術擴散的影響,反向證明了村民社會網絡對電商技術擴散影響的重要性。
在數據挖掘領域,隨著機器學習技術的發展,研究的社會現象范圍越來越寬,內容也越來越深。不過,總體上依然以信息提取、社會網絡擬合、社會復雜性擬合和社會仿真為基本路徑[1]Cioffi-Revilla,Claudio,Introduction to Computational Social Science,Cham:Springer International Publishing,2017.。在應用中,從數據出發的研究路徑幾乎擴展到了所有具有巨量數據的領域,形成了相對模式化的方法流程:數據挖掘三步法。第一步,面對雜亂無章的非結構化巨量數據,運用數據樣本進行標注,無論采用直接計算方法還是采用機器學習方法,形成數據圖譜(map)。第二步,面對數據圖譜,通過聚類合并或其他方法合并和剔除非主題關聯數據集(reduce),形成研究數據集。第三步,運用關聯數據集進行模型訓練,用于知識發現,并將獲得的模型放回流動的數據中進行迭代優化。經典的例子如谷歌運用用戶搜索數據建構的流感模型[2]Ginsberg,J.,Mohebbi,M.,Patel,R.,et al.,"Detecting Influenza Epidemics Using Search Engine Query Data",Nature,2009,457,pp.1012-1014.。
在社會學研究中,數據挖掘已廣泛運用于醫療、教育、家政、養老、出行等社會生活領域,也廣泛應用于社區安全、社會服務、社會沖突處理等社會治理領域。經典的例子如約翰遜等運用社交數據對伊斯蘭國(ISIS)成員匯聚模式的探索和發現[3]Johnson N.F.,et al.,"New Online Ecology of Adversarial Aggregates:ISIS and Beyond",Science,2014,352(6292),pp.1459-1463.。還有,如臉書運用社交數據進行的情緒傳染實驗和觀點傳播實驗,都是很好的例子[4]Kramer,Adam D.I.,Jamie E.Guillory,et al.,"Experimental Evidence of Massive-Scale Emotional Contagion Through Social Networks",Proceedings of the National Academy of Scie,2014,111(24),pp.8788-8790.Bakshy,Eytan,Solomon Messing,and Lada Adamic,"Exposure to Ideologically Diverse News and Opinion on Facebook",Science,2015,348(6239),pp.1130-1132.。非常遺憾的是,在英文文獻中,從數據出發的知識發現研究很少有極好的文獻發表在社會學主流期刊上,更多的是被當作自然科學研究的一部分發表在各類自然科學期刊上。在中文文獻中,陳云松等運用微博和百度數據對代內文化反授的研究倒是極具計算社會學的品格[1]陳云松、朱燦然、張亮亮:《代內文化反授》,《社會學研究》2017年第1期。。
歸納起來看,作為研究方法的計算社會學演進,一方面受到建模技術發展的影響,另一方面受到數據挖掘技術的影響,呈現出兩條路徑平行發展的格局。在這個格局中,一方關注自下而上的基于行動者的互動;另一方關注總體性關系關聯。兩種格局看似延續了傳統社會學微觀和宏觀的方法路徑,事實上卻是為打通宏微觀關系建設了兩條相向而行的通道。從微觀行動出發的ABM其實有能力刻畫宏觀的涌現或復雜性,從總體出發的關系發現也有機會收斂到具體場景的互動機制。只是當下的積累尚不厚,還有待更多對社會現象有興趣的社會學家和數據科學家合作,共同面對數字技術帶來的數字社會。
經歷了40年數字技術社會化應用的發展,數字社會已經進入本質性社會變革在各個領域發生和呈現的階段。盡管1993年就有人提出了計算社會學概念,可是,20世紀90年代以來,主流社會學家們顯然逐步脫離了社會現實,而陷入對傳統社會學的懷舊之中不能自拔,對日新月異的社會變遷表現出一種無力感,在研究方法上難以突破。
最近10年,隨著數字數據越來越豐富,在數據科學蓬勃發展的擠壓之下,社會學家終于有所醒悟,正試圖正面面對巨量數據不斷積累、社會復雜性日趨顯性的社會現實,發展出兩條有可能互補的計算社會學研究路徑。一條是自下而上、著眼于行動者主觀能動性和社會行動動態性的ABM路徑,主要用于機制發現和檢驗;另一條則是著眼于從巨量數據中發現社會模式或規律的數據挖掘路徑,兩者都運用了計算思維,即運用分布式算力、高維變量、巨量數據,以獲取人類行為和社會現象規律的計算效率邏輯,主要用于模式或知識的發現與檢驗。值得注意的是,在兩條路徑上還是兩撥人,一撥是以數理建模為基礎的社會學家;另一撥是以計算建模為優勢的社會學家。兩撥人還沒有合流,將來是否合流尚未可知。值得欣喜的是,不管怎樣,社會學家總算是面對了時代的潮流。不僅如此,自然科學家也加入探索社會規律的潮流之中,這意味著,社會學家如果自己不做,便會有自然科學家替代之。
在拙稿停筆之際,《自然》雜志于2021年7月7日又出版了一期計算社會科學特刊,內容涉及計算社會科學的諸多內容,非常值得參閱。最后,需要說明的是,我們可以把計算社會學作為計算社會科學的一部分,可計算社會科學不能替代計算社會學,特別是不能替代其特定的研究領域和方法路徑。當然,計算社會學與計算社會科學的同與異,不屬于本文內容,冀另文探討。