文/陳健坤 武迪

圖1
人工智能不僅成為業界的寵兒,也成為教育的主題詞。2017 年7 月,國務院頒布了《新一代人工智能發展規劃的通知》。如何將人工智能帶入中學也成為熱門話題。2018年5月,第一本面向高中生的人工智能教材《人工智能基礎(高中版)》發布,上海交通大學附屬中學、清華大學附屬中學等40 所學校成為首批“人工智能教育實驗基地學校”。正如工程院院士、人工智能學會會長李德毅所說,“人工智能沖擊最大的行業當數教育,這就引發我們要對教育本源重新認識。教育本質上是對人腦的塑造,每節課都是一次腦認知的實踐”。
人工智能已經不再是一個專業的技術,專業的課程。面對新一輪人工智能浪潮,2018 年秋季,中國人民大學附屬中學在“人工智能+”系列課程里新增了“計算社會科學”的選修課,將社會科學納入人工智能教學體系,培養學生的跨學科思維和實踐能力。這門課由在康奈爾就讀的陳健坤與人大附中的資深計算機教師武迪共同設計并授課。
第一次在人大附中設立這門課程,最后共有11 位同學選修,這次探索給了未來社會科學教育很多啟示,在此共享。
什么是計算社會科學?為什么是“計算”?
人工神經網絡的發展與應用是人工智能第三次浪潮興起的核心動力,在科技、社會、生產、生活等方方面面取得了廣泛的應用與成功。目前較為龐大的人工神經網絡由多達千萬個數字神經元或成百上千層神經網絡組成,但與數百億個神經元組成的人腦神經網絡仍然有本質差別。人們已經能夠畫出部分簡單生物的神經系統,如圖1 所示。
高等生物——特別是人類的神經網絡遠比線蟲的神經網絡復雜,受到技術限制,我們目前還畫不出來。即使畫得出來,要摸清人類神經網絡的運作方式也是一個挑戰。
生物神經網絡屬于圖2 的小世界網絡(Small-World Network)。在這樣的網絡里,信息傳遞速度快,并且少量改變幾個連接,就可以顯著地改變網絡的表現,對已存在的網絡進行調整。人類社會中也存在這種小世界網絡。
真實世界是由數以億計的異質個體在不同維度的網絡里相互作用,如圖3 所示。我們目前受制于數據和技術限制還畫不出這些網絡,且同生物神經網絡一樣,即使畫出了網絡,要理解網絡的運作方式還有很長的一段路要走。而且,社會網絡分析(Social Network Analysis, SNA)只是分析、理解社會現象的一個方法。

圖2

圖3
人工智能的發展和數據樣本量及種類的飛速增長使得很多領域,不論是自然科學還是社會科學甚至人文學科,可以去研究之前受制于技術限制無法研究的現象。計算社會科學便是計算科學、復雜性科學和社會科學交叉的領域。這個領域國內大學剛剛重視起來,清華大學也剛建立了專門的跨學科合作平臺,整合了做相關方向研究的社科和計算機科學的學者。
計算社會科學在國內稱為社會計算,是一個比較寬泛的概念,從研究方向定義,計算社會科學是包括了自動化社會信息提取(Automated Social Information Extraction),社會網絡(Social Networks),社會復雜性(Social Complexity)和社會模擬建模(Social Simulation Modeling)四個方面的一系列社會科學分支的統稱。而從研究方法和技術上定義,計算社會科學是“廣泛應用計算機技術研究、認知和理解社會現象的社會學分支,包括計算機模擬、人工智能、復雜統計方法、社會網絡分析技術等在內的多種手段和工具,通過多樣化社會互動的基礎建模方式而提出并檢驗的關于復雜社會進程的多種理論發現”。
我們按照學科的四個大研究方向設計了這門十節課的選修課。以下是教學提綱。
第一次課:引言:交叉學科背景下的科學研究
第二次課:大數據(1)
第三次課:大數據(2)
第四次課:社會實驗
第五次課:社會模擬
第六次課:計算社會科學回顧與展望
第七次課:網絡科學(1):社會網絡
第八次課:網絡科學(2):復雜網絡
第九次課:復雜適應系統
第十次課:研究提綱答辯
考核方式:選擇實際生活中的具體問題,提交一個研究提綱。
評價標準:過程性評價占30%,其中:考勤及課堂表現15 分;課堂作業及平時作業15 分;最后一次課的考核:終結性評價占70%。
在報名上課的11 個學生里,最終8 個人上完課程并提交研究設計作業。這其中,有一些學生的研究設計非常值得探討。
如“利用代理人基模型模擬探究原創內容社區的‘劣幣驅逐良幣’現象 ”的研究設計。原創內容(音樂,視頻,繪畫等)社區是隨著互聯網行業興起的一個群體,群體內的用戶基于共同愛好通過原創內容互相交流。在社區發展到一定程度后會商業化,有些社區內出現了盜用別人原創內容分流流量,賺取巨額收益本的現象,導致社區優質內容降低,用戶失去信心。然而,即使我們在多個社區內觀察到了這種現象,卻尚未有理論能夠全面地解釋這種現象。本研究計劃在一個抽象成小世界網絡的社區內以頂點(Vertex)為單位進行代理人基建模,模擬一個原創內容社區商業化之后出現的內容質量降低的現象并重點觀察用戶對這個社區的信心,并調整模型參數,觀察不同的參數對信心變化趨勢的影響。研究者已經設計好了模型初始化和模型迭代的具體步驟。
此外,其余學生的研究設計也都反映了對課上核心知識內容的理解和一定的應用能力。當初規劃這門課的時候,請領域知名教授Michael Macy 看課程設計,Macy 教授覺得課程內容太多,難度過高,中學生可能聽不懂。但從最后結果來看,具有良好計算機基礎的學生幾乎都能較好理解課程內容并且應用。有一定理科基礎的學生也能聽懂大部分內容。因此,我們認為這個領域想要普及給高中生的話,須將課程融入中學的計算機教學體系中。
根據開課的經驗,我們的體會是,對于有能力的中學,應該把社科教學融入人工智能教學體系。人大附中將計算社會科學相關內容融入自然語言處理、建模與仿真、數據挖掘、機器學習等課程,培養學生跨學科思維。用收集到的樣本作為訓練集,通過機器學習來預測,可以達到很高的精度并大大降低時間和資金成本。
同時,應該從三個方面改變當前的社科教學:
1.社會科學應該作為一個整體來讓學生接觸
社會科學在普及教育階段不應該細分成經濟學,政治學,心理學,社會學等等。過去的一百多年里,學科被不斷細分,然而在這個過程中我們卻忽略了對整體的認知和理解。理解每個細節并不等于理解一個復雜現象整體是怎么運作的。社會科學本質上是用科學假說的觀測、理論和驗證這一步驟來研究和學習社會上的現象和問題。而信息時代也給社會科學帶來了無限潛力,拉近了社會科學和自然科學從研究方法上的差距。準確地說,從Duncan Watts 發表他的小世界理論已經過去了二十一年,從領域正式定名為計算社會科學也過去了十年。
2.培養學生用知識解決實際問題,淡化社科理論教學
在我們的教學中發現,對研究社會現象、提出解決思路感興趣的學生遠遠多于大學專業志向是社會科學的同學。Duncan Watts 認為社會科學的未來發展方向是以數據驅動解決實際問題的實證研究。在過去一百多年里社科學者的研究重點放在了發明新的理論,而忽略了對實際問題的解決以及對相互矛盾的理論的驗證和修正。
3.充分利用并跟大學資源結合
由于是前沿領域,這門課沒有任何中學階段的教材可用,所有教材都來自大學。我們主要參考了Matthew Salganik 的領域入門書Bit by Bit和Scott Page 的Complex Adaptive Systems,并將其中部分章節做成PPT 用于講課。通常,一節課會有自己做的簡單P P T 和一個領域知名學者的材料或者講義,比如Joshua Blumenstock 關于盧旺達數據收集研究的PPT,Duncan Watts 關于小世界理論的PPT 和David Lazer 關于計算社會科學領域的PPT。
這種教學方法,更好地培養了學生對社會科學領域研究方法和現狀的了解以及對社科復雜性的認知。
跨領域思維的培養一定是建立在學生有良好理科基礎上的,而目前來看融入人工智能教學體系最為現實。所謂的“文理交叉”,不論是電子人文,社會計算還是認知科學、哲學、機器學習交叉的學科都需要學生具有良好的理科基礎。斯坦福,卡內基梅隆等大學開設了C S+X(人文學科)的專業,康奈爾大學有信息科學(Information Science)。
我們計劃今年秋季學期繼續開設這門課,并打算編寫一本針對高中生的校本教材,在相應章節配上更多讓學生動手、自己實踐理解的環節。同時,積極和相關領域學者聯系,從而得到更多技術上的支持和反饋。此外,期待從計算社會科學的廣泛研究問題中,精選、簡化一些可以融于高中教育階段知識水平的、具有突出育人價值的教學實例與真實問題,真正將關系未來的社科研究納入國家重視的人工智能教育體系,培養學生的高階跨學科思維。