武迪 盧婧華 袁中果

中學階段的人工智能課講什么?怎么上?如何基于學生現(xiàn)有的知識水平,從學生感興趣的問題中來,到學生感興趣的問題中去,讓他們親歷運用計算思維解決問題的全過程,是老師們在設計教學時應該思考的問題。那么學生感興趣的、生活中的、有實際體驗的問題如何找、如何與人工智能建立聯(lián)系?本文是筆者執(zhí)教的一節(jié)中學人工智能跨學科教學案例,從計算思維跨學科的領域基礎、分析問題、求解問題、遷移應用四個方面,針對“世界真小?”這一問題,剖析“六度分隔理論與小世界模型”,并引入了人工智能與社會科學的交叉創(chuàng)新方向:“計算社會科學”。從身邊的問題出發(fā),引出國際社會科學與人工智能結合的前沿方向,構建對學生大視野、大思維引領的大課堂,是本案例的育人價值體現(xiàn)。
相關基礎背景:社會科學領域的六度分隔
要用計算思維解決實際問題,我們首先要分析問題,包括界定清楚問題是什么,如何對其進行抽象和建模并得到一個可計算的模型。但是對于跨學科的教學來說,我們需要首先幫助學生“遷入”,也就是將其他學科的基礎背景知識進行梳理,作為分析問題的輸入,幫助學生建立學科知識、術語和問題上的映射關系。因此,本文中,第一部分我們先介紹“計算社會科學”這一領域的發(fā)展歷程,以著名的“六度分隔”概念為主線,從其首次出現(xiàn),到社會學家的送信實驗,再到計算社會科學研究者的電子化實驗,及全球社交網(wǎng)絡的數(shù)據(jù)分析結果,以時間為軸,將與問題求解有關的主要基礎進行了有效呈現(xiàn)。
六度分隔,即六度分隔理論,也稱六度分離、六度分割、小世界現(xiàn)象、小世界效應。即假設世界上所有互不相識的人只需要很少中間人就能建立起聯(lián)系。六度分隔1929年出現(xiàn)在匈牙利文學家卡林西的短篇小說《鏈》中;1967年,哈佛大學教授斯坦利·米爾格拉姆把“六度分隔”轉變?yōu)榱艘粋€關于人類連通性的著名的開創(chuàng)性研究。他設計了一個“連鎖通信實驗”,目標是測量美國任意兩個人之間的“距離”。這個實驗背后探究的問題是:對于兩個隨機選擇的個體而言,需要多少個相識關系才能把他們聯(lián)系起來呢?計算社會科學研究者鄧肯·瓦茨于2003年組織了一個研究計劃,開展了世界范圍內(nèi)的電子郵件通信實驗,驗證了六度分隔理論。隨著移動互聯(lián)網(wǎng)的普及和大數(shù)據(jù)分析技術的發(fā)展,研究者們可以在更大規(guī)模的網(wǎng)絡上驗證“六度分隔”理論了。Facebook最新的研究發(fā)現(xiàn),平均每名用戶與其他用戶之間的距離為大約是3.57步,我們已經(jīng)從“六度分隔”的世界進入了“3.5度分隔”的世界。
案例1:演員的小世界實驗:凱文·貝肯游戲
繼米爾格拉姆的實驗后,為了檢驗六度分隔理論的真實性,人們又進行了一些其他實驗。其中一個著名的例子是“凱文·貝肯游戲”。這個游戲的主角是美國電影演員凱文·貝肯,游戲的方法是通過不停地尋找共同出演同一電影的演員,最終“找到”另一個“目標”演員。游戲里每一個演員都有一個“貝肯數(shù)”:如果一個演員與貝肯合作過電影,那么他(她)的“貝肯數(shù)”就是1。如果一個演員沒有與貝肯合作過,但與某個“貝肯數(shù)”為1的演員合作過,那么他(她)的“貝肯數(shù)”就是2,以此類推。例如,我國著名演員唐國強與美國演員凱文·貝肯之間的連接數(shù)(貝肯數(shù))是3,唐國強與佟大為共同出現(xiàn)過《建國大業(yè)》,佟大為與史戴芬一起出演過《好萊塢冒險》,史戴芬與貝肯一起出演過電影《一級謀殺》。該網(wǎng)站通過對超過133萬名世界各地的演員的統(tǒng)計得出,他們平均的“貝肯數(shù)”是2.981,最大的也僅僅是8。這也是人與人之間小世界性的一個典型例子。
在教學中,教師可以用游戲的方式讓學生體驗和實踐六度分隔的奇妙,如案例1中的演員的小世界實驗,是將世界上的演員們的網(wǎng)絡作為研究對象。輸入兩個演員的名字,網(wǎng)上可以實時顯示他們之間需要幾個中間人才能連接起來。這樣一個例子是學生們喜愛且能夠引起興趣和共鳴的。筆者在教學實施中發(fā)現(xiàn),學生們的積極性被充分調(diào)動了起來。
分析問題:什么是網(wǎng)絡?如何建模?
許多自然、技術和文化現(xiàn)象經(jīng)常被描述為網(wǎng)絡。運用計算思維的抽象思考,我們分析自然、科學技術、人文社會中的各種網(wǎng)絡問題。從各種各樣的網(wǎng)絡中,提取關鍵要素:網(wǎng)絡中的個體,如生物網(wǎng)絡中的神經(jīng)元,互聯(lián)網(wǎng)上一個一個的網(wǎng)站,社交網(wǎng)絡上的每一個人;網(wǎng)絡中個體之間的關聯(lián),如生物網(wǎng)絡中神經(jīng)元之間由突觸相連,互聯(lián)網(wǎng)上的網(wǎng)頁之間由超鏈接相連,社交網(wǎng)絡上每個人之間的關聯(lián)是社會關系。
運用計算思維的建模思考方式,我們使用圖這種數(shù)據(jù)結構來建模網(wǎng)絡,因為圖是由邊連接在一起的節(jié)點組成的集合,可以很好地表征網(wǎng)絡的關鍵要素:個體與關聯(lián)。
圖1 數(shù)據(jù)結構——圖的幾個例子
網(wǎng)絡建模為圖(數(shù)據(jù)結構):圖的頂點對應網(wǎng)絡中的個體,也可稱為頂點或者行動者;圖的邊對應網(wǎng)絡中個體的聯(lián)系,也可稱為鏈接或者關系;圖的邊有權重,依據(jù)網(wǎng)絡中個體鏈接的強弱程度/遠近關系等還可以對每一條邊賦予權重。圖中的簇:圖中聯(lián)系緊密的一些點可以形成簇,網(wǎng)絡中存在的內(nèi)部聯(lián)系緊密、外部較松散的群體被稱為集群;圖中節(jié)點的度:進出一個節(jié)點的邊的數(shù)量稱為這個節(jié)點的度,高連接度的節(jié)點被稱為中心節(jié)點,是網(wǎng)絡中主要的信息或行為的傳遞渠道。例如,社會網(wǎng)絡中,大部分人的朋友相對較少,極少的人具有非常多的朋友,度分布并不均勻。
綜上,通過計算思維分析問題,將復雜問題簡單化,同時又不丟掉本質(zhì)特征,將各種網(wǎng)絡抽象建模為圖這種數(shù)據(jù)結構,用圖的頂點表示網(wǎng)絡中的個體,用圖的邊表示網(wǎng)絡中個體的關聯(lián),用邊的權值表示關聯(lián)強弱,用圖的簇表示網(wǎng)絡中的局部社區(qū)。
求解問題:計算度量網(wǎng)絡的特征
各種高度復雜的網(wǎng)絡系統(tǒng)對人類生活生產(chǎn)的影響越來越大,網(wǎng)絡科學是對各種網(wǎng)絡的共性的研究,并以它們?yōu)榛A,用共同的語言來刻畫各種不同的網(wǎng)絡。我們要研究的問題是六度分隔的小世界性,對社會科學中的六度分隔進行科學的理解和解釋,并分析其他各領域中不同網(wǎng)絡的特性,是否它們也同樣具有小世界特性?上述問題的研究由1998年和1999年的兩個重要性工作引發(fā),開創(chuàng)了網(wǎng)絡新科學,這兩個研究工作分別是鄧肯·瓦茨1998發(fā)表于《自然》雜志的《小世界網(wǎng)絡的集體動力學》和巴拉巴西1999年發(fā)表于《科學》雜志的《隨機網(wǎng)絡中標度的涌現(xiàn)》。本案例接下來按照《小世界網(wǎng)絡的集體動力學》論文中提出的小世界模型進行問題求解。
案例2:小世界模型的模擬仿真
鄧肯·瓦茨提出了小世界的概念及模型。同學們可以思考:你的個人網(wǎng)絡是小世界嗎?人們之間的路徑長度最長為多少?假設由60個節(jié)點組成的一個環(huán),每個節(jié)點與相鄰的兩個節(jié)點相連。假如你在玩?zhèn)髟捰螒颍?0個人圍坐成一個圈,對應60個節(jié)點的規(guī)則環(huán)圖,在這樣的結構下,要與坐在對面的人溝通會需要很長時間。同學們可以打開netlogo仿真模擬的網(wǎng)站,搜索小世界模型,可以改變的參數(shù)有節(jié)點個數(shù),左上角的“rewire-one ”按鈕表示重連一次,即某個節(jié)點的當前一個規(guī)則鏈接斷開,重新連接到任意一個其他節(jié)點。可以觀察這個網(wǎng)絡特征的變化,聚集系數(shù)(C)與平均路徑長度(L)這兩個值,隨著網(wǎng)絡結構的變化而發(fā)生變化。請同學們先自主探索隨著不斷隨機重連,原先的規(guī)則網(wǎng)絡結構有何變化?網(wǎng)絡特性有何變化?
案例3:探究網(wǎng)絡的小世界特性,從平均路徑長度和聚合系數(shù)來看
從規(guī)則網(wǎng)絡起始,不斷重新隨機連接網(wǎng)絡上的邊,觀察網(wǎng)絡聚集系數(shù)(藍色點線)和平均路徑長度的變化(紅色點線)趨勢,隨著隨機連接邊數(shù)的增多,網(wǎng)絡的平均路徑長度剛開始迅速下降,這意味著只要隨機重連少數(shù)幾條邊,節(jié)點與節(jié)點之間的路徑會大幅縮短,但之后下降就并不明顯了。對于聚集系數(shù),隨著隨機重連增多,呈現(xiàn)較為均勻的下降趨勢。當全部隨機重連后,網(wǎng)絡變?yōu)殡S機網(wǎng)絡。那么,從規(guī)則網(wǎng)絡到隨機網(wǎng)絡中間有一段是聚集系數(shù)較高、平均路徑長度較低的情況,這就是我們說的小世界性。
如果將節(jié)點隨機連接起來生成一個網(wǎng)絡,即隨機網(wǎng)絡,則所有節(jié)點的度數(shù)都會差不多。雖然平均路徑長度短,但網(wǎng)絡中也不會有中心節(jié)點和小的集群。科學家們發(fā)現(xiàn)自然、社會和技術網(wǎng)絡中,大部分都有高度的集群性(聚集系數(shù)高)、不均衡的度分布以及中心節(jié)點結構,同時有平均路徑長度較短的特性。我們從仿真模擬中可以得到:增加隨機性。從規(guī)則網(wǎng)絡到小世界網(wǎng)絡,平均路徑長度迅速下降,聚集性較為接近;從小世界網(wǎng)絡再到隨機網(wǎng)絡,平均路徑長度接近,聚集性迅速下降。
遷移應用:小世界性的跨學科應用
鄧肯·瓦茨的《小世界網(wǎng)絡的集體動力學》論文中對3個真實世界中的網(wǎng)絡進行了研究,結果表明它們都具有小世界性。這三個網(wǎng)絡分別是:電影演員網(wǎng)絡;美國西部電網(wǎng)網(wǎng)絡;線蟲的神經(jīng)網(wǎng)絡。很難想象電影明星與電力系統(tǒng)之間存在共性,更不要說線蟲的腦神經(jīng),但研究表明它們實際上都是小世界網(wǎng)絡,平均路徑很短,具有高度的集群性。
在電影演員網(wǎng)絡中,節(jié)點代表演員;如果兩個演員出現(xiàn)在同一部電影中,則相應的兩個節(jié)點就相互連接。例如,湯姆·克魯斯和馬克斯·馮·賽多(《少數(shù)派報告》),卡梅隆·迪亞茲和朱莉婭·羅伯茨(《我最好朋友的婚禮》)。演員網(wǎng)絡中,電影演員人數(shù)n=225,226, 平均每個演員與其他演員連接數(shù)k=61。
在美國西部電網(wǎng)網(wǎng)絡中,節(jié)點代表電網(wǎng)的主要組成部分:電廠、變壓器、變電站,邊代表它們之間的高壓輸電線。電網(wǎng)網(wǎng)絡中: 節(jié)點書目n=4941, 每個節(jié)點的平均連接數(shù)為k=2.67。在線蟲的神經(jīng)網(wǎng)絡中,節(jié)點代表神經(jīng)元,邊則代表神經(jīng)元之間的連接。神經(jīng)學家已經(jīng)繪制出了這種低等生物的所有神經(jīng)元和連接,神經(jīng)元數(shù)目n=282,每個神經(jīng)元平均和k=14個其他神經(jīng)元相連。在上面的三個網(wǎng)絡的建立和求解中,我們把所有的邊看作是沒有方向也沒有權重的,把所有的頂點看作是相同的,并承認這些假設是粗糙的近似。所有三個網(wǎng)絡顯示了小世界現(xiàn)象。
對網(wǎng)絡的科學理解不僅會改變我們對各種自然和社會系統(tǒng)的理解,同時也會幫助我們更好地規(guī)劃和更有效地利用復雜網(wǎng)絡,包括更好的網(wǎng)絡搜索和萬維網(wǎng)路由算法,控制疾病傳播和有組織犯罪,以及保護生態(tài)環(huán)境。
本文將人工智能的跨學科教學案例通過領域基礎、分析問題、求解問題、遷移應用這四個計算思維解決跨學科問題的過程和思路進行了完整呈現(xiàn)。本教學案例為筆者親身實踐的梳理總結和反思,著重關注學生在真實世界問題解決中計算思維的培養(yǎng),這也是信息技術學科的重要的核心素養(yǎng)之一。進一步,本文結合前沿的“計算社會科學”新領域的發(fā)展,開闊學生研究,拓展學生思維,從學科領域的創(chuàng)新發(fā)展激發(fā)學生的思考。
本文系全國教育科學“十三五”規(guī)劃2019年度教育部青年課題“面向未來高階能力和智能素養(yǎng)的中學跨學科人工智能課程體系建設與教學研究”研究成果,課題號:EHA190519
作者單位:中國人民大學附屬中學