未知
①《權力的游戲》角色死亡概率預測頁面,綠色代表生存幾率
在8季《權力的游戲》中,最讓觀眾揪心的一件事就是,你永遠無法猜到某一角色能否活到下一集,即使是十分重要的角色也隨時可能死掉。https://got.show網(wǎng)站應運而生,它是由慕尼黑工業(yè)大學( Technical University ofMunich)的學生創(chuàng)建,通過一套Al算法為觀眾預測劇中各角色的死亡率。其中某些角色的預測相當準,以瓊-雪諾為例,預測其在第8季中活下去的可能性極高死亡概率僅為12%(圖1),與最終的劇情結果還是相當吻合的。
got.show網(wǎng)站究竟是怎么預測的呢?原來他們主要應用了機器學習技術(Machine learning,ML)。傳統(tǒng)軟件,都是預先編寫好程序來執(zhí)行特定的任務,相對來說是固定不變的。應用機器學習的Al軟件則不去編寫具體的執(zhí)行程序,而是通過算法對大量的樣本數(shù)據(jù)進行“學習”(解析),從中找出規(guī)律、抽取模型,再用此模型對新數(shù)據(jù)進行判定和預測(圖2)。機器學習并不是固定不變的,在不斷地“學習訓練”的過程中,它自動對算法進行改進以達到更優(yōu)的性能。
②機器學習的三種模式(監(jiān)督學習、非監(jiān)督學習、強化學習)
相比于其他的電視劇,《權力的游戲》中的角色可能是最沒有安全感的,他們不斷地死掉,有的被暴力殺死,有的死于年老疾病,有的死于意外,不一而足。那么這些角色的死亡到底是隨機出現(xiàn)的,還是他們都具有某些相似的特征呢?比如年齡、性別、爭奪遺產(chǎn)等等。got.show通過機器學習,對這些死亡角色的生活進行分析,找出其中共有的模型特征,再以此模型去預測還活著的角色的死亡可能性百分比(PLOD),也就是——下一個死的可能會是誰?
got.show搜集了《權力的游戲》中的近千個角色,并從多個相關的百科網(wǎng)站及社交網(wǎng)站等媒體上,提取每個角色是否死亡的信息,以及每個角色的描述信息,建立起一個數(shù)據(jù)集,并提取出各角色生與死的特征集。
接下來他們應用了貝葉斯生存分析模型,對所搜集的數(shù)據(jù)進行學習。貝葉斯生存分析常用于醫(yī)學臨床研究中,檢查治療、并發(fā)癥或重大事件等對患者的影響,從而來評估存活率。got.show應用這一模型,則主要通過貝葉斯推理的相關技術,檢查不同特征和角色壽命之間的關系。他們做出的一個主要假設就是:每個角色的生命都會有一些基本的危險概率,并且某些屬性存在與否將導致一些角色比其他角色更容易死。比如根據(jù)統(tǒng)計,《權力的游戲》中男性角色的死亡率要高于女性(圖3),那么在預測某個男性的死亡率時,他的危險概率就會提高。
除了性別之外,got.show還加入了家族、情侶、婚姻、身份、年齡、主要/次要角色等參數(shù),將它們綜合到一起后計算出角色的存活率。比如瓊·雪諾,作為一個男性以及史塔克家族的成員,他的危險概率可能有60%或更高(圖4),但他的年齡、貴族身份等,又使得這一概率下降不少。如此建立起模型之后,通過不斷地學習訓練,就使得預測的準確度越來越高了。
當然,貝葉斯生存分析可以進行大概率的預測,但是對那些毫無征兆的突然性死亡事件,它會作為隨機異常值進行處理,無法精準地預測,于是got.show在貝葉斯模型之外,還引入了更為復雜的神經(jīng)網(wǎng)絡技術(基于Python的Keras框架)。有關神經(jīng)網(wǎng)絡的技術原理,本欄目已有過介紹,就不再贅述了。
③《權力的游戲》中男性和女性存活率及身份比較
④由上自下:Arryn(藍色)、Lannister(金色)、None(綠色)和Stark(灰色)家族存活率比較
正如got.show項目的導師Guy Yachdav所說,他們所開發(fā)的這套預測算法的數(shù)據(jù)雖然都來自虛構的故事,不過這項Al技術其實也可以應用到現(xiàn)實世界中,對不同的領域做出有價值的趨勢預測。
當下比較流行的機器學習預測應用領域有很多,比如天氣預報預測、股市行情預測、房價趨勢預測、市場各類商品價格預測、銷售預測(圖5)等等,甚至還有預測葡萄酒的釀造質量這樣的另類預測。總之在未來,它的應用將會越來越廣。
⑤預測領先評分是眾多機器學習應用之一