韋達韜

“這部電視劇會火。”
看到美劇《紙牌屋》發布的導演和主演名單時,美劇擁躉李小偉作出了這個論斷。
不出所料,《紙牌屋》火了。
后來,李小偉認識了《紙牌屋》熱映的幕后推手。
美國視頻網站Netflix擁有2700萬訂閱用戶,每天在網站產生3000多萬個網絡點擊量。在投資拍攝《紙牌屋》前,Netflix對這些海量數據進行了分析,發現資深男星凱文·史派西和鬼才導演大衛·芬奇點擊率頗高。于是,Netflix就將兩人納入《紙牌屋》的核心陣營。
“大數據成就了《紙牌屋》。”李小偉驚嘆道。
他并不知道,大數據的光芒也正在照進他的生活。
李小偉的堂弟今年高考,分數有些尷尬,高不成低不就。
“志愿怎么填?”面對這個分數,堂弟開始撓頭。
統計數據顯示,每年落榜的考生中,有46%是由于填報志愿失誤導致——因此,填志愿也被人們比喻為“買彩票”。
無奈之下,堂弟找到李小偉,希望這個“過來人”給自己支支招。
李小偉第一個想法就是“百度”——當年他填報高考志愿時就“百度”了不少信息,包括學校排名、概況、環境、住宿條件等。
點開百度,一個名叫“高校熱力圖”的高考志愿填報“神器”吸引了李小偉。
那是一幅建立在中國版圖上的虛擬高校分布圖,頁面上方布置有搜索引擎。
抱著試一試的心態,李小偉啟動了“神器”。
他在搜索框內鍵入堂弟分數,選擇“文/理科”——電腦顯示器上出現了一系列推薦學校名稱。
他又點擊進入了推薦學校子頁面,查看學校的報考熱度、競爭激烈程度等詳情。
查看良久,李小偉向堂弟推薦了一所競爭預測度為“弱”的學校。
“我不想上這個學校。”堂弟有些不滿意,說出了自己傾心的一所學校。
輸入這所學校名稱,“神器”上立即顯示出“競爭激烈”,而且附上了詳細統計數據——堂弟的分數絲毫不占優勢。
“這個軟件靠譜么?”堂弟有些不甘心。
這個疑問也是李小偉的。于是,他去查詢了百度對這款產品的介紹。
“原來這就是‘大數據應用啊。”李小偉看罷介紹,才知道這款產品為什么被考生們譽為“神器”。
原來,驅動“神器”運轉的,是兩個大數據模型——
一是難度預測模型,即主要結合年內的搜索熱度、分數線、往年的分數線、往年的搜索熱度、今年考生的分數分布等數據分布情況,預測不同院校的報考難度。
二是“臟數據”處理模型,即去除收集到的假數據,避免對考生和家長造成誤導,從而產生靠譜的預測。
面對大數據的“權威”,兩人服氣了。
現在,李小偉已經能熟練運用一些大數據產品了。有一次,他計劃到九寨溝旅游。但是通過百度的景區舒適度預測,他發現九寨溝景區的擁擠度為“高”,于是就選擇前往廣西,成功避開了人潮高峰。
“數據比直覺可靠。”對于大數據對生活的幫助,李小偉這樣形容。