

“大數據”,又稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。今年33歲的北京人劉晗,就是利用這一時下最火熱的IT行業概念掘金的一員。由于常能準確預測未上映電影的最終票房,有人打趣說劉晗做的是給電影“算命”的生意。
靈感:工作經歷啟發創業
1999年,劉晗留學英國約克大學讀計算機專業,2004年畢業后就在當地一家酒店從事預訂系統和訂單系統的管理工作。他慢慢發現,通過分析酒店住客的年齡層分布、桌布顏色和果汁類型等因素,可以總結出一些影響酒店入住率的規律。雖只是垂直領域中的商業智能,但劉晗已從中注意到挖掘用戶行為和對其進行分析產生的商業價值。
2006年回國后,劉晗先后在IBM、新浪和中國移動卓望公司做技術架構工作。工作中,劉晗寫過微博開放平臺的接口,并在從平臺獲取數據時,發現微博用戶在社交網絡中關注度最高的是音樂、歌手;關注度第二的就是明星、影視和娛樂八卦。帶著將新技術應用領域擴展影視等領域的夢想,劉晗做了一個重大決定:辭職創業。
精準:敢于預測熱片爆冷
2012年3月,劉晗以自己工作多年積攢下的30萬元作為創業啟動資金,和4個朋友共同創辦了公司,并使用三四臺電腦開發出名為 “iFilm+”的后臺數據服務系統。系統可以利用電影名稱、演員、劇本、上映時間、首映和宣傳地點等影響電影是否受歡迎的30—50個參數變量,預測出一部電影票房成績是否理想。
2012年5月,劉晗找到電影《畫皮2》的制片方并與之展開合作,提出了很多建設性建議。如:陳坤是重慶人,如果陳坤能在四川舉行的首映發布會中出席的話,會為電影票房做出很大貢獻,得到了片方采納。在與片方的第一次合作中,劉晗感到自己得到了市場不錯的回應。同年11月,馮小剛導演的新作《一九四二》被媒體熱炒,人們紛紛相信影片會達到7億甚至更多的票房。但劉晗發現:往年賀歲檔上映的片子里,歷史題材的悲劇往往票房不佳,由此得出了預估票房 3.8 億左右的結論,并發微博為證。電影上映后,票房最終收于3.6億元左右,印證了劉晗的預測。經過與《畫皮2》的成功合作和對《一九四二》精準預測,劉晗受到了極大的關注,上門與其合作的片方也越來越多。
解密原理:用數據說話
劉晗為何能預測如此精準,“iFilm+”數據平臺是怎樣進行預測的?劉晗介紹,“iFilm+”的運行原理是將1990年后上映的電影中抽樣出同檔期的數百部,然后讓計算機根據電影各項參數指標逆向推導出定量,從而確定公式,數據來源是電影統計年鑒。除了依靠歷史數據、社交網絡分析也是預測的重要方面。當電影需要預測時,運行系統中大數據的分析處理機制,結合從社交網絡的用戶行為特征信息中提取用戶情感分析、隱含語義、關系預測等因素填入公式,就能進行測算。目前,劉晗的系統數據庫里已有4000位導演、60000個演員、20000多部影片的數據,和涵蓋微博80%活躍用戶約8000萬人的偏好分析。
通過“iFilm+”的測算,劉晗向片方提供對票房引起不利影響因素的改進建議。建議應用范圍貫穿于電影產業的方方面面,涵蓋了從題材選擇、片名評估、選角決策到上映檔期和宣傳準備整個流程。
在今年上半年上映的電影《北京遇上西雅圖》中,為獲取更好的票房效果,劉晗向片方建議:在宣傳時,應避免過度提及主人公是“第三者”的相關話題,但可在“赴美生子”等熱門社會現象上進行渲染。該片原定上映時間為圣誕節,但劉晗根據自己測算出 “2012年年末只有《泰囧》一片能收獲高票房”的結果,建議片方將檔期押后至“3.8婦女節”前后,由于預測準確,電影最終定于3月21日上映。
發展:加強合作,深入投資
如今,劉晗租下的工作場地占地100多平方米,并陸續雇傭了十多名員工。今年他已接到20多部影片的單,在已上映的《富春山居圖》、《小時代》、《喬布斯傳》和《狄仁杰之神都龍王》等影片中,劉晗及其公司都在決策方面發揮作用,他預計,本年度能有300—500萬元的營收。
在盈利方面,劉晗采用咨詢收費和利潤分成模式。咨詢模式即劉晗通過數據挖掘、技術分析為電影投資人提供建議、預測和咨詢服務。利潤分成則是電影投資公司簽訂了票房分成協議,如果之后的電影實際票房接近并高出預測結果,雙方會對高出的盈利部分進行分成。由于具有票房預測準確率高于80%的能力,劉晗已將深入電影行業納入未來發展計劃之一。因更了解哪些影片有可能賺錢,劉晗計劃,今后將會對影片進行更深入的投資。