⊙趙 鵬[太原師范學院文學院影視藝術系,山西 晉中 030619]
縱觀電影史,技術的進步一次次地推動電影的發展,帶來了新的主義與新的浪潮,產生了新的流派與新的體驗。近些年以來,“大數據”一詞在各個領域都異常的火熱。在新聞報道中會不斷地出現,例如“某某產品利用大數據改良了新的產品”,“某某行業利用大數據產生了新的模式”等類似的消息。對于電影行業來說,大數據更是被捧得火熱,很多人對其視如珍寶,但被視若珍寶的大數據有時卻讓人們大跌眼鏡。
2013 年被業界稱之為“大數據元年”,自此之后大數據這一新興的媒介技術便被影視行業所深度裹挾。2014 年百度公司與中影股份、中信信托和北京德恒律師事務所聯合發布了國內首個電影大眾消費平臺——百發有戲。一期產品選定由湯唯、馮紹峰主演的影片《黃金時代》。選擇《黃金時代》作為一期產品,除了考慮到該片的題材以及豪華的主創班底外,也充分利用了百度即將上線的票房預測產品提供的數據支持。當時百度大數據部產品規劃負責人表示,從即將上線的百度票房預測數據可知,電影《黃金時代》的票房有望一路飄紅,預計票房為2 億至2.3 億,但實際票房僅為5000 多萬,預計票房與實際票房相差達到了75%之多。在電影《后會無期》上映前,片方購買了一種數據預測服務,簡單來說就是根據電影首映日的票房,預測最終的票房成績。承擔預測服務的公司為ABD 愛夢娛樂,這家公司對《后會無期》的票房預測為4.3 億到4.8 億,但實際票房為6.5 億。相差2 億。
與《黃金時代》和《后悔無期》不同,搜狗與Netflix 這兩家公司對于“大數據”的應用,呈現出一種“時靈時不靈”的狀態。當年1 月份,搜狗公司的助理研究員在微博上稱,搜狗預測小黃人《神偷奶爸2》的票房為1.53 億,隨后的結果顯示,這與實際結果幾乎完全一致,這引起了一些電影界人士的驚呼。但是在預測《熊出沒》時,搜狗公司就出現了較大的失誤,預測票房為0.64 億,最終首周票房就達到了1.48 億。另外,當年年初《紙牌屋》迅速走紅,依據Netflix 公司的說法,Netflix 在美國有2700 萬訂閱用戶,每天用戶在Netflix 上產生3000 萬多個行為,Netflix 的訂閱用戶每天還會給出400 萬個評分,還會有300 萬次搜索請求,正是基于此原因《紙牌屋》才會取得如此成功。但是接下來,該公司推出的另一部自制劇《鐵杉樹叢》也遭遇了滑鐵盧,被譽為是“2013 年年度最爛美劇”。
面對讓百度與ABD 愛夢娛樂公司讓人大跌眼鏡的預測結果,面對時靈時不靈的Netflix 和搜狗公司,“大數據”作為一種新興的媒介技術手段被電影行業所深度裹挾。大數據技術作為一種實現手段,其本質與原始社會中人類捕獵時使用的石頭無異。正確使用新興技術的前提應為追本溯源、厘清對象與方法得當。
縱觀電影史,對數據最早、最成功的運用應當為《亂世佳人》這部影片,它的制作雖然起始于20 世紀30 年代,但是它對今天的電影行業來說還是有很大的借鑒意義的。
20 世紀30 年代,美國電影制片廠體系已經初步建立,商業法則的競爭與工業化方式的制作已經滲透到了好萊塢電影制作、發行、放映的各個環節,此時的電影采取一種分工合作的方式制作電影,制片人對電影的各個環節起到一種把控和監督的作用,對影片有著絕對的控制力。在此背景下,1936 年,小說《亂世佳人》在美國十分暢銷,暢銷的同時也引起了好萊塢的關注,但是因為在此之前,好萊塢所出品的與南北戰爭為題材的影片接連虧本,對于要不要把這部小說改變為劇本拍成影片,在好萊塢的內部產生了分歧。當時好萊塢的大佬們找到了一個叫做喬治·蓋洛普的人,問他到底這本書有多流行,他的回答是此書非常流行。得到這個答案后,當時著名的好萊塢制片人大衛·塞爾茲尼克就高價買下了《亂世佳人》的電影版權。之后蓋洛普還告訴他,這本書是美國有史以來最流行的小說,其流行程度僅次于《圣經》,約有1400 萬美國人讀過此書,塞爾茲尼克聽到這樣的答案之后信心大增。
與制片廠制度并行的另一個制度是明星制度。明星制度就是在影片當中突出演員的作用,為演員量身定制影片,在這種制度的作用下,影片的制作都必須圍繞著演員來展開。就在這樣的大背景下,對影片有絕對控制力的制片人塞爾茲尼克提出了讓英國女演員費雯·麗來出演影片女主角的方案,但由于這部影片涉及美國獨立戰爭、南北戰爭等重大歷史事件,讓一個英國女演員來飾演片子的女主角這種做法遭到了一些人的抵制。于是作為制片人的塞爾茲尼克就又找到了蓋洛普,委托他調查一下民眾對選擇英國女演員來擔當此片的女主角是否贊同。蓋洛普調查之后告訴塞爾茲尼克支持英國女演員出任主演的人數要比不支持的人數多出很多。另外,蓋洛普還告訴塞爾茲尼克大多數的觀眾想看彩色片,大部分的人不反對影片拍成上下兩集。得到答案的塞爾茲尼克幾乎全部采納了蓋洛普的建議。
在影片上市前,塞爾尼茲克聽取了蓋洛普對于影片廣告要突出“書”元素的建議,因此,首輪影片的廣告設計無論是從圖片還是字體都完全模仿了小說書本的封面,在影片上映那天觀影人流如潮。在影片后期的四輪上映中,每次都依據蓋洛普的建議來調整影片的營銷策略和電影票價。影片的最終結果證明了當初蓋洛普所做出的預測是十分成功的,共有5997 萬人次觀看了這部影片,與之預測的5650 萬人次相差不到6%,票房毛收入為3400 萬美元,成為美國有時以來最賣座的影片。
蓋洛普做出精準的預測,并促使影片產生巨大的社會反響和票房奇跡,這一切的背后都歸因于其使用了數據的科學抽樣法,這種抽樣方法不一味地追求龐大的數據量,而是追求其樣本的代表性。回看當下,如果我們今天脫去偽“大數據”的外衣,踏踏實實地利用科學的數據抽樣調查方法來制作、宣發和研究電影的話,我認為,處于網絡信息時代的我們一定會比處于第二次工業革命時期的蓋洛普預測得更加精準。
依據學者涂子沛對數據的時代劃分方法,在蓋洛普之前所用的調查方法處于數據的單一量化階段,蓋洛普的調查方法處于數據科學的抽樣時代,其本質的區別在于樣本代表性的不同。現在電影行業中炙手可熱的“大數據”概念與數據抽樣時代的本質區別在于兩點,第一點為數據的調查樣本不同,第二點為邏輯關系的轉變。
對《黃金時代》做出票房預測的是百度公司的“百度票房預測”,據百度大數據部產品規劃負責人介紹,百度票房預測結合了百度每日60 億次的搜索查詢數據、1 億規模的微博數據,以及中國電影過去五年的歷史票房數據,從演員熱度、導演熱度、電影關注度、上映時間等維度對一部電影進行票房預估。利用此方法得出的預測票房為2 億至2.3 億,但實際票房僅為5000多萬,預計票房與實際票房相差達到了75%之多,之所以會出現這樣的現象,究其根本是由于調查的樣本出現了問題。
百度公司的百度票房預測產品,它的數據來源主要是基于互聯網這一單一平臺,所依據的數據樣本不具有足夠代表性,真正意義上的大數據從樣本的覆蓋率上來說,是一種數據的全覆蓋,換句話說就是大數據的研究樣本為研究對象的全體數據。前文中提到過蓋洛普所采用的數據的科學抽樣法,這種方法之所以開啟一個新的數據時代是因為它把數據樣本的代表性問題提高到了一個新的層次。在數據的量化時代,人們對于樣本代表性的追求體現在單純數量的疊加;到了抽樣時代,人們對于樣本代表性的追求體現在了依據樣本的差異性進行科學的抽樣;那么到了大數據時代,對于樣本代表性的追求我們已經可以利用現如今的科技手段在某些方面達到一種樣本的全覆蓋,也就是說大數據時代是在研究全體樣本而不是經過抽樣以后得到的樣本。和大多數的數據公司一樣,百度票房預測在面對電影這一復雜的藝術領域時,它單純地依靠互聯網平臺所擁有的數據顯然不能稱之為“大數據”。
大數據時代區別于前大數據時代的另一重要的不同在于認知關系的轉變,簡單來說就是大數據是利用事物的相關性來代替因果性。由于人的認知在一定程度上是存在誤差的,所以人所理解的因果關系其實在某種程度上來說并不一定是一種真正的因果關系,換句話說就是人所看到和聽到的并不一定就是真的。大數據不一味地追求這種事物間的因果聯系,而是轉而尋找事物間的相關聯系,找出一個或多個對研究對象相關的變量,從而達到影響或者預測未來的研究對象。
目前大多的電影數據公司,對電影的研究還只是單一的對關于電影的數據進行研究,其實這是遠遠不夠的。從數據搜集的角度來看,對于預測電影票房來說,除了與電影相關的導演、演員、視聽、檔期、影院拍片等與電影相關的因素有關以外,文化的認同、地域的差異,甚至是氣候的改變等都可能會對電影的票房產生影響,大數據要做的就是找到事物之間的這種相關性。從數據真實度的角度來看,在對電影受眾進行調查的時候,獲得的并不一定都是真實的數據。例如,網絡上充斥著大量的水軍,微博上有著大量的僵尸粉,就算找到真人面對面地填寫調查問卷,也許礙于某些原因得到的答案也不一定是真實的。在這種情況下,大數據也可以找到其他一些相關的因素來代替某一類不容易辨別真偽的數據。
在電影行業中,被綁架了的“大數據”始終不缺乏現象級的話題與喧鬧后的質疑。無論是從數據樣本上來講,還是從邏輯關系上來講,電影行業離真正的大數據還存在一定的距離,距離的存在是由于我們現在其實是正在邁向大數據時代,而并沒有真正跨入大數據時代。大數據的興起是基于信息時代的互聯網平臺,大數據的成熟是基于云技術的成熟與普及,我們現在已經擁有了前者,正在擁抱后者。對于研究電影的數據公司來說,在現有的技術條件下我們完全可以利用科學的數據抽樣方法來進行多維度的研究,得出可靠的結論,那么“《亂世佳人》式”的成功也一定會不斷地涌現出來。
①肖揚:《黃金時代:帶觀眾掙錢》,《北京青年報》2014年9月22日,第B08版.
② 張曦:《黃金時代上映10天票房未過5千萬 文藝片如何突圍》,中國新聞網,2014年10月12日,http://www.chinanews.com/yl/2014/10-12/6669020.shtml
③④ 鄭道森:《不要因為票房預測失靈就全盤否定大數據》,虎嗅網,2014年19月23日,http://www.huxiu.com/article/45114/1.html.
⑤ 范曉東:《〈紙牌屋〉的大數據爭議:革命還是包裝?》,騰訊網,2014年02月19日,http://tech.qq.com/a/20140219/014987.htm
⑥⑦ 涂 子沛:《數據之巔:大數據革命,歷史、現實與未來》,中信出版社2014年5月 第1版,第180—181頁,第182—183頁。
⑧ 數 據的時代劃分“量化時代、抽樣時代、開放時代、大數據時代”參見涂子沛:《數據之巔:大數據革命,歷史、現實與未來》,中信出版社2014年5月第1版.
⑨⑩〔奧〕 維克托·邁爾-舍恩伯格 肯尼斯·庫克耶 :《大數據時代:生活、工作與思維的大變革》,浙江人民出版社2013年1月第1版,第27頁,第67頁。