文|宋迪
當云計算、大數據走進傳媒
——對話EMC Isilon 存儲事業部總經理楊蘭江女士
文|宋迪
眾所周知,當前非結構化數據和數字內容正在呈現爆炸性的增長。Sports Illustrated(美國《體育畫報》)于2004 年在雅典夏季奧運會上在傳媒領域率先實施了一個百分之百的數字化工作流程。這一工作流程在為期17天的賽事中生成了250,000多張數字圖像(圖像平均大小為 18至24MB)。如今,這一數字化趨勢已經擴展到了所有使用非結構化數據和數字內容的行業與領域,包括傳媒娛樂業、數字成像領域、生命科學、石油和天然氣、制造業以及政府部門,非結構化數據的迅速增長趨勢已經非常明顯。
在國內,隨著數字電視在全國范圍內的普及,廣電媒體進一步提高業務質量,實現全臺網絡化制播業務的有效管理已成為當前需要解決的核心技術問題之一。也許很多人無法想象,采用IP架構,滿足最大單一文件系統達15PB,高帶寬環境,并可以根據需要而靈活擴展的大型存儲平臺,六十秒內就可以添加一個節點,幾十TB甚至幾十PB的數據只需一人就可以實現管理維護。
議題一:當前云計算與傳媒一線的IT建設和業務之間有著什么關系?
楊蘭江:最近業內有一個熱點詞是“轉型”,IT行業的發展一浪高過一浪,轉型替代技術越來越快越來越多。但是反過來客戶真正關心的是這種改變能夠為前端的應用帶來什么樣的利益,或者有些什么樣的實用性。對于CIO也好,作為企業級客戶也好,IT人炒得沸沸揚揚的東西跟自己有沒有關系,關鍵還是要看所提供的解決方案以及產品是不是為我所需。
云計算也好、大數據也罷,并不是脫離用戶實際應用的概念。現在各種云的概念很多,可以說是眾說紛紜。云是整合了多種IT架構和技術的一個集合,使得它能夠成為所有人共享的資源平臺。所謂“云”更多的是一個軟性的東西,雖說這個詞是軟性的,但終究還是要落地的。
簡而言之,云不只是把IT架構從以前相對來講比較保守的狀態,開放成大的公有平臺;更可以在這個平臺之上在保護數據的同時,進行資源與信息共享。舉一個最簡單的例子,在電視臺有一個很重要的系統是媒資庫,理想的狀態下,所有有需求的人都可以來共享這些資源與信息,但如果它只是一個放在傳統數據庫里的東西,可能就無法被所有人共享。議題二:在原有的IT架構下,很多數據資源無法充分實現它的價值。現在怎么才能通過大數據的整合,實現它的價值呢?
楊蘭江:所謂大數據是什么概念?我們認為10TB以上的,到1PB、2PB等都是大數據的范疇。數據內容可能包括視音頻,包括PDF等待處理的數據,包括衛星云圖等等。像這么大的數據量,如果只是簡單的放在傳統的數據庫里面,往往并不能夠保證它的有效性和實用性,所以把它開放開來,在大的架構之下為有需求的客戶所用才能真正達到目的。由于大數據的存在,必須把大量數據放在開放的平臺上為客戶所用,所以就形成了云,大數據和云這兩個概念是不能被分割的。
所謂不能夠很好的實現數據原有的價值,主要是指那些可以對外開放的數據,而并不包括媒體自己私有的數據。例如最近一個提供娛樂傳媒資源平臺的案例,這個平臺上線后其資源將被全國網民點播。像這樣的數據規模、這樣龐大的資源平臺的架構如果只是簡單的數據庫模式,使用起來會非常不方便,用戶體驗也會出現很多問題。如果這個平臺背后的IT架構或者說文件資源通過云和大數據整合后可以被大眾充分共享,將可以獲得更好的社會效益和經濟收益,這將是一個非常典型的案例。
另一方面,若A電視臺的媒資,B電視臺有需求,而這個媒資儲存在C的架構之下,則A就可以跟B達成協議,從C那里取得,三方都可以獲利。尤其像很多電視節目、娛樂節目,就可以在很大程度上實現被更多的人共享,而不是自己的資源只是放在自己那里。放著不用的數據就是死數據,現在把它激活了,有很多歷史的數據資源都可以被有需求的用戶所用,并創造新的價值。
現在傳媒行業有很多基于IP的應用點播系統,以及專業媒體間的資源共享平臺的應用案例,而這就是傳媒云架構存在的重要原因之一。從這個意義上講,它不但沒有脫離客戶的應用,更是找到了一個更便捷的方式為客戶服務。而這也正是云落地的一個重要的體現。
議題三:傳媒行業IT架構的需求有何特殊性,跟云計算和大數據等有何關系?
楊蘭江:每個行業的IT架構都有每個行業的特點,從技術上看傳媒行業一個顯著的特點就是要求在高清、標清等資料的編輯轉碼過程的順暢,即在整個編輯過程中對速度與質量的要求。換句話說,傳媒行業對所處理的數據有一個很重要的需求,就是對于清晰度的要求,而這也就要求整個IT架構有很強的數據吞吐能力、讀寫能力,并要保證轉碼之后清晰程度,就是所謂的高清、標清的能力,這是很顯著的一個特點。
與其他很多行業不一樣,由于這個特點的存在,就要求傳媒機構的所有硬件架構、軟件應用,在應用層面上有著十分具體的要求與指向。這就要求為傳媒行業所提供的存儲,不僅僅是簡單的產品或單一的解決方案,而是能與具體應用架構綁在一起的整體解決方案。云計算也好,大數據整合也好,也要跟它的應用層面充分結合。
當今越來越多的新媒體人和新媒體公司在進行IT建設時,關注的不再僅僅只是前端的設備,更關注的是后端的架構怎樣去搭建,怎樣能夠為他所用。用攝像機拍攝一部片子,然后進行后期制作。傳統的后期制作可能對存儲不會有很大的要求,但現在對存儲的要求卻越來越大,數據的吞吐能力已經成為協助傳媒人很快的完成后期制作的重要因素。如果IT架構不給力,數據的吞吐能力不夠,那么在后期制作的時候,本來十天能夠完成的工作可能需要一個月才能完成。
議題四:科技和文化的結合備受矚目,傳媒行業應該怎樣結合云計算、大數據等IT新技術、新理念?
楊蘭江:傳媒行業中對于大數據的處理,音視頻文件等非結構化數據的編輯制作應用的十分廣泛。不僅僅是大的傳媒機構,包括有一些小的公司,做廣告、做視頻點播等等也都會頻繁涉及到,而這就造成其數據量發展的不可估量性。因為其不可估量,且是非結構化的,所以就要求有一個基于云的平臺去支撐,并需要具有極強的可擴展性。
更多的人現在已經不再簡單的談是搭建公有云或是私有云,而是混合云。數據無論是為私所用,還是為公所用,無外乎是為有需求的人服務。而這已經不是傳統意義上的IT架構能夠解決的問題。在這種大數據環境下,非結構化的數據的激增,對于傳統存儲帶來了很大的挑戰。在我看來,無論是云計算還是大數據以及其他很多技術概念都是相輔相成的,很難去割裂單獨來說。
當然,所有的IT架構都是因人而異,因勢而異的,每一個客戶遇到的問題不盡相同,但也又是相通的,怎么能夠保證應用快速上線,這對于為傳媒行業提供IT服務的存儲廠商來說也是很大的挑戰。
而目前對于更多的傳媒機構來說,面臨的挑戰是在于如何將舊有的IT架構和新架構進行結合。這對客戶的應用部署造成了很多困難。而Isilon能做的就是根據現有的架構進行適合的分析,給舊有的系統和新的系統一個結合的協同工作平臺。
不管是大的傳媒機構還是小的傳媒企業,都有自身不同的IT需求在,如果其業務量30TB就夠了,那我們就給他提供30TB的服務。如果他們業務量很大,需要幾百TB,那我們就提供幾百TB。云計算落地的具體體現之一就是根據客戶的需求不同而進行個性化的定制,滿足他們的需求。