長期被視為谷歌中國最大短板的音樂搜索反而被創造性地打造成了一款殺手級產品。除了李彥宏,它還可能讓喬布斯頭疼。
提問:一款完美的音樂產品應該是什么樣子的?
“你一動念頭,音樂就出來。”谷歌中國的產品經理洪峰慢條斯理地說。大概對這個答案仍不夠滿意,他隨即補充了一句:“甚至不用動念頭,自然就出來。”——這意味著,任何人在任何時刻可以獲得最適合那個環境、時間與心情的音樂。
由意念控制隱藏在情境中的音樂?這聽上去太不真實了口不過,倒也像科幻作家亞瑟·克拉克所言:“任何足夠先進的技術均跡近魔法。”總有革命性技術以超乎想象力的方式改變世界,就像電力、飛機和搜索引擎。
某種意義上,2009年3月30日洪峰和他的團隊所發布的谷歌音樂搜索第二版已經符合這一標準。當無數媒體將目光盯在臺前的谷歌大中華區總裁李開復與來自百余家唱片公司高層合影言歡,并將此視為谷歌反擊百度的最新武器,人們很容易忽視:這是一款至少在兩個層面上超越現實的產品。

——谷歌與巨鯨網所獲得的音樂資源,是完全免費、無版權保護(DRM)、可供下載的140余家唱片公司的完整曲庫。這四個條件的全部滿足,在全球范圍內仍屬首例。
——產品層面,它改變了人與音樂之間的距離。如果說搜索引擎降低了人找到信息的成本,社區網站把人與人之間的“六度分離”扁平化,谷歌音樂則前所未有地將一個人找到某一首歌的方法豐富化。你可以根據歌手、歌名、專輯名甚至一句歌詞找到一首歌,也可以直接播放排行榜上的熱門歌曲。不過,真正開創性的是這樣兩個功能:按照歌曲的節奏、聲調、音色獲得推薦,以及根據每首歌的音色獲得相似歌曲。因其新鮮效果及實現技術的復雜性,它毋庸置疑地成為了谷歌入華以來最富雄心與想象力的作品。
而且,它有著異常豐富的擴展空間。雖然目前谷歌與唱片公司的合作協議僅局限于中國大陸,但即使唱片業也并不希望這一模式持續不變。“如果這在中國被證明是成功的模式,幾年之后它沒有被推廣至全球我就會很驚訝了。”環球音樂亞太區副總裁sandy Monteiro對《環球企業家》說。雖然沒有人知道這究竟需要多久,但不妨想象,未來某天,這款來自中國的免費下載正版音樂服務進入美國市場,全球最大的付費數字音樂商店、蘋果公司的iTunes究竟還有多少競爭力?
此前,在谷歌全球有不止一支團隊試圖開發音樂搜索,均在內部遭到否決:除了版權問題,谷歌的決策者們也從未被說服他們能在此領域超越同行。那么,最終這樣一款產品,為什么能誕生于不以技術創新擅長,且版權保護效果不彰的中國?
請忘記那些高度概括的答案。和任何創新過程一樣,它是復雜的、難以概括的。人們當然可以事后總結出天時、地利、人和等種種方便,但歸根到底,它是一系列人的行為的結果:最不著邊際的狂想、精心勾勒的合作方案、小心翼翼的內部溝通、將聲音的物理特性轉化為數學算法最終寫成十余萬行代碼的辛苦工作,以及一些好運氣……所有這些加在一起,最終完成了一次“不可能的任務”。
“或者”的暴政
谷歌中國需要一款音樂產品,從來并非秘密。
但同樣顯而易見的是,正常的商業邏輯下,搜索引擎和音樂界難以共生。這是完全背道而馳的兩種商業模式:谷歌相信所有信息都有其價值、且它們應該以盡可能低的成本被找到,唱片業卻認為有價值的信息是有限的,它們應該被小心保存,每使用一次就收一次費。當谷歌希望針對不同人的不同需求把隱藏于長尾中的信息挖掘出來時,唱片產業則比拼著誰能找到全人類中一億分之一的音樂天才。
傾向性的差異注定了雙方的互動很容易傷害其中一方的利益。在中國,勝利者是百度。這家在中國擁有60%市場份額的搜索引擎有大約15%的點擊指向了音樂搜索,而普通網民可以通過它找到海量的可供下載的免費音樂。唯一的問題是,它們幾乎沒有版權。唱片公司不能從這一持續活躍的行為中獲利。這一度引發了雙方頗多糾紛,但百度堅持表示,自己的搜索結果中提供的是網上已有的音樂鏈接,而非自己直接提供音樂下載,這幫助它有效規避了法律風險。
類似的誘惑,谷歌中國并非沒有。2006年底,百度與國際唱片業協會的官司以前者勝訴收場,不久后谷歌又收購了帶有版權麻煩的YouTube,這兩件事的接連發生一度也讓谷歌中國有人提出,是否可以做一款跟百度類似的產品?
可這沒有成為最終選擇。“英文有句話叫做Tyranny of the ‘or’,中文可以叫做‘或者的暴政’。意思是人很容易把自己框在一個二元對立的空間,或者做合法、收費的,或者做違法、免費的,只有兩個選擇。但我們不愿屈服于‘或者的暴政’,我們就要做既合法又免費的音樂搜索。”李開復在接受《環球企業家》專訪時說。
首先要解決的問題是,怎么將這種誠意傳遞過去?
網絡業和唱片業之所以難以合作,除了立場上的根本差異,也有溝通上的障礙。雙方操持的并非同一種話語體系,而強大的律師隊伍為了維護各自利益的討論更加速了談判的不歡而散。

稱得上機緣際會,2006年9月,時任谷歌中國首席戰略官的郭去疾在舊時相識的介紹下,見到了由籃球明星姚明投資的巨鯨網創始人兼CEO陳戈。如果按照工程師的標準,陳戈口若懸河的風格不免讓人擔憂。但郭去疾很快發現了陳獨特的一面:“他是一個‘傳道士’一般的人物。你和他約好去他公司見面,如果遲到了,他會在公司門口一直等你;如果他給你寫一封郵件沒有得到回復,第二天他會同樣禮貌的再寫一封信,第三天還是如此。”
事后證明,陳戈的情商的確令人驚訝:整個談判過程中,沒有人見過他發脾氣,無論承受何種壓力,他永遠能心平氣和與你尋求共識。這讓他恰到好處地成為了一塊絕緣體,把唱片公司和谷歌之間的矛盾化解于無形。創辦巨鯨網之前,陳創立過普萊音樂公司,曾給崔健組織演唱會、出唱片,這讓他熟悉音樂圈的語言,足以扮演雙方的“翻譯”。而他和巨鯨網從未從事過盜版音樂下載,也能讓他以“沒有原罪”的姿態面對唱片業。
由此,在陳戈的介紹下,2006年11月、12月,次年1月,谷歌中國分別與索尼、環球、百代三家唱片公司初次接洽。那正是谷歌中國風雨飄搖時(請登陸gemag.com.cn查看2007年2月號文章《最長的一年》):不停被傳聞即將黯然離職的李開復和他的團隊在2007年1月明確了與巨鯨網合作的想法。
當然,李開復們的意愿,并不直接等同于谷歌的意愿。一個不可回避的現實是,如此級別的產品決策,谷歌中國必須向總部匯報,得到包括兩名創始人及公司CEO的許可。
如何讓一款在全球屢遭否定的產品意向得以通過?一如當時被輿論界低估,但日后顯現效果的,谷歌中國富于“拐大彎”的溝通智慧:他們深知這并非一蹴而就的決策,便盡可能在中國區的授權范圍內有所作為,并階段性地對總部闡述這一推進的價值,在一次次的信息疊加中累積自己的信用。
第一步是讓巨鯨成為谷歌中國的利益相關方。無疑,想在中國展開長期的音樂搜索業務,谷歌必須投資于巨鯨。當2007年2月,李開復和時任大中華區投資并購總監的宓群把這一投資意向上報到公司CEO埃里克·施密特,他們并沒有冒失地把谷歌中國的音樂計劃和盤托出,卻只闡釋了巨鯨的投資價值,并借此講述了音樂服務對于中國用戶的意義。一向對中國事務就頗為支持的施密特很快便予通過。
真正將谷歌音樂作為一個項目報到公司兩名創始人處,已是2007年11月。在此期間,谷歌中國參與此事的團隊已經迅速積累起了一條陡峭的學習曲線:他們不僅想好了谷歌與巨鯨的角色分工,更已將合作細分成六步——2008年8月發布的將音樂搜索結果以Onebox形式插入相關搜索結果中,和2009年3月30日發布的獨立頁面的搜索產品只是其中的第一、二步。
當時最大的說服挑戰,是谷歌已經明確將全球戰略方向定為搜索、廣告和應用(Search,Ads,Apps)。音樂產品似乎不應成為一個投入精力的領域。但李開復們的回答也相當有說服力:具體的音樂內容和產品都屬于巨鯨,谷歌中國只是作為入口提供者,這就并不違背聚焦于搜索的戰略,而且,在中國,如果沒有音樂搜索,忠誠的谷歌用戶也很容易流失。為留出轉圜余地,他們甚至提出了一種折中方案:購買一個獨立域名,比如m.cn,以此淡化谷歌中國的色彩。
這最終成為了谷歌中國的一個小小的傳奇:創始人拉里·佩吉只問了一個問題,就和公司CEO施密特一起批準了次一項目,全程不過幾分鐘。
必然的奇跡?
即使順利過關,谷歌中國對于巨鯨的投資仍是異常謹慎的。宓群主導制定了一個極為細致的投資結構:總共數額不過幾百萬美元的投資被分為了四輪,巨鯨每簽下一家重要的唱片公司才追加一輪投資。最終,陳戈證明了他的確是個合適之選:到2007年9月,他已經頗有效率地簽下了索尼、環球和百代三家公司有“數字版權管理”技術(DRM)限制的免費下載和免費的歌曲試聽。
一些迄今未被披露的談判細節足以證明當年谷歌中國對于與巨鯨合作的方案規劃之巧妙。比如,為規避合作倉促結束的風險,巨鯨與唱片公司的協約不止于外界所主要談及的廣告分成。據一名知悉內情的人上稱,巨鯨與每家唱片公司所簽的合同都相當復雜。除了外界最常提及的廣告分成模式,還有兩個保底收入:每下載一首歌獲得一次繳費,以及每年的保底收入。這兩項費用均由巨鯨向唱片公司支付。

而且,那些有意合作的唱片公司可以在巨鯨網獲得期權。這就將此前除了陳戈的人脈資源并無太多獨到之處的巨鯨網推入了一個良性循環:一方面,唱片公司對巨鯨的產品有了較大耐心;另一方面,每增加一方股東,巨鯨就多了一分希望成為中國音樂市場的領跑者——如果它能在幾年后真的主導此領域,財務回報注定不俗,這又給了唱片公司更多期待。
當然,沒有什么推力比音樂界自身的觀念改變更為重要。
因為獲利渠道的多元化以及音樂數字化之后的易復制性,以往簽下歌手,畢其功于一役出一張專輯獲取一次回報的時代已經過去。成功的歌手更多依靠代言和演唱會獲益,而出專輯更像階段性的曝光與提供新鮮感的一種方式。這迫使唱片公司將自己的角色從音樂制作者更多地轉向營銷、推廣、開發衍生產品等“造星”并試探商業模式上轉移。
這正是谷歌、巨鯨的談判團隊切中要害之處。他們不停講述這樣一個理念:CD對于最忠誠的歌迷仍有市場,但對更多試圖用音樂營銷自己的明星,搜索引擎是最好的選擇。而且,在傳統模式中,圍繞音樂開發衍生產品很可能是不經濟的:多數歌手的歌迷非常分散,銷售相關產品的成本就很高。但互聯網卻可以低成本地把某一類歌迷集合起來定向營銷。
一個絕佳的案例是谷歌中國自身:在進入中國市場第二年,谷歌中國的收入已經達到1億美元。想想看,這只是在2006年的中國擁有大約20%市場份額的谷歌。據陳戈稱,2008年所有唱片公司在中國市場加起來收入不過5000萬美元。
但一個障礙揮之不去:唱片公司的版權保護管理(DRM)。DRM的目的是防止消費者將他們買的媒體內容進行非法拷貝,它可以限制正版音樂能夠被拷貝幾次,在幾臺設備上播放。但站在谷歌的角度上,提供有DRM的音樂,就意味著很多并不了解技術細節和版權保護詳情的用戶會經常感到不便,這是他們最不愿接受的。2007年10月,谷歌的產品部門明確表態,巨鯨必須獲得沒有DRM保護的使用授權。
這讓原本希望在2008年3月發布的谷歌音樂一拖再拖。有當事人將2007年10月到2008年4、明稱為這個項目的“黑暗時期”:沒有人能夠確保谷歌的愿望達成,陳戈也幾乎無法承受這一壓力。
有人建議由巨鯨自己開發一種附和DRM標準但不影響中國用戶體驗的版權保護方法,但這一擦邊球方案對于一向講究“不做惡”的谷歌仍有不小的風險,而被否決。另一個選擇是只做一款流媒體播放,不提供下載的產品,但谷歌仍然擔心下載功能的缺失會破壞用戶體驗,這一方案也由此作罷。
最終的轉機發生于2008年5月10日,當巨鯨的陳戈和谷歌中國的郭去疾一起前往英國百代唱片的數字音樂部門,在曾經為甲殼蟲、皇后樂隊和U2們錄制專輯的艾比路錄音棚,對方負責人道出了一個驚人的消息:自己在一個多月后即將失去這份工作。百代剛剛挖來了時任谷歌全球CIO的道格拉斯·梅瑞爾接替們——但是,即將離任者反而給出了承諾,一定在離職前把DRM取消。
這是一個非常富有意味的轉折點:音樂界最后的大門終于敞開了,而開門人卻是即將離職的守門人。
當百代做出改變,其它幾家的跟進就成為了連鎖反應。即使如此,當李開復最終說服擁有大約40%華語歌曲曲庫的索尼加入這一陣營,已經是2009年初。
“能做成這件事,真的是個奇跡。”已經離開谷歌創業的郭去疾對本刊感慨到。從構思之初到躍過最后一道門檻,谷歌中國已經用了兩年時間,期間,無論唱片公司還是谷歌都有不少參與者離職,但這都沒有影響交易最終實現。
這是個歷史的必然。但給這塊沉重石頭最后一下推力的,是將傳統商業智慧拋之腦后的狂想。
集結號
2008年8月5日,谷歌中國辦公樓,在一間名為“開心”的辦公室里,人們很不開心。
這是谷歌音樂搜索第一版上線的時刻。自從2007年7月成立音樂開發組,它已經從一名工程師擴張成十人規模的開發團隊,一個在谷歌內部堪稱龐大的陣容。作為秘密武器存在,他們已經歷了漫長而寂寞的等待期:特別是2008年3月以來,每個月都有可能發布產品。但每次又遭到延遲。這實在太令人沮喪了——如果奧運會之前還不能有所作為,他們就得在全國上下的興奮中再熬上一個月。
按照計劃,他們該在十點把產品放到網上,如果沒有意外情況,就出去吃個午飯慶祝。
但“驚喜”很快到來:中國用戶無法訪問它,反而印度、紐約的用戶在網上反饋說,他們能用它下載歌曲。所有人當場“傻掉了”。按照協議,谷歌音樂只有中國用戶才能訪問,這是由每臺電腦的IP地址識別的,現在卻顛倒了過來。而這不僅會成為谷歌中國對外的一個笑柄,還可能讓唱片業喪失對自己的信任。
不知所措中,他們把產品從網上拿下,一行行檢查代碼。網上已經開始流傳谷歌音樂發布的消息,這一項目的主人們卻不知道究竟多久才能正式發布。“快的話,幾十分鐘,慢的話,十二小時。”當時身在上海的產品經理洪峰說。接下來的許多個小時里,他都只能坐在視頻會議的鏡頭前,就像他的面孔被投射在墻上所隱喻的,一種巨大的無力感。
當他們把問題找到并解決——該產品跟公司的另一款產品的代碼有所沖突——已經是晚上八點。
說這是一款命運多舛的作品,應不過為。谷歌音樂的前端技術負責人唐汀回憶說:“這個項目做了一年半,有無數個這種時刻,我們都可以說‘這太難了’、‘這不可能’。但最后我們就剩下了一種‘橫’,較勁,一定要把它做出來。”
這是這個故事的另一側面。當李開復、郭去疾、宓群們為了推開音樂界的方便之門而費盡心機時,一批工程師在修筑進入新的音樂世界的通道。在很長時間里,他們并不真正清楚這款產品究竟通向何方,無論它的命運還是功能取舍、介面設定,一切都并不清晰,或者說,有待創造。但這種不確定性,也正成就了谷歌音樂的驚喜感。
此項目的第一名參與者,是產品經理洪峰。郭去疾稱,在項目尚處于空想階段,洪峰是一個非常合適的討論對象:他對事物有著樸素而深入的好奇。而當它的眉目稍微清晰,洪峰又是一個頗為講求細節的人:做事之前想得很清楚,一旦認準方向,他會想方設法說服合作者,一步步打磨出他想要的效果。
“避免去做一款讓用戶不開心的產品是相對簡單的。但是做一款讓用戶們‘不不開心’的產品,并不等于做出的產品能讓他們開心。”洪峰對《環球企業家》說。他語速不快,常打比喻。這種喜歡將理念性話題以相對形象的方法表達出來的溝通方式,一定程度上與他從小學起學過多年美術有關。其產品理念也是如此。
當他想到把數以百萬計乃至人類擁有的全部音樂數字化,他“看到”了一片海洋:身在其中,每首歌就像觸手可及的一個氣泡。
怎么讓一個沉浮于大海某一角落的人抓住一個他真正想要的氣泡?這個問題屬于工程總監林斌及其工程師團隊。
林斌喜歡講自己加盟谷歌的故事。2006年9月,還在微軟研究院工作的他在出差時遇到相識已久的李開復,隨口問了一句:“你們為什么不做音樂搜索?”李很痛快地回答:“可以啊,你來做?”幾個月后,林斌加盟。
沒有爽約,到了谷歌,雖然很快就意識到了在這家公司做音樂產品有多難,林斌還是堅持把這個項目劃在自己名下,甚至在立項之前,就跟李開復申請了專職于音樂產品開發的工程師名額。
林斌的堅持讓三名初入谷歌的新兵被劃入代號“Project M”(M計劃)的音樂項目。性格活潑的杭州女孩湯萌芽和外表羞澀但極愛唱歌的中山大學畢業生鄒振盛摸索著產品的呈現方式,而穩重、極富溝通耐心的趙啟勝則專注于后端以及與巨鯨網的溝通、協作。因為尚未獲得創始人許可,他們最初的三個月甚至沒有進人編寫代碼的狀態,連李開復事后回憶起來也笑稱他們幾人為“最可憐的工程師”。期間,林斌們還有太多的障礙需要去——排清,為了不影響士氣,盡可能以“報喜不報憂”方式與他們溝通。回顧當初,林斌仍然有些動容:“到今天我也很感激他們,那時候他們很清楚這個項目的不穩定性。”
當項目最終獲得批準時,正在谷歌中國做視頻搜索產品的唐汀找到林斌,希望加入其中。之所以主動請纓,是因為成長于海外的他在申請派駐回中國時,本就希望參與一些富有中國特色的產品,而且,以前偶爾聽到別人說中國不重視版權保護,也讓他對此項目格外感興趣。當唐汀帶著高大的東北人韓準加入到這個團隊,他們帶來的是極度細心修改代碼中錯誤的體力和耐力。
不過,這款產品還需要一個在科研層面帶來突破的人。
2007年初,李開復去往谷歌紐約辦公室出差,專門抽出時間做了一個關于谷歌中國的演講,希望由此吸引更多一流工程師回國。會后,一個清秀的女生找到他。這個當時正在紐約辦公室負責移動搜索質量的工程師名為胡寧,是李在卡內基梅隆的師妹,交談不久,李就建議胡寧認識一下在北京負責移動搜索的林斌。
當林斌和胡寧終于在北京坐下來聊天,他驚訝地了解到,胡寧2004年在谷歌實習時就做過一款音樂搜索產品,而她博士的研究方向為音頻信號處理和信息檢索,與此恰好一脈相承。胡寧說,可以把科研領域的前沿成果放到谷歌音樂中來,并愿意為此搬回中國。
聞弦歌怎知雅意
當你獲得了海量的音樂信息,你究竟有幾種方式去處理它?
最簡單的,是把自己變成一個龐大無匹的FTP,任何人都可以前來下載。但這就像一座無人管理的圖書館,只有當用戶知道自己想讀哪本書,它才是有價值的。
相對高級的方法是讓電腦成為圖書管理員:它通過之前做好的信息分類把類似的歌曲推送給聽眾。比如一家名為Pandora的公司,通過人力將音樂類別劃分出400個標簽,對每首歌進行標注。當你選中一首自己喜歡的歌曲,它會把同一標簽下的歌曲逐一播放。但這就像一條單行道:在一個相對有限的曲庫下,人做出的判別當然是準確而微妙的,可如果把曲庫放大到百萬級就難以為繼。而且,每個人的口味總有不同,Pandora的方式卻只能假設所有用戶的審美是同一的。
那么,谷歌能不能教會計算機成為世界上最聰明的圖書管理員呢?一方面,它能對不同音樂的特征了如指掌,另一方面,它又能針對用戶做個性化推薦。
想做到這點,就必須讓電腦學會很多原本只有人才有的常識。這一方向在初期顯然不會像Pandora一樣快而有效編制出一套推薦體系,但它的擴張性要好得多。
胡寧的工作,就是“教會電腦聽歌”。與人類的“傾聽”截然不同,胡寧需要先把音樂的物理特征還原成數字,由電腦對數字進行分析和類比。
比如,任何一個人都可以輕易識別出鼓和笛子的音色的差異,只要找到方法把這兩種差異轉化成數字——假設,鼓是2046,而笛子是1984——即使電腦沒有耳朵,也可以將它們區分開來。而在一個成熟的算法下,那些音色接近的人也應該被標以類似的數字:王菲、愛爾蘭樂隊小紅莓和冰島歌手比約克,也許在最終數字上的差異只有0.1。
那么,想象一下,根據不同的音色,電腦是有可能給所有的音樂繪制出一張無限龐大的地圖的。雖然電腦只是在計算時把彼此詳盡的數據湊在一起,但還原成物理世界的歌曲,人們看到的就是鋼琴曲集合在一起,吉他獨奏湊在一起,聲音粗礪的搖滾男聲被劃分到一個陣營……
當然,真實的計算過程并非如此簡單。面對一首歌,胡寧先要把它還原成頻譜,并以“百毫秒”為單位將它分割成數千個段落,從每個段落中提取出事先設定好的一百余個特征值。這大約相當于,其中的一段幾百毫秒為一個鼓點,而另一段幾百毫秒是一聲镲,它們各自被總結成一個擁有100多個特征值的向量,這兩個向量是不同的。一首歌由上千個這樣的多維特征向量構成。那些向量重合度相對高的歌曲是相似的——這就像你在一張紙上畫出上千個點,如果有另一張紙上也有一千多個點,且這兩張紙重疊起來看,所有點的位置類似,你可以說這兩張畫很像。
這個想法已經非常有趣,但洪峰依然希望在這個程度上更進一步。剛剛做完谷歌財經的他問胡寧,有沒有可能像股票查詢一樣,用戶只要在一些標準上做些簡單的選擇,就能得到不同的結果。
洪峰的設想從投資者角度是非常直觀的:你可以讓電腦列出市盈率在6倍以下的公司,或利潤率在30%以上的公司。但胡寧并不認同他的創意:音樂是沒有市盈率和利潤率的,用戶怎么選擇?
但洪峰并不愿輕易放棄這一想法,他前后用了兩周時間說服胡寧,音樂的指標并不需要像市盈率一樣清晰,但增加用戶與音樂的互動性本身就是一個有趣的想法。
于是,在本已緊張的開發計劃中,谷歌音樂第二版包含了兩個方向的產品:一個是胡寧推動的相似歌曲,一個是洪峰構想的根據音樂特征挑歌。
和胡寧一起進入這一新方向的,是2008年7月底才加入谷歌的清華大學博士路羊。一直在學校里研究信號處理的他本以為加盟谷歌這家搜索引擎公司之后可以告別老本行,沒想到不僅不能如愿,還在胡寧的要求下讀了厚厚一摞論文,并時不時拿出數學書來進行研究。而林斌在揀選全球工程師資料時,又在蘇黎世發現了一名學術背景和胡寧、路羊相似的工程師,亦邀請他越洋加盟。

光是找出幾個通行于所有歌曲的標準,已非易事。如果讓普通人來設定歌曲特征,人們很容易想到根據快歌、慢歌來加以區分。但在技術實現上,它卻是一條彎路。
為采集相關數據,路羊和蘇黎世的同事在電話會議上一起聽著同一首歌一起在桌子上打拍子,前后處理了大概一千首歌的數據。可他們最終遇到了難以逾越的問題:那些配樂很弱的歌本來就很難找到清晰的節奏,有些歌曲則前后節奏不一,甚至,不同的人對于節奏的判斷也是不同的。人耳極易辨識的快慢,電腦分辨起來卻只有80%的正確率。雖然在學術上。這已經是個了不起的數字,但在現實應用中,這就意味著五首歌里有一首的快慢是明顯誤判的。在路羊的游說下,以節奏快慢為特征選歌被修改成了按照強烈或舒緩分類。
在另一條戰線上,胡寧推進的相似歌曲同樣困難重重:她很快做出了一款覆蓋幾千首歌的演示產品,效果極佳,但當她把數據量上升到幾萬首歌,質量又慘不忍睹,只好推倒重來。
問題的核心在于,在學校時,她只要對1000首歌這樣量級的數據進行分析就可以發表論文了,但她這次面對的是數以十萬計的歌曲。當你只對幾千首歌進行分析、聚類時,大概設定幾百個音色類別,就可以把它們相對有效的歸類。但數十萬首歌的音色差異就實在太大;中國歌曲和外國歌曲的音色聽上去差別有限,但體現在數字上卻明顯不同,而有的歌只是從頭到尾一個人在講話,這樣的特例怎么考慮進去,也是一個挑戰。
一下子數據量擴大到十萬級來開發產品是不可能的。胡寧和路羊只能選擇一種最笨而有效的方式:每次在較小的數量級上進行實驗,確定可行的辦法,然后針對每次數量級的擴大所帶來的問題對最初的特征值確定、聚類進行調整。這意味著,每次針對較小數量級的曲庫寫出有效的代碼,不久之后要主動扔掉。據說這個過程中,丟棄的代碼大約是留下的十倍。
直到電腦處理過5萬首歌,這套系統才最終比較穩定。而此時,特征值的分類已經擴大到了4096種。這似乎是個注定屬于谷歌的產品:對30萬首歌做一次分析和聚類需要上千臺計算機同時工作數十個小時,并非每家公司都可以運作。
在谷歌音樂第二版即將發布之前三周,李開復和洪峰終于可以將產品演示給公司CEO埃里克·施密特。據在場者回憶,富有產品經驗、總能一針見血看到問題的施密特這次在看過產品后,發出了疑問:“我的中國同事們,你們能不能告訴我,我該問點什么尖銳的問題?”
的確,對于今天的谷歌中國乃至谷歌全球,這都是一款足以令人驚喜的產品。
它將成為谷歌中國收復市場份額的一個杠桿?尚不能做出如此樂觀的結論。一位熟悉谷歌的人士對《環球企業家》說,最令他擔心的還并非接下來的廣告收益狀況——2009年糟糕的經濟環境也許并不能給巨鯨和唱片公司們帶來足夠理想的收入——更重要的是,谷歌在完成一款產品之后究竟能否以更大的力度把它完善、推廣出去?在批評者看來,過去一年里,谷歌中國推出產品的節奏有了明顯提升,但似乎總離引爆市場差了一口氣。像2008年上半年發布的谷歌金山詞霸,從定位上看無疑是款好產品,卻在過去一年時間里漸無聲息。
好消息是,在音樂產品上,從李開復到工程師,每個人都清楚當下的產品還有著很多的修繕余地:算法可以更精確。用戶介面仍有bug等著修改,甚至,當谷歌音樂的排行榜成為音樂界的一個關鍵指標,必須有人編寫防作弊功能……而且,別忘了,按照其最初的六步規劃,谷歌和巨鯨應該在搜索產品完成后,還有廣告產品、客戶端播放器乃至社區服務等待開掘。
但無論如何,以改變游戲規則的方式補齊了與百度正面交鋒的最后一塊短板,讓經歷了三年半起落沉浮的本土化之后,李開復終于可以坐下來,在網絡上播放一首歌平靜一下心情——而且,使用他自己的產品。