趙世奇,畢業于哈爾濱工業大學計算機科學與技術學院,是百度博士后工作站成立以來的第一名博士后,到2010年年底,趙世奇已經在百度工作了一整年。
話不多,這是趙世奇給人的第一印象,他的自我介紹也頗為簡單:“我在百度工作,研究語義搜索。”
但是話匣子一旦打開,就會發現趙世奇并非一個只鉆技術的狂人,他思維敏捷,愛好廣泛,對生活抱以隨性的平實態度。
“與技術保持距離。”這是趙世奇的研究態度,對他而言,技術的極致與否要從用戶的需求出發,如果埋頭技術不問需求,反而會走進一個技術“怪圈”。
歪打正著
計算機語言學。2003年,大三剛一結束,趙世奇得知已被保送研究生,在大四就要開始實驗室生涯,但這門學科是趙世奇鮮有聽聞,從未接觸過的領域。
自然語言處理技術的發展,得益于搜索引擎的發展,而在當時,搜索引擎方興未艾,自然語言處理完全是個大冷門,眼看同學們都在網絡安全與數據庫的研究范疇里拼搶,趙世奇想到了退出。
為此,學科帶頭人多次找到趙世奇,將這一交叉學科的興趣點羅列出來。“計算機科學、語言學、數學融合在一起,少了單一學科的枯燥,領域更為寬廣。”
“那就讀吧。”在趙世奇的回憶中,他其實不是一個目標清晰的人,更多的是隨遇而安,這樣的心態反而讓他不必左顧右盼而專心于這一領域。“這就是一個陰差陽錯的安排,我沒想到我能做好。慢慢的,一年后,我有了些感覺。”
在日后的研究中,趙世奇從一名“小白”逐漸找到了自己的方式。真正挑動起趙世奇積極性的是每次做出的小系統和程序,能夠進一步理解人類語言,這樣的成就感在一點一滴的積累中,推動趙世奇不斷向前。
3年后,趙世奇被保送攻讀博士學位。
趙世奇一直保持了“隨遇而安”的心態。在同學都為著出國深造削尖腦袋考托福時,趙世奇慢了半拍。最終讓趙世奇放棄出國念頭的還是在于他內心對“研究”的看法,如果出國,他將學習另一種研究思路和范式,但如果能在荷槍實彈的實際環境中磨練,將研究用于實用,會更有價值,趙世奇選擇了后者。
轉換思路
也正是抱著“實干”的態度,在攻讀完博士后,趙世奇進入百度,這和他所想要的荷槍實彈恰好呼應,他看中了百度廣闊的發展平臺。“首先,百度搜索引擎很倚重自然語言處理技術,這與我的博士課題方向非常一致;其次,百度是一個非常大且非常有活力的平臺,在這樣的企業中工作,自己的成長也會更快。”
趙世奇所在的自然語言處理團隊,是百度最核心的技術團隊之一,其成員全部由頂尖學者和工程師組成,規模已達60余人。百度為這些“趙世奇們”從事的前沿技術探索提供了龐大用戶數據庫資源和強有力的技術支持:從用戶量上看,百度已覆蓋95%以上的中國網民,擁有超過兩億注冊用戶;從技術投入上看,百度擁有3000多名全球頂級的搜索技術工程師,技術研發和產品投入更是超過了公司年度營收的1/3。
“單獨做研究可以天馬行空,有趣、離奇、新穎或者前瞻。”趙世奇剛進入百度,就發現在企業做科研與在院校的研究院有根本區別,將研究成果轉化為實際的產品才是最難的。
在百度,對技術研發方向的確認必須經過“層層把關”。經過公司的內部考量,與現有產品的嫁接,以及用戶的考驗后,此項研究開發才能被確認其價值。趙世奇時常提醒自己,在理論研究和應用實踐中找到平衡點。
“當我們考慮問題的時候,我們常常回到原點,返回用戶搜索行為的源頭去思考,如何讓搜索引擎讀懂用戶想說什么、想找什么。”趙世奇在百度的一年時間里,理解到技術層面的更新不是最重要的,更重要的是一名技術人員思維方式的轉變。
讓機器讀懂人的思想
“我不是一個技術狂人,也不癡迷于技術。”這是趙世奇的科研態度。在大學做研究時,他并不愛時常泡實驗室,在百度工作,加班也不是他的風格。“對技術保持若即若離,更有利于研發。”
對于趙世奇而言,讓機器讀懂人的思想,是他的追求。
“當我們看到用戶的查詢時,就在想能不能去反推或者猜測他腦子里的問題到底是什么?從研究者的角度來講,這也是很有趣的問題。”而對于資源的精細加工,趙世奇覺得當前搜索引擎對于互聯網資源的利用還不夠深入,未來將會把信息抽取和數據挖掘技術更多地應用進來,使得用戶檢索的對象不再是網頁,而是網頁中的信息和知識。
2009年,百度CEO李彥宏提出了“框計算”理念,這是一種簡單、可依賴的互聯網需求交互模式,用戶只要在框中輸入服務需求,系統就能明確識別這種需求,并將該需求分配給最優的應用或內容資源提供商處理,最終返回給用戶相匹配的結果。
趙世奇認為,“語義搜索”是框計算理念得以實現的重要技術保證。“‘語義搜索’未來的重點可能包括‘查詢的深入理解’和‘資源的精細加工’。”
搜索引擎的未來會變成什么樣子,趙世奇心中已經有了更加明確的方向,他做了一個巧妙的比喻:“當電燈發明之前,大家覺得點蠟燭也蠻好的,晚上可以照亮。但是當電燈發明后,人們才發現原來蠟燭是滿足不了需求的。因此,如果我們依據當前對搜索引擎的定義來看搜索,其實它已經差不多達到了需求,但是這不代表用戶內心里真的沒有更高的需求。如果我們能夠努力地突破這一層,在更上一層回頭看搜索引擎的時候,才能看到它有什么不足的地方。”