999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

音頻搜索新紀元

2008-12-31 00:00:00黃婷婷
互聯網周刊 2008年13期

小琦在收音機里偶然聽到一首動人的歌曲,但是主持人并沒有報出這首歌的名字,于是他馬上抄筆記下歌詞,希望通過網絡搜索獲得這首歌的信息,在百度的歌詞搜索里輸入這句歌詞后,他很快得到了想要的結果。

關于通過音頻內容文字來搜索音頻的概念,我們很快會聯想到如小琦一樣的搜索經驗,似乎將音頻與文字掛鉤的技術早已不算是什么新鮮玩意,那么為什么日本產業技術綜合研究所日前發布的一個音頻搜索網站會得到業界如此廣泛的關注呢?

不僅僅是歌曲

同樣是小琦,這次當他想通過在節目里聽到的字句來搜索一段相聲的時候卻出了問題,搜索答案五花八門,卻找不到他想要的。

通常,我們使用最多的音頻搜索都是針對于某一首歌曲的搜索,而它的歌詞與歌曲的發布往往是同步的,整合這些數據并不需要多大的技術支持,因為這些內容都已經是現成的。然而除了歌曲,官方的一些朗誦、彩鈴、評書、對白等作品,以及隨著web2.0時代的到來,網絡上涌現的大量草根族作品,如一段用錄音筆隨手錄下的講話、自我娛樂的博客音頻等等,各種以聲音為載體的信息也都通過網絡這種渠道傳播開來。如何在這樣浩繁的數據庫里查找所需的片斷,成為困擾互聯網搜索的難題。我們會通過其他的渠道如電視、廣播等獲得相關的信息,當我們被某一個信息吸引的時候,我們就有了獲得它本身甚至更多邊緣信息的需要。如果我們手里只掌握這個音頻本身內容中的若干字句,沒有它的名字、作者,乃至更多的信息,怎么搜到我們想要的?于是我們發現,尋常意義上的簡單音頻搜索已很難滿足我們的需求了。

除了那些本身已有歌詞文字可考的歌曲文件,更多的聲音文件需要有一個后臺將他們的內容轉化為文字,方便用戶的搜索操作。于是日本的這個名為Podcastle的網站經過多年探索,終于在6月上線,真正實現了通過內容文字進行音頻搜索。這項服務采用聲音識別技術,將聲音數據全部自動轉換成文字,收集到數據庫中,使人們方便地進行音頻檢索。比如在網站搜索欄中輸入日文“桉”,就能搜索到出現“桉”這個字的音頻資料。

前人的腳印

其實早在一年前,波士頓初創公司EveryZing便推出了一款與前者設計原理異曲同工的視頻和音頻搜索引擎一一PodZinger,這是一款播客搜索引擎,它采用了BBN技術公司開發的一種語言系統,可將音頻內容轉換成文本,而且準確率在80%以上,足以體現音頻的主要內容,能指導用戶迅速在文件中找到某個搜索目標詞出現的地方,并總結出音頻內容的核心意思。

之前《互聯網視頻革命的第一槍》這篇文章曾對PodZinger的強大功能作過闡述,Podzinger可以在網絡上抓取視頻、音頻文件,利用語音識別技術深入分析其文件內容,根據用戶搜索需求提交相應結果。它有一種軟件能夠“聽”視頻文件中的語音,并轉換成可供搜索引擎使用的文本。搜索結果中的每個詞語都可以點開并載入音頻剪輯,在指定的詞匯點上開始播放。這無疑是一種革命性的突破。Podzinger的文本記錄對于搜索者而言遠比傳統搜索引擎根據“元數據(Metadata)”搜索結果所顯示的音頻和視頻剪輯更具有相關性。

EveryZing公司首席執行官Tom Wilde當年也曾如此驕傲地介紹這款產品:這么高的準確度可以帶來許多新搜索功能,比如提供視頻和音頻的完整文本,以及直接跳到話語中某個詞或者詞組被說出的位置。這項技術還可以讓公司提供與特定內容有關的有針對性廣告,就好像Google推出的基于網頁中文本的廣告一樣。

語音識別的難題

語音識別這個概念,我們并不陌生,從孤立詞到大詞匯量連續語音的識別(LVCSR),再到語音庫檢索,語音識別技術一直在向前發展,只是語音識別似乎離我們還有些遙遠。“今后5年內,互聯網搜索將更多地通過語音來完成。”今年的2月23日,比爾·蓋茨在美國卡內基·梅隆大學發表演講說道,這已數不清是他第幾次在公開場合提及語音識別了。

對于中文而言,語音識別技術的實現較之英語面臨著更多的困難。當南方人把“牛奶”念成“留來”的時候,究竟是機器識別錯了,還是人錯了?微軟中國研發集團下屬微軟亞洲研究院語音識別組組長宋言哥平提出過這樣一個問題。而不僅僅是南北口音的偏差,每個人都有獨有的發音習慣。這就造成了語音輸入很難規范的問題。其次,噪聲也是一種不可抗的難題。“這很好理解,機器無法像人那樣分辨出人聲和噪聲。”宋言哥平解釋道,“同時,不同場景有不同噪聲,訓練的情況也不能匹配真實環境,這使語音識別在噪聲中比在安靜的環境下難得多。”

克服這些難題尚需時日,這也是為何中文音頻搜索進展緩慢的一個關鍵原因。如今日本的音頻搜索網站已經上線,中國的用戶也期待著可以更快享受到這種先進搜索技術帶來的更多便捷。

告別簡單搜索時代

在信息瘋狂膨脹的年代,對于浩瀚信息中的有效資源搜索毫無疑問是相當重要的。如今娛樂化風潮的涌起,使信息的需求早已不是以往單純的純文本而已,而是更大規模地擴展到音頻、視頻領域。以往單純通過音頻、視頻文件的文本標簽來搜索音頻、視頻文件已經不足以滿足用戶的需求。

于是出現了這種通過將音視頻內容轉換成文字的搜索方式。

然而在簡單搜索之外,還不僅僅是這種運用語音識別系統完成的搜索服務技術正在流行。當文字搜索已經發展到幾乎沒有上升空間的時候,微軟、Google這些技術巨頭也開始瞄準未來的新一代搜索市場。今年的4月份,在北京舉行的國際萬維網大會上,兩位Google的工程師展示了下一代的圖片搜索。新的圖片搜索不再只是由圖片相關的文字來判斷圖片的內容。Google將使用計算機分析圖片中的內容,并關聯關鍵字的排名。實際上,這就相當于圖片搜索中PageRank。

在早些時候,《互聯網周刊》上也報道過這樣的消息:新一代圖片搜索技術已經可以像人一樣,“看”到一幅圖片的興趣中心,判別它是人物肖像照或是風景照、攝于室內還是戶外。甚至,在人的協助下,計算機還能夠在許多張合影中找尋到同一張人臉。這些聽起來不可思議的事情,已經在微軟的實驗室里變成了現實,甚至有些技術已應用到部分產品當中。

搜索技術已經迎來了一個新的時代,在各種新型搜索服務的幫助下,我們的各種需求都將慢慢得到滿足。科技,正在向著更加人性化的一面發展,一切,都在為人類生活得更好而努力著。

主站蜘蛛池模板: 久久久久国产一区二区| 久久久亚洲色| 久爱午夜精品免费视频| 亚洲国产欧美国产综合久久| 视频二区中文无码| 国产精品偷伦在线观看| 国产人人乐人人爱| 狠狠色综合网| 国产极品美女在线播放| 女人18一级毛片免费观看| 色噜噜久久| 亚洲国产综合精品一区| 欧美国产日韩在线| 精品国产香蕉伊思人在线| 伊人大杳蕉中文无码| 久久亚洲国产一区二区| 亚洲欧洲日产无码AV| 四虎影视库国产精品一区| 国产91丝袜在线观看| 99国产在线视频| 精品黑人一区二区三区| av在线人妻熟妇| 国产男女免费视频| 啊嗯不日本网站| 国产男女免费视频| 九色视频一区| 色噜噜狠狠色综合网图区| 欧美一级在线看| 伊人色在线视频| 欧美在线国产| 日韩午夜福利在线观看| 国产在线视频导航| 久久午夜夜伦鲁鲁片无码免费| 国产在线视频欧美亚综合| 三上悠亚精品二区在线观看| 国产又粗又猛又爽视频| 国产香蕉国产精品偷在线观看| 成人午夜免费观看| 国产在线自乱拍播放| 国产精品极品美女自在线网站| 国产精品va| 国产成人精品男人的天堂下载| 亚洲日韩第九十九页| 欧美一级黄色影院| 日韩二区三区无| 欧美一区二区自偷自拍视频| 久久99国产综合精品女同| 国产三区二区| 伊人久久大香线蕉aⅴ色| 四虎成人免费毛片| 亚洲欧美极品| 在线精品亚洲一区二区古装| 午夜爽爽视频| 夜夜操国产| 激情六月丁香婷婷| 中文一区二区视频| 婷婷五月在线视频| 波多野结衣一二三| 一级毛片在线免费看| 久久精品人人做人人爽电影蜜月| 亚洲一区无码在线| jizz在线观看| 国产成人亚洲毛片| 久久无码av三级| 手机在线免费不卡一区二| igao国产精品| 亚洲av无码成人专区| 毛片最新网址| 激情视频综合网| av一区二区三区高清久久| 欧美精品1区2区| 狠狠综合久久久久综| 全午夜免费一级毛片| 成人亚洲国产| 高清无码一本到东京热| 一级一毛片a级毛片| 视频国产精品丝袜第一页| 精品无码人妻一区二区| 国产在线专区| 亚洲精品午夜无码电影网| 成人免费一级片| 亚洲欧美激情另类|