最新研究進展－信息科學與電子工程專輯

2011-08-15 00:48:13

科學中國人 2011年13期

最新研究進展－信息科學與電子工程專輯

智能會議系統(tǒng)：最先進技術和開放的議題的概觀

於志文教授西北工業(yè)大學計算機學院

近年來，可記錄會議并以方便未來回顧為目的分析所產(chǎn)生音視頻內(nèi)容的智能會議系統(tǒng)逐漸成為相關研究領域的興趣熱點。一套成功的智能會議系統(tǒng)依賴多種技術，包括設備、算法和框架結構等方面。在這里，我們簡要概述了智能會議系統(tǒng)架構、會議捕捉、會議識別、語義加工和評估方法等方面已有的研究和技術。我們旨在通過對基本技術的概述來幫助理解智能會議系統(tǒng)的關鍵設計點。同時，本文還總結了發(fā)展現(xiàn)有智能會議系統(tǒng)的過程中可能遇到的開放問題。

——摘自《ACM COMPUT SURV》

通過局部樣條回歸方法得到的半監(jiān)督分類

向世明研究員中國科學院自動化研究所

本文提出了一種用于半監(jiān)督分類的局部樣條回歸法。我們方法的核心是在Sobolev空間中引入一個展開樣條，將數(shù)據(jù)點直接定位到分類標簽。樣條由多項式和Green函數(shù)組成，是平滑的、非線性的，可以高精度插入分散的數(shù)據(jù)點。尤其是在臨近區(qū)域內(nèi)通過正則化最小二乘回歸計算最佳樣條中效果更加明顯。利用該樣條，每個臨近數(shù)據(jù)點被定位到分類標簽。然后，我們估算了正則損失，并進一步制定了分類標簽向量。最終，局部臨近數(shù)據(jù)的所有損失被累積在一起，以測定標簽與非標簽數(shù)據(jù)間的全局一致性。為實現(xiàn)半監(jiān)督分類的全局性，我們將局部樣條的全局損失和標記數(shù)據(jù)分類標簽的平方差結合在一起建立了一個目標方程。通過這種方法，我們建立了全局最佳分類可以被最終獲得的直推式分類算法。在半監(jiān)督學習設定中，我們分析了所提出的算法，并處理成Laplacian正則化結構。在公共數(shù)據(jù)集、應用程序交互圖像分割和圖像摳圖比較分類實驗均表明我們方法的有效性。

——摘自《IEEE T PATTERN ANAL》

代價敏感的人臉識別

周志華教授南京大學計算機科學與技術系

大多數(shù)傳統(tǒng)人臉識別系統(tǒng)都試圖實現(xiàn)低識別錯誤率，在此過程中隱含著假設所有錯誤分類的損失均是相同的。在這里，我們論證了這絕不是一個合理的假定，這是因為在大多數(shù)人臉識別的應用想定中不同類型的錯誤將導致不同的損失。例如，如果一個基于人臉識別系統(tǒng)的門禁將家庭成員錯誤地識別成陌生人，他/她將不被允許進入房屋，這僅僅是個錯誤。但是，如果將陌生人錯誤地識別為家庭成員而被允許進入，這將是一個很嚴重的災難。我們提出了將人臉識別問題定為多分類代價敏感學習任務的框架，并為該任務開發(fā)出兩個理論合理的方法。實驗結果證明了我們所提出方法的有效性和功效。

——摘自《IEEE T PATTERN ANAL》

自適應變分法用于復原高密度脈沖噪聲的彩圖

郇中丹教授北京師范大學數(shù)學科學學院

我們提出了一種用于復原高密度脈沖噪聲的彩圖的全新變分框架。本項工作的創(chuàng)新之處在于在代價功能中引入了一個自適應加權數(shù)據(jù)保真項。該保真項由統(tǒng)計方法推導出，包含兩個加權函數(shù)及若干個噪音的統(tǒng)計控制參數(shù)。該方法是基于以下事實：脈沖噪音可以被近似為概率密度函數(shù)為有限混合模型的附加噪音。Bayesian框架被用作公式，其中似然函數(shù)由混合模型給出。受到期望值最大化算法的啟發(fā)，在本研究中我們使用了兩個帶變分框架的模型。所提出模型的高級形式是：加權函數(shù)可有效探測圖像中的噪音；得到噪音信息后，所提出的算法可以通過更新加權函數(shù)和控制參數(shù)來自動平衡恢復影像規(guī)律性和保真項。這兩步可以確保即使對于高比例脈沖噪音（90%以上）的退色彩圖，仍能獲得很好的恢復。此外，利用分裂算法可以非常快地得到該算法的數(shù)值實現(xiàn)。數(shù)學實驗結果和其他方法比較證明了我們方法的效率。

——摘自《INT J COMPUT VISION》

用于3D局部形狀檢索的學習魯棒相似度測定

查紅彬教授北京大學信息科學技術學院

我們提出了一種新方法用于學習推土機距離的魯棒地面距離函數(shù)以使其適于定量兩個特征集的部分相似性。首先，我們定義了地面距離作為通常用作特征-特征基本距離（或相似性）度量的單調(diào)變換，因此在計算推土機距離的過程中，算法可以更好地將其核心定位至特征映射上，而不被無關映射影響。由此，所提出的方法特別適用于存在嚴重的閉塞和混亂問題的3D局部形狀檢索。我們證明當變換滿足某些條件時，基本距離的度量屬性足以保證地面距離為米制，這可以使大型數(shù)據(jù)庫快速檢索技術上成為可能。其次，我們基于realAdaboost算法提出了差異化的學習框架以優(yōu)化變換函數(shù)。該優(yōu)化可以在無參數(shù)假設變換的分段常近似的范圍內(nèi)實現(xiàn)。最后，3D局部形狀檢索的大量實驗強有力地證明了我們所提出技術的有效性。

——摘自《INT J COMPUT VISION》

通過對應函數(shù)來避免不匹配

胡占義研究員中國科學院自動化研究所

我們提出一種新方法（ICF），用對應函數(shù)來識別點對應以避免在給定的推測點對應過程中的不匹配。通過分析單應性函數(shù)的內(nèi)涵，我們引出了一個用于3D屏幕的雙影像對應函數(shù)的新概念，可以通過將一個圖像定位到另一個圖像對應點來獲得對應點間的關系。因為在現(xiàn)實應用中對應函數(shù)是未知的，所以我們還研究了如何從給出對應點中計算對應函數(shù)的方法，并提出了基于診斷技術和SVM的迭代估計通信函數(shù)。進而，所提出的ICF方法能通過檢查是否與計算對應函數(shù)相一致來避免不匹配。基于真實圖像的大量實驗證明我們所提出方法的優(yōu)越性能。此外，ICF是用于避免不匹配的通用方法，還適用于剛性物體或未知變形的非剛性物體的圖像。

——摘自《INT J COMPUT VISION》

混合遺傳算法用于使無線傳感器網(wǎng)絡壽命最大化的正向編碼體系

張軍教授中山大學信息科學與技術學院

通過傳感器調(diào)度操作使傳感器網(wǎng)絡生命周期最大化是建設低能耗無線傳感器網(wǎng)絡的有效方法。在目標區(qū)域內(nèi)隨機部署后，每套設備都可以完全覆蓋整個目標區(qū)域，如何找出最大數(shù)量的傳感器不相交集是一個NP完全問題。我們提出了一種結合了遺傳算法和時間表過渡操作的混合方法（STHGA）來解決這一問題。從字面上來說，STHGA與其他方法的不同之處在于，STHGA采用正向編碼方案，并使用了帶時間表過渡操作的算法。正向編碼方案的創(chuàng)新性是每條染色體的最大基因值的增加與解決方案的質(zhì)量保持一致。通過過渡限制染色體，正向編碼方案反映出傳感器可行性計劃的結構特點，并為進一步改進提供了指導。在STHGA中，遵守編碼要求、基因操作和方案過渡操作可協(xié)同將不完全覆蓋集改變?yōu)橥耆模ㄟ^數(shù)集中冗余傳感器的時間表使其他集仍保持完全覆蓋度。多個目標點（點覆蓋面）和整個區(qū)域的感應用于評估STHGA的效率。此外，我們還分析了傳感器的數(shù)量和感應范圍，STHGA性能對感應器豐度的影響。實驗結果顯示我們所提出的算法在速度和質(zhì)量解決方案兩個方面都優(yōu)于現(xiàn)有方法。

——摘自《IEEE T EVOLUT COMPUT》

基于群體算法投資組合用于數(shù)值優(yōu)化

姚新教授中國科學技術大學計算機科學與技術學院

我們研究了將基于群體的算法應用于數(shù)值優(yōu)化問題，在一個給定的預算時間內(nèi)必須得到一個解。雖然進化算法、粒子群優(yōu)化和差分進化等多個基于群體的算法已被開發(fā)出來，并被用于數(shù)值優(yōu)化問題，但是算法的性能因問題不同而發(fā)生明顯的改變。這暗示著存在于算法選擇相關的固有風險。我們認為作為已有算法和向其中投入總時間預算的替代，必須具備在多種不同的算法中可以更小風險的分配時間。由此，我們提出一種可以將多種算法作為其結構算法的的新方法，命名為基于群體算法投資組合（PAP）。PAP運行每個帶有給定時間預算的結構算法，通過遷移方案來刺激結構算法的相互作用。作為通用框架而不是特殊算法，PAP很容易實施，并能適應已有的任何基于群體的搜索算法。此外，我們還提出了一個在問題集中比較任意兩種算法風險的度量方法。通過研究11個實例和27個Benchmark函數(shù)，我們?nèi)嬖u價了PAP。實際結果表明，PAP在解的質(zhì)量方面優(yōu)于它所包含的結構算法。

——摘自《IEEE T EVOLUT COMPUT》