顧曉瑜,楊 悅
(南京郵電大學 通信與信息工程學院,江蘇 南京 210003)
一種基于SVM的聲源定位算法
顧曉瑜,楊 悅
(南京郵電大學 通信與信息工程學院,江蘇 南京 210003)
隨著多媒體技術的快速發展,獲取高質量的語音成為一種越來越受到廣泛重視的技術手段,以麥克風陣列定位聲源的方法在諸多領域得到了廣泛的應用。支持向量機(Support Vector Machine,SVM)是一種基于統計學習理論和結構風險最小化原則的機器學習方法,其諸多參數的選擇直接影響到SVM的性能,SVM可作為估計聲源位置的分類器,且可通過選取適當的參數提高算法的抗噪聲能力。為此,提出了一種基于SVM的聲源定位新算法。該算法提取鑒別互相關函數的特征,通過選取合適的參數,對SVM的核函數進行優化。基于Matlab對提出的新算法進行了仿真實驗驗證。仿真實驗結果表明,該算法較為顯著地增加了混響和噪聲條件下聲源定位的準確性,且具有良好的魯棒性。
支持向量機;機器學習;聲源定位;核函數
作為人機交互的重要媒介,語音是人類最重要的交際工具,具有顯著的優勢。但是,在實際生活中,常常會有干擾語音的情況出現,比如環境中的噪聲、其他聲源的干擾等,使得語音質量下降。因此,如何獲取高質量的語音成為一個密切關注的話題。一種基于麥克風陣列的語音系統由于其廣泛的應用前景,受到了越來越廣泛的關注。
在基于麥克風陣列的語音信號處理中,聲源定位技術處在核心位置。除了能夠提供位置信息之外,聲源定位技術在基于麥克風陣列的語音增強中也發揮著重要作用,對于如何增強語音信號處理的性能以及增強聲源定位的性能有很重要的意義[1]。……