瞄準“大數據” 挖掘更大價值
本刊記者 劉 佳

吳信東教授在主持“第七屆數據挖掘與智能計算論壇”
“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來。”《紐約時報》曾在一篇專欄中這樣寫道:“大數據”時代已經降臨,在商業、經濟及其他領域中,決策將日益基于數據和分析而作出,而并非基于經驗和直覺。大數據是如此重要,以至于其獲取、儲存、搜索、共享、處理等,都成為了當前重要的研究課題。
合肥工業大學數據挖掘與智能計算“千人計劃”研究團隊(DMiC)正應勢而上,以大數據計算為主題,致力于多源海量動態信息處理、普適個性化與復雜系統的大數據計算、智能媒體3個研究方向。這是一支特色團隊,云集了多名優秀科研人才。長江學者、海外杰青、國家“千人計劃”特聘專家吳信東教授為團隊學術帶頭人,目前團隊有教授6名,其中包括AAAS Fellow、IEEE Fellow、長江學者、黃山學者等;研究員1名,副教授/副研究員9名,講師1名,博士后3名。
吳信東教授長期致力于數據挖掘、基于知識的系統、萬維網信息探索研究,主持了國家自然科學基金海外及港澳學者合作研究基金(海外杰出青年基金)及其延續項目、“863”課題等多個重大項目,并獲得多項獎勵和榮譽。在他的帶領下,DMiC團隊始終堅持“務實創新、攻無不克、無堅不摧”的精神,近年來開展了多項研究,取得了諸多創新型成果。同時,整個團隊還積極開展高校間的學術合作交流,每年定期舉辦專家論壇和學術講座。
從2006年到2016年7月,團隊承擔國家重點研發計劃項目1項,教育部創新團隊項目1項,國家“973”課題1項,“973”前期研究課題1項,“863”課題3項,軍口“863”計劃項目3項及其子課題1項,教育部“新世紀優秀人才支持計劃”項目3項,國家自然科學基金20項,[美國]國家科學基金(NSF)2項,中德合作PPP項目1項等。共累計發表SCI期刊論文128篇,其中IEEE和ACM Transactions論文42篇,在國內期刊《計算機學報》《軟件學報》等期刊上發表論文21篇。在IEEE、ACM等主辦的各種國際學術會議以及香山會議、雙清論壇上做主題報告和特邀報告30余次。
團隊對多源海量動態信息處理的研究從4個方面展開:海量數據集成管理的研究,突破核心技術,以實現海量異構數據的互操作和數據共享;多源異構海量數據動態聚合研究,從信息源、信息體、用戶需求等多個視角,分析多源海量信息的可用性特征;多源動態數據挖掘與分析研究,為提高知識的決策支持價值提供關鍵理論和技術支撐;海量信息服務與應用,通過研究信息服務系統中的用戶需求、用戶行為和用戶興趣建模問題,探索云計算環境下信息服務系統的核心理論和關鍵技術,并面向醫療、農業、商務等行業和領域,開展大規模示范應用。
基于普適個性化計算模式的復雜系統研究,以期為用戶提供個性化和普適化的信息服務。大數據是企業和國家的重要戰略資源,但也存在“量”與“質”的矛盾,面向大數據特征,團隊開展大數據處理、增量計算以及誤差分析的理論框架、模型和方法。同時,推薦多樣性與精確性的普適個性化理論與方法,并進行復雜系統脆弱性分析,對復雜系統脆弱性的風險和危害及時有效發現和預測。
在智能媒體研究方面,團隊對圖像處理、分析和理解開展了研究,并研究海量多媒體數據的索引技術,多模態查詢的自適應融合技術。多媒體標注研究如何利用用戶提供的標簽等信息來提高多媒體標注的精度和效率。隨著手機和其他移動設備的迅猛增長,團隊還進行了移動多媒體研究。
瞄準“大數據”,挖掘更大價值,助力經濟高速發展,為國家為社會做更有意義的事,這是吳信東教授團隊一直堅持的理念,他們正腳踏實地踐行著。