謝更好
自人工智能誕生以來,機器學習作為實現人工智能的途徑,其主要宗旨是:通過研究使用計算機模擬或實現人類學習活動。經過幾十年的創新發展,機器學習不僅在基于知識的系統中得到應用,而且在自然語言理解、非單調推理、機器視覺、模式識別等許多領域也得到了廣泛應用,越來越受到產業界的高度重視。隨著大數據智能時代到來,2017年國務院印發了《新一代人工智能發展規劃》,明確將機器學習研究布局作為新一代人工智能前沿基礎理論研究主題之一,新一輪智能產業變革的核心驅動力,重構生產、分配、交換、消費等經濟活動各環節,形成從宏觀到微觀各領域的智能化新技術。在這一背景下,如何探索大數據機器學習理論,突破多模態龐大異構數據深度理解瓶頸,更高效地從雜亂無章數據中自動生成高價值知識,成為當前機器學習領域研究的前沿主題。

王軍平參加國務院座談會
為解決這一問題,中國科學院自動化研究所王軍平研究員經過長期研究,基于系統運籌優化、物理啟發式計算和超圖理論,提出了大數據機器自動學習理論與方法。其本質從海量多模態高速數據流中,自動構建特征工程、自動選擇模型函數、超參數自優化、模型進化結構搜索和自評估等機器自動學習方法體系,成功彌補現有大數據平臺“有海量數據,無行業知識,無決策模型”的局面。他完美刻畫了多模態海量數據中蘊含的復雜系統運行演化規律,構建了系統動力學模型,如非線性、涌現、自發秩序、適應性以及反饋回路等。他還利用已知運行規律模型以更加簡潔、富有洞察力的方式自動涌現出新數據蘊藏知識,開辟了數據驅動復雜系統腦網絡認知學習新思路。通過多年對該領域的不懈探索,將已取得研究成果廣泛應用于石油化工生產指揮、汽車傳動系統管控、水電開發電站調度等復雜系統描述、綜合診斷、科學決策過程中。在科學研究中,王軍平始終堅持將自己的科學研究成果扎根于社會所需、人民所需,服務于國家前沿戰略技術落地。
Machine Learning
),標志著機器學習研究已在全世界興起。王軍平在美國斯坦福大學留學期間,有幸加入了克里斯托弗·曼寧(Christopher Manning)研究團隊,參與了多語種自然語言處理項目開發和理論研究,從此與機器學習結下了不解之緣。他意識到計算機的優勢就在于通過數學來描繪美好世界,機器學習是打開人類與機器交互的一把金鑰匙。在他看來,當全球已開啟人工智能2.0時代,機器學習特別是大數據機器學習作為人工智能領域重要基石,已成為智能產業蓬勃發展的新引擎。2010年,王軍平通過系統科學論證,認為將圖模型知識表示優勢和強化學習類人決策優勢相結合,特別適合大數據環境中各類復雜任務感知與理解,形成了事理演化圖表示、多主體元級協同管控方法、博弈推斷分析等大數據機器學習理論體系,并廣泛應用于復雜網絡空間描述、建模和預測分析,如拓撲結構表征學習、多粒度關聯超參數優化、小世界網絡演變模型構造、網絡非線性動力學擴張等。
2012年,王軍平作為課題負責人,參與了科技部“863計劃”項目“復雜網絡群體交互自動建模關鍵技術研究”,將分布式強化表示學習新理論創新應用到數億級網絡用戶動態交互龐大復雜系統自動建模、預測模型自動選擇、群體交互結構自動搜索和參數自動優化、高維刻畫應用當中,精確標注電話通信網絡交互拓撲結構,用戶分布、交互頻率等主題。隨著我國電信網絡詐騙事件愈演愈烈,其與高利貸、網絡傳銷和非法集資等惡性犯罪事件交織在一起,嚴重危害公共安全體系。王軍平將自己的研究成果率先應用到國家有關部門網絡電話反詐騙系統,主動預測準確率92%左右,并在2017年“砥礪奮進的五年”大型成就展展出。2018年,王軍平提出了“面向電信用戶群體交互大數據的事件線索在線涌現與預判研究”理論方法,獲得了國家自然基金委面上項目資助,逐步形成了大數據事理演化自動表示、線索結構自動搜索和風險主動預判模型為核心的大數據機器自動學習方法體系。
科研人一直在探索的道路上,永不止息。在王軍平看來,科學研究從不受時間、環境以及地域的限制,而發自心底的熱愛,就是支撐他在科學研究領域篤行無悔的初心和動力。
2014年2月,王軍平來到了中國科學院自動化研究所這一平臺從事科研工作。在“人工智能與實體經濟深度融合”的背景下,他受邀請參與到國家工業智能戰略技術研究組,探索現有智能制造模式,人工智能如何解決當前制造產業升級轉型過程提質增效、降本等問題。為響應習總書記提出的“廣大科技工作者要把論文寫在祖國的大地上,把科技成果應用在實現現代化的偉大事業中”號召,王軍平系統調研了中石油、中海油、一汽大眾、北汽福田等知名制造企業,認為智能制造是由若干人-機器-企業之間相互關聯和相互作用而形成的具有特定功能的巨系統。如何將人-機器-企業在有規則或不確定動態環境中相互作用產生的大數據高效自動轉化成科學決策知識,即全生命周期知識自動化、系統決策優化,已成為制造行業智能化發展的最大技術瓶頸。
以深度學習為代表的機器學習的發展方興未艾,尤其是在圖像分類、語音識別等特定領域研究,取得了很大的突破,被廣泛應用到產品缺陷檢測、工業視覺檢測等環節。但現有的深度神經網絡技術僅是對生物神經系統的初級模擬,功能大多局限于感知與理解層面,難以在復雜時變、不確定動態大數據環境中高效地獲取知識。大數據機器自動學習,被王軍平研究團隊認為是可以實現數據驅動制造全過程自動化顛覆式變革發展的方法理論。在他們看來,未來制造企業的重要任務不僅要在物理世界、人類社會空間中完成,更重要的工作都是在虛擬信息空間中完成。不容忽略,構建基于大數據機器自動學習的三元空間“感知-決策-執行”閉環管控大腦成為未來奮斗方向。
結合之前的研究經驗,2019年,王軍平團隊先后跟中海油服務股份有限公司、龍蟒佰利聯集團股份有限公司等單位聯合承擔了“工業互聯網網絡化能耗管理平臺”“面向海上油氣勘探生產的工業互聯網網絡化應用創新平臺建設”,全力推進大數據機器自動學習技術賦能制造企業的工藝數字化、預測性制造、節能減排和精益管理等方法體系智能化升級轉型,打造三元空間“感知-決策-執行”閉環管控工業大腦系統。如今,國家的制造產業仍然有成本高、利潤低、生產效率周期長導致交付無保障、決策沒依據的困境。王軍平還將與團隊成員們全力推進相關標準的制定,幫助制造企業的軟件開發商來突破現有的技術瓶頸,以提升企業產品的經濟及社會效益。
科研之路漫漫。在王軍平看來,未來的人工智能領域還有一個需要攀越的點,那就是——知識自動化表示。而目前的知識圖譜表示大多都是靜態的,需要依賴專家經驗指導,然而復雜系統觀測數據是由不確定環境動態演化的,由于不確定性,復雜動態系統中一般含有各種反饋回路,其觀測數據的性質往往是由復雜非線性動力學方程所決定的,因此它們遠不滿足獨立性與平穩性等經典統計假設。“在大數據機器自動學習研究中,我們無法回避基于這類復雜數據的算法分析和反饋利用。”王軍平說。
前路任重而道遠。王軍平表示,未來他和研究團隊還將時刻保持著對科研方向的初心,在這一領域中繼續奮斗。哪怕當前自己所處的研究領域是個“冷灶”,也要用自己的專注和熱情將其燒成“熱灶”。
為國為社會而研,王軍平仍將在科研道路上不遺余力。