讓機器能理解會思考，讓認知智能頂天立地

2024-12-18 00:00:00

科學中國人 2024年11期

隨著人工智能第三次浪潮的到來，全球正迎來一場全新的產業變革。我國在深度學習和知識圖譜等領域已取得顯著進展，但與人類認知能力相比仍有差距。目前，深度語義表示、知識圖譜建模和類腦智能等研究領域展現出推動認知智能實現重大突破的潛力。接下來的十年將是認知智能發展的關鍵時期。

肩負使命，砥礪前行，認知智能全國重點實驗室（以下簡稱“實驗室”）在需求的驅動之下組建。實驗室由中國科學技術大學和科大訊飛共建，于2022年5月正式獲批重組，成為首批20家標桿全國重點實驗室之一。

實驗室以“讓機器能理解會思考，讓認知智能頂天立地”為使命，開展認知智能共性基礎問題研究和前沿技術攻關，并在教育、醫療、交互、翻譯等領域實現國際領先和業界引領的智能應用系統，解決我國優質民生資源普惠供給、中國智造升級和“一帶一路”語言互通等國家需求，多項認知智能系統取得規模化落地應用。

瞄準需求帷幄布局

實驗室瞄準國際認知智能技術的理論和技術發展前沿，面向國家重大戰略需求和人工智能產業發展，以人機交互、智慧教育、智慧醫療、智慧司法等領域對認知智能技術的廣泛和共性需求為牽引，重點開展語義計算、知識建模等認知智能基礎理論及技術研究，形成了5個研究方向布局。

（一）認知基礎共性技術

實驗室面向科技前沿，開展以大模型為核心的認知智能研究框架和產學研協同模式研究，圍繞認知智能基礎共性技術中的高質量數據處理與知識表示、知識構建與推理、持續學習與自主進化，研究高質量數據處理與生成、跨模態知識統一表達范式、跨模態語義關聯與融合、多模態知識抽取與對齊、可信知識推理框架、思維樹提示學習方法、增量知識學習、大模型能力認知診斷、意圖對齊反饋的強化學習進化機制等關鍵技術，并開展神經網絡大模型智能涌現原理探究及大模型與腦科學的交叉前瞻探索。

（二）行業認知

實驗室面向“幸福中國”實現基于人工智能的教育、醫療優質資源普惠供給的需求，研究認知智能應用關鍵技術，具體包括：在教育領域研究口頭語言運用能力評測、書面語言運用能力評閱、理科解答題批改、學情診斷、學習路徑規劃和個性化推薦；在醫療領域研究醫學文本內涵解析與知識構建、時序推理智能診斷、多模態問診、病歷書寫內涵質控；在司法領域研究案件信息自動抽取、案件自動量刑預判、司法文書自動生成、司法文書自動質檢與糾正、基于案情分析的法條推薦、司法證據鏈分析審查等關鍵技術。

（三）人機交互

實驗室面向“中國智造”升級手機/汽車/家電/機器人等人機智能交互的需求，深入布局擬人化人機交互技術，解決人機交互領域的核心科學問題，主要包括如何結合認知智能實現觸摸、語音、語言、手勢、人臉、視頻等跨模態交互方式的融合，以及如何準確認知理解人機交互過程的廣泛信息需求，最終完成自然有效的交互系統響應，提升整體人機交互體驗。重點研究人機交互對話管理、多模態交互感知、全雙工交互、主動交互、多輪對話、智能知識問答、情感交互、多維度表達等關鍵技術。

（四）多語種語言

實驗室面向“一帶一路”構建跨語言溝通無障礙的經濟文化交流環境的需求，研究多語種數據和專家資源稀缺條件下的語音識別、語音合成、圖文識別、機器翻譯建模方法，以及多語種語音翻譯/同傳翻譯/圖片翻譯中多任務協同優化技術，建立以中文為核心的多語種自動翻譯系統和平臺，支持“一帶一路”共建65個國家53種官方語言及其他周邊語種，與漢語之間的文本、語音和圖像等多種模態輸入的雙向互譯，并實現中文和20個語種的高可用語音同傳，為不同國家和地區之間的跨語言溝通交流和信息傳播提供核心支撐。

（五）科技文獻服務（擬設立）

實驗室將面向成果調研、論文研讀、科研寫作等計算機科學場景下助力科研加速的需求，構建大規模科技文獻知識庫，持續積累優化科技文獻論文數據；持續優化基于語義檢索的多階段論文閱讀理解、大模型檢索增強算法、基于科技文獻向量知識庫的知識問答和結論解讀、多語種文獻智能分析等技術；構建端到端的檢索增強模型優化流程，實現人類偏好反饋和模型選擇的迭代優化；通過科技文獻服務智能化，服務更多科技工作者，助力我國科技發展創新。

頂天立地卓越創新

自成立以來，實驗室始終秉承“頂天立地”的理念和追求，銳意進取、埋首耕耘，取得了一系列達到國際領先甚至唯一的原創性科研成果，為領域實現我國源頭技術自主可控作出了卓越貢獻。伴隨著一個又一個成果的涌現，實驗室積累的創新實力已經顯露。

2022年3月，代表前沿國際技術和水平的第十六屆國際語義評測大賽舉行。在這項認知智能領域重要的國際賽事中，實驗室率隊殺出重圍，連奪3個主要項目冠軍。而在此之前不久，實驗室還以76.06%的準確率，刷新同樣是認知智能領域內的常識推理挑戰賽CommonsenseQA 2.0的世界紀錄，比第二名領先了近3個百分點。

實驗室突破認知基礎共性技術，達到整體國際一流、部分領域國際領先的水平，自批準建設至2023年年底共獲得16項國際認知智能領域權威評測冠軍和中國計算機學會自然科學獎一等獎等獎勵和榮譽。其中，2022年實驗室3次奪得常識推理賽事冠軍，除了在常識推理挑戰賽CommonsenseQA 2.0上嶄露頭角之外，還先后在科學常識推理挑戰賽OpenBookQA和常識推理挑戰賽QASC上奪冠，并兩次超越人類平均水平，實現認知智能技術的重大突破；2023年，實驗室提出了用于知識構建和推理的D-Reasoner模型，并在離散推理閱讀理解任務DROP中奪冠，所有指標均刷新紀錄。此外，實驗室團隊提出用于持續學習的VL-Reasoner模型，在多模態問答比賽A-OKVQA中奪冠，大幅提升了視覺問答（Visual Question Answering，簡稱VQA）效果；推出中文“羊駝”系列大模型開源項目，廣獲業界好評，多次榮登GitHub（一個面向開源及私有軟件項目的托管平臺）全球趨勢分析項目和個人總榜榜單，并成功榮登總榜首位。

面向通用人工智能國際科技前沿，實驗室于2022年12月15日自主部署“認知智能大模型技術及應用”專項攻關，開展數據獲取、數據清洗、算力建設、國產化移植、內容安全、算法攻關和應用技術等各方面工作，突破了軟硬一體化自主可控訓練、跨領域異構知識統一表征、訓推一體協同優化等技術，取得了積極進展，于2023年5月6日首次發布星火認知大模型并持續迭代升級。2024年6月27日發布的訊飛星火大模型V4.0已實現全面對標GPT-4 Turbo。

實驗室在既定研究任務基礎上，面向教育、醫療、辦公、汽車、工業、金融等領域開展基于認知大模型的應用創新，解決社會剛需。在教育領域，大模型中英作文批改準確率已經超過一般老師的水平；口語教學已支持CET、雅思、托福等多類口語學習和模考。在醫療領域，研制了超越GPT-4的醫療大模型，研發具備多輪、主動交互能力的訊飛曉醫App，覆蓋1600種常見疾病、2800種常見藥品、6000種常見檢查檢驗，滿足用戶看病前、用藥時、檢查后的核心場景健康需求。在科研領域，實驗室與中國科學院文獻情報中心合作研發了科技文獻大模型和星火科研助手，支持成果調研、論文研讀及學術寫作等研究工作，目前已覆蓋超5萬科研工作者，成果調研等效率可提高近10倍。

同心聚力開啟未來

實驗室在人才培養和學術交流方面同樣取得了顯著成績。實驗室匯聚了一批頂尖的科研人才，包括多位院士和行業內的知名專家，共同推動認知智能領域的研究。在學術交流方面，實驗室還積極舉辦和參與各類學術會議，如第一屆認知智能與大數據技術研討會（CIBD 2024）等，這些活動不僅加強了實驗室的學術影響力，也為人才培養提供了豐富的實踐機會和交流平臺。這些努力，為實驗室科研人員創新思維的培養提供了良好的環境，也為實驗室的未來發展奠定了堅實的基礎。

展望未來，實驗室將立足使命任務，向認知智能發展領域面臨的諸多瓶頸問題發起挑戰，通過人工智能技術的突破和軟硬一體化的能力的提高，幫助人類更好地應對未來。