本期『量子信息』專欄主持人 王曉霆
王曉霆
區塊鏈被認為是一種正在顛覆互聯網、變革傳統生產關系以及提高生產力的革命性創新體系,具有重大發展潛力。然而,量子計算機具備破壞哈希函數、公鑰密碼等傳統信息安全技術的潛力,給依賴于傳統密碼學的區塊鏈系統帶來了嚴重威脅。因此,研究“量子+區塊鏈”這一方向,意義重大。由于相關的研究成果較少,并且已有成果相對獨立,系統性的研究總結一直缺乏。
該文總結了區塊鏈產業和量子科技發展現狀,指出兩者都極具戰略價值和科學意義;分析了在即將來臨的量子時代,Grover 算法和Shor 算法如何在理論上攻擊區塊鏈核心技術中的共識算法和密碼體系;接著說明了量子科技如何從量子通信、量子共識算法、量子隨機數、量子簽名等方面賦予區塊鏈更安全高效的性能,從而打造新型量子區塊鏈系統;最后指出了“量子+區塊鏈”存在的問題以及發展趨勢。通過明確的背景介紹和引用大量重要研究成果,該文分析總結了區塊鏈將面臨的量子科技所帶來的諸多機遇與挑戰,闡明了“量子+區塊鏈”這一新興研究方向的研究現狀及未來發展趨勢,并指明其所具有的重要價值和意義,為相關研究提供了有益的指導與借鑒。
吳熱冰
強化學習作為一類重要的機器學習模型,用于解決人工智能體如何在環境中采取行動以最大化其累積獎勵的問題。其中,深度強化學習利用深度神經網絡生成人工智能體的動作選擇策略,可以有效解決基于離散動作空間和連續動作空間的強化學習問題。然而,隨著任務環境變得復雜,利用經典神經網絡生成人工智能體的動作選擇策略需要擴大經典神經網絡規模,從而導致其參數數量激增。因此,一個自然的想法是能否利用量子神經網絡替代經典神經網絡,利用量子態的疊加性或量子糾纏等資源減少神經網絡的參數規模。已有的量子深度強化學習方案在訓練量子智能體時,具有需要量子智能體與經典環境進行大量交互的問題,這增加了量子線路執行的次數。
該文沿著如何減少量子智能體與經典環境的交互次數這一方向進行了深入討論,提出了一種基于情景記憶的量子深度強化學習模型。該模型將擁有高獎勵值的歷史訓練記錄存儲至情景記憶中,進而利用情景記憶來加速量子智能體的訓練過程,可以有效降低量子智能體訓練的迭代次數,提升了在解決典型強化學習問題時量子智能體的表現,減少了量子深度強化學習算法的運行時間。該方案有效降低了量子深度強化學習的應用難度,提升了量子機器學習在處理實際問題中的效用。