吳永飛 等
2020年10月16日,習近平總書記強調,“要加強量子科技發展戰略謀劃和系統布局,把握大趨勢,下好先手棋”。實際上,在眾多新興精尖技術中,量子計算由于其在機器學習建模應用方面表現出超越經典計算的模型準確性優勢,在商業銀行應用領域前景廣闊。商業銀行智慧運營場景為量子機器學習算法模型的應用提供了天然土壤,商業銀行運營管理業務迎來了“換道超車”的發展機遇;將量子科技與銀行智慧運營相結合,具有重要的社會價值和經濟價值。當前社會已經從互聯網、大數據時代邁向人工智能、量子科技時代,金融生態環境和客戶交易習慣發生著深刻變化。在此背景下,銀行需要以金融科技創新為驅動,全面推進運營管理數字化轉型,在客戶體驗升級和資源配置優化等方面予以體現。本文將量子科技與機器學習相結合,立足我國商業銀行應用實踐,聚焦銀行智慧運營場景,運用量子聚類技術為銀行提供決策方案。
商業銀行運營管理迎來智能化轉型新機遇
銀行物理網點作為銀行服務客戶的重要場所,其運營管理的效能優化對商業銀行具有重要意義。如何在激烈的市場競爭中科學合理地配置資源,獲得更長遠的發展和更有效的競爭力,對每家銀行而言尤為關鍵。雖然隨著移動支付的普及,客戶現金需求量減少,導致自動柜員機(ATM)的使用率下降,然而非現金業務離柜辦理促進智能設備使用率上升,功能更多的機柜——智能柜臺也在網點轉型、融入新時代金融發展的背景下應運而生,越來越多的交易可在智能柜臺上實現,它將銀行零散瑣碎的業務予以集中,原本需要大量人工的柜臺業務成本得到了削減,效率也得到了提升,通過對硬件設備和業務流程的集成以及對交易憑證的整合,借助視頻、影像、工作流、人臉識別等技術手段,智能柜臺能將大部分的非現金業務都交由客戶自助辦理,這實現了業務遷移,緩釋了柜面服務壓力,進行客戶分流,消解資源占用,延伸了智慧銀行的發展方向。然而,在設備資源優化配置上,如何根據各網點的業務情況、運營情況來合理配置智柜設備數量,減少設備浪費和空閑情況,實現動態的設備數量配置管理,仍屬于當前國內商業銀行運營管理領域需要解決的問題。銀行智能柜臺設備管理的難點在于其分布范圍廣、數量多,所在地區客戶和環境情況復雜等。為解決智能設備高效運營、精準布放的問題,可借助K-means聚類無監督學習方法,縮小對網點智柜設備業務的關注范圍,直接聚焦到表現優異的網點集群和表現不理想的網點集群,有助于定期評估和掌握各網點智柜設備的運營管理情況,為進一步調整資源配置提供決策依據。
經典聚類與量子聚類算法模型
量子論誕生于20世紀初,作為現代物理學兩大基石之一,改變了人們認識自然、解釋自然的邏輯方法。但在量子論誕生的前大半個世紀,人們很少將其與計算、信息理論聯系在一起,并沒有看到量子論與其他學科進行交叉的巨大潛能。1986年,費曼(Feynman,1986)闡述了量子物理可對計算機算力的傳統物理限制進行突破,一定程度上開啟了量子計算的大門。量子計算與傳統計算的最大不同主要是由于量子的疊加、糾纏以及相干等性質,對于經典算法有巨大的改進和提升。秀爾(Shor,1994)針對在經典計算機上難以求解的整數分解和離散對數問題,提出了大整數質因子分解的Shor算法。格羅弗(Grover,1996)提出了能夠將在經典計算機上查詢數據需要O(N)復雜度縮減至量子計算機上O()復雜度的量子搜索算法。
經典聚類分析
聚類分析是機器學習的主要任務之一。由于聚類是一種無監督的學習過程,即使是在沒有先驗知識標簽的情況下也能夠合理地按照數據自身的特征來進行樣本歸類,即“物以類聚,人以群分”。目前聚類算法大體上可以分為五類:一是劃分方法,代表算法有K-means、K-medoids等;二是層次方法,代表算法有BIRCH、CURE等;三是密度方法,代表算法有DBSCAN、OPTICS等;四是網格方法,代表算法有STING、CLIQUE等;五是模型方法,代表算法有EM等。
K-means算法是劃分聚類的典型代表之一,它具有算法簡潔、運行速度快等優點;由于其無監督的屬性,被廣泛應用于在海量無標簽數據集中尋找樣本的相似性場景中。聚類不僅可以作為一個單獨的過程來發現數據的內部分布結構,還可以作為有監督分類問題的預處理過程。例如,在一些商業應用中,可以先對沒有標簽的數據樣本進行聚類,根據聚類結果進行樣本標記,而后再利用有監督學習模型對分類樣本進行訓練和測試。
量子K-means算法
量子K-means算法是將量子特有的性質與傳統K-means算法相結合,并對聚類精度有較大提升的一種量子機器學習算法。2012年,葉安新等人提出了一種量子粒子群算法的聚類方法,在一定程度上解決了聚類效果對初始質心敏感的問題;2013年,勞埃德(Lloyd)等人提出了量子版本的最近中心算法,該算法為量子K-means算法的子過程,主要是將量子態的內積轉化到一個量子態的振幅上,進而可以計算出量子態之間的相似度;2015年,潘建偉團隊在小型光量子計算機上首次實現了Lloyd提出的量子K-means算法;2017年,劉雪娟等人通過量子并行方案和量子搜索算法來提高K-means算法的效率,并證明了在一定條件下,量子K-means算法在時間和空間復雜度方面都存在明顯優勢;2021年,李玥等人利用量子粒子群優化算法的全局搜索能力強、收斂速度快等優勢,提出了改進量子粒子群的K-means聚類算法,該改進算法在精度、速度和穩定性上都有顯著提升,同時也在一定程度上解決了聚類效果對初始質心敏感的問題。
量子聚類算法模型在銀行智慧運營場景的應用
本文運用量子K-means聚類算法,對商業銀行支行網點的智能柜臺運營情況進行聚類分析。聚類分析的過程:首先根據智能設備的各類描述性特征指標情況,對設備所屬支行網點開展數據樣本的無監督聚類;再根據聚類結果中每一類的類核質心特征開展對該類別的業務描述和定義,這里需要人為對各類別進行標簽化定義,如“設備繁忙且人工維護及時的優異支行”“設備繁忙但人工維護差的需加強人工維護支行”“設備空閑而人工維護情況好的需減少設備支行”等。根據類別標簽定義,最終尋找出在智能設備管理中表現優秀的機構群體和待優化的機構群體。
數據來源與特征工程
本文選取國內某股份制商業銀行744家支行網點的智能設備運營數據作為樣本,范圍覆蓋全國31個省、直轄市、自治區,數據來源為智能設備監控報表數據和流水日志,數據時間范圍跨度為兩年,其中使用不足兩年的設備,按其實際使用時間內的數據進行建模。為構建量子K-means算法模型,本文選定特征參數,通過取均值、中位數、方差等統計學方法對報表數據進行計算加工,最終降維至兩個特征參數,分別為代表設備維護情況的維護指標和代表設備業務量情況的業務指標。
構建量子K-means算法模型
本文的量子K-means算法模型是在量子最近中心算法的基礎上構建的,主要是通過將樣本特征和聚類中心的特征壓縮到兩個量子態|Φ>和|ψ>中,運用Controlled-SWAP門和Hadamard門將兩個量子態的距離轉移到第一個控制比特上,可以通過計算得到:
其中為兩個量子態之間的距離,其線路圖如圖1所示。
通過上述量子最近中心算法可以對傳統K-means算法進行量子化改進,設計出如下的量子K-means算法:
輸入:樣本集D={x1,x2,…,xm},聚類個數K,量子K-means線路,迭代次數m。
過程:
1.從D中隨機選擇K個樣本作為初始質心{μ1,μ2,…,μk}
2.repeat m
3. 令Ci=Φ(i=1,2,…,k)
4. for j=1,2,…,m do
5. 將xj和聚類中心的特征壓縮后作為參數嵌入至量子K-means算法的U門;
6. 根據量子最近中心算法得到距離樣本j最近的質心,假設為μT;
7. 將xj劃入對應的類CT;
8. end for
9. for i=1,2,…,K do
10. 計算新的均值向量
11.end for
輸出:聚類C={C1,C2,…,Ck}
圖2展示了某個樣本i完整的量子K-means算法的線路圖。
量子K-means算法模型結果
基于IBM Quantum Experience量子計算實驗環境,量子K-means算法模型將744家支行網點聚為三類,根據質心結果可以得出,第0類支行為智能柜臺業務量大且設備維護情況良好的優異支行,第1類支行為智能柜臺業務量大但是維護情況欠佳的支行,第2類支行為智能柜臺業務量小而維護情況良好的支行。根據這三類支行情況,建議分別采取措施對網點智能設備進行優化,對于第1類支行可以加強人工維護頻率和及時性,而對于第2類支行可以進行設備裁撤。為說明量子K-means算法的有效性,將基于智能設備運營數據得到的量子K-means模型結果和經典K-means模型結果進行對比,如圖3所示。
從圖3可以看出,量子K-means結果為236家支行屬于第0類,251家支行為第1類,257家支行為第2類。表明量子K-means模型和經典K-means模型的聚類結果基本一致。為了驗證量子K-means模型的聚類結果有效性,圖4給出了量子K-means模型和經典K-means模型聚類結果的混淆矩陣。
從圖4可以看出,對于88%的樣本而言,量子K-means模型和經典K-means模型的聚類結果完全一致,這進一步說明使用量子線路轉化得到的量子態內積作為“距離”和經典的歐幾里得距離是等價的;同時,我們對剩余12%的聚類不一致樣本(91個)進行了專家經驗判斷,其中經典K-means模型與專家經驗有5/91的樣本保持一致,而量子K-means模型與專家經驗有68/91的樣本保持一致,因此以專家經驗為參照來看,量子K-means模型的準確性更高,同時這也展現了量子K-means算法模型的有效性,由此實證了量子K-means算法在無監督學習方面的優越性。
結語
本文針對銀行運營管理中的智能柜臺布局優化場景,運用前沿的量子K-means算法模型,給出聚類分析結果和資源配置優化建議方案,為商業銀行運營管理數字化轉型提供了科學的決策依據,符合數字經濟時代商業銀行數字化轉型的整體戰略要求。未來我們將進一步聚焦以量子技術優化傳統智能算法領域,并將算法深入應用在商業銀行風險管理、營銷管理等方面,擴大量子機器學習算法模型在銀行和金融領域的應用價值。
(本文合作作者有王濤、王彥博、張立偉、關杏元、項金根、史杰、徐奇、楊璇和高新凱,其中王彥博〔wangyanbo@lyzdfintech.com〕為本文通訊作者。)
(作者單位:華夏銀行股份有限公司,龍盈智達〔北京〕科技有限公司,
責任編輯:孫 爽