


作為人工智能在文本處理領域的最前沿技術,大語言模型歷史性地站在了時代的風口,并為金融行業帶來重大改變,未來還將繼續滲透金融工作者決策的方方面面,并幫助廣大投資者分析和理解金融市場。本文從大語言模型簡介、大語言模型對于金融行業的重要性、大語言模型在金融場景落地的前沿案例和大語言模型在金融場景落地的監管五個方面探討大語言模型在金融領域的應用前景。
2023年召開的中央金融工作會議提出做好科技金融、綠色金融、普惠金融、養老金融、數字金融五篇大文章,對數字金融高質量發展提出了新要求。為了取得突破,必須把握數字技術革命的契機,促進金融與數字技術的深度結合,努力提高金融服務對實體經濟的支持效率,加強全面性風險的防范措施,并持續滿足社會經濟進步及公眾對金融服務的期望,以加速推進金融強國的建設進程。
大語言模型作為人工智能在文本處理領域的最前沿的技術,歷史性地站在了時代的風口,正在對人類經濟社會發展帶來智能化浪潮的顛覆性猛烈沖擊。這類模型依托深度學習和大數據技術,具備了對人類語言的深入理解和生成能力,在內容生成、機器翻譯等多種應用場景存在巨大的發展潛力。金融業具備服務業的基本性質,存在大量的語言交流和文件處理需求,且金融行業時刻都在產生海量的金融數據,這使得金融業成為大語言模型的極佳應用場景。自2022年11月ChatGPT問世以來,金融業界對大語言模型給予了高度重視,各大金融機構加快大語言模型的部署以及應用落地,國內多家科研機構也先后推出經過金融語料微調的,更加適用于金融場景任務的金融大語言模型。大語言模型將助力金融業以及經濟發展,根據高盛研究團隊估計,大語言模型將在未來10年向全球經濟提供額外的1.2%左右的增長率。
將大語言模型深入應用于金融行業正是做好數字金融這篇大文章的重要實踐。但是目前中國大語言模型在金融行業的落地尚處于早期探索階段,很多金融企業都對大語言模型有著濃厚的興趣和希望,能直接轉換并應用到實際業務場景的并不多。因此,為了更好地促進大語言模型在金融領域的應用,本文詳細討論了哪些金融領域和金融場景適合大語言模型的落地,并給出了一些具體的實踐案例供讀者參考。具體而言,文本將從大語言模型簡介、大語言模型對于金融行業的重要性、大語言模型在金融場景落地的前沿案例和大語言模型在金融場景落地的監管五個方面進行深入分析和探討。
大語言模型簡介
大語言模型是一種能夠處理、理解和生成自然語言文本的機器學習模型,是以未標注文本作為訓練集的、經過自監督或半監督學習的深度神經網絡模型。這些模型通常基于Transformer架構,能夠捕捉文本數據中的語法、語義和上下文關系,從而實現對文本的高質量生成和理解。參數規模大、算力要求高是大語言模型的顯著特點,之所以消耗大量算力來應用如此大規模的模型,是因為模型的各項語言能力會在模型規模突破一定閾值之后,迎來飛躍式的增長。相比傳統的機器學習模型,大語言模型在處理另類數據時需要更少的人工數據清洗和標注工作,是處理非結構化數據的利器。在實際應用中,大語言模型被廣泛用于機器翻譯、文本生成、情感分析、問答系統等多個自然語言處理任務。它們不僅能夠理解人類語言的復雜性,還能生成富有創造性和邏輯性的文本,為人機交互和自動化處理提供了強大的工具。
政策方面,我國政府對人工智能和大語言模型的發展也給予了極大的重視。早在2017年,我國政府就發布了《新一代人工智能發展規劃》,明確提出了包括自然語言模型在內的多項人工智能技術發展的目標、路徑和政策措施。“十四五”期間,我國針對人工智能的未來發展陸續出臺了相關指導方案和激勵支撐政策。2023年3月,科技部等6部委發布《關于加快場景創新以人工智能高水平應用促進經濟高質量發展的指導意見》。意見指出,要以促進人工智能與實體經濟深度融合為主線,探索人工智能發展新模式新路徑,以人工智能高水平應用促進經濟高質量發展。2023年7月,中共中央政治局會議指出,要推動數字經濟與先進制造業、現代服務業深度融合,促進人工智能安全發展。同月,網信辦等7部委聯合發布《生成式人工智能服務管理暫行辦法》,鼓勵生成式人工智能技術在各行業、各領域的創新應用。政府對大語言模型高度重視,多項政策并舉,為我國大語言模型發展及其金融場景應用保駕護航。
大語言模型對于金融行業的重要性
大語言模型不僅可以處理海量的金融數據,還能夠從中提取出有價值的信息和見解,并自動生成相應的金融文本或金融決策。從智能客服到風險管理,再到市場分析和個性化服務,大語言模型都發揮著關鍵作用。它們幫助金融機構提高效率、降低風險、改善客戶體驗,同時為決策者提供更深入的市場洞察和決策支持。隨著技術的不斷進步,大語言模型將繼續在金融領域發揮重要作用,成為金融創新和數字化轉型的關鍵驅動力。
投資決策
首先,大語言模型能夠通過分析大量的新聞報道、財務報表和宏觀經濟數據,提供關于特定投資機會的深入見解和建議。例如,大語言模型可以自動化地搜索、抓取和分析全球范圍內的新聞報道,從而幫助投資者及時了解市場動態、行業發展趨勢和公司業績表現,為投資決策提供參考。其次,大語言模型可以深入分析公司的財務報表,評估公司的財務狀況、盈利能力和成長潛力,幫助投資者更全面地了解公司,并做出更明智的投資決策。此外,大語言模型還可以分析宏觀經濟數據,如國家的經濟增長率、通貨膨脹率、利率水平等,從而幫助投資者更好地把握市場趨勢和風險。
風險評估
在金融領域,大語言模型也廣泛應用于風險評估,幫助金融機構更準確地評估潛在的風險。首先,大語言模型可以通過分析個體或企業的信用歷史、財務狀況等數據,來評估其信用風險,幫助金融機構更好地管理借款人的信用風險。其次,大語言模型還可以分析市場數據和宏觀經濟指標,識別出市場波動的趨勢和規律,幫助投資者更好地理解市場的風險情況,并做出相應的投資決策。此外,大語言模型還可以分析歷史數據并建立模型,來預測信貸違約的可能性。通過對大量的歷史數據進行學習和訓練,它可以識別出導致違約的主要因素,并預測未來可能出現的違約情況,為金融機構提供預警和風險管理建議。
市場分析
首先,大語言模型可以利用其強大的自然語言處理能力,分析包括新聞、社交媒體在內的各種信息源,以捕捉市場情緒和趨勢,從而幫助交易員和研究者做出更明智的決策。例如,大語言模型可以自動抓取、解析和理解大量的新聞文章,以識別出與市場相關的重要信息和事件。其次,大語言模型還可以監測社交媒體平臺上的討論和評論,從而感知市場參與者的情緒波動和輿論傾向。此外,大語言模型還可以結合其他信息源,如財務報表、行業研究報告等,進行綜合分析,為交易員和研究者提供更全面、更深入的市場洞察。
文檔處理
大語言模型可以利用其自然語言處理和理解能力,自動化處理各種金融合同、報告和其他文檔,從而提高工作效率并減少錯誤。例如,它可以自動識別合同中的條款和條件,提取報告中的數據和指標,從而減少人工處理文檔的時間和成本。此外,大語言模型還可以利用自然語言生成技術,自動生成金融報告、摘要和其他文檔,從而提高文件生成效率和質量。
自動化客戶服務
首先,大語言模型通過利用其自然語言理解和生成能力,以用于構建智能虛擬助手和自動化客戶服務機器人,以回答客戶的常見問題,執行基本的交易操作,并提供金融建議。例如HN16ROxPjqGW+uL1GNlheA==,當客戶在網站或應用程序上輸入問題時,大語言模型可以自動識別并理解這些問題,從而為客戶提供相應的回答或解決方案。其次,大語言模型還可以與金融系統集成,執行基本的交易操作。例如,當客戶需要轉賬、支付賬單或查詢交易狀態時,大語言模型可以自動與金融系統進行交互,并執行相應的操作,從而實現自動化的客戶服務。最后,大語言模型還可以提供個性化的金融建議。通過分析客戶的賬戶信息、交易歷史和投資偏好,大語言模型可以為客戶提供定制化的投資建議,幫助他們做出更明智的金融決策。
輿情分析
通過對新聞和社交媒體內容進行情感分析,大語言模型可以幫助管理機構和研究者跟蹤熱點事件的輿論走向,從而更好地了解公眾對特定事件或話題的態度和情緒。首先,大語言模型可以分析社交媒體上的內容和評論,以獲取公眾對特定事件的即時反饋和情緒表達,識別出熱點話題和關注度較高的事件。其次,大語言模型可以分析新聞報道中的情感傾向,如正面、負面或中立,從而幫助管理機構和研究者更準確地把握輿論傾向。(見表1)
大語言模型在金融場景落地的前沿案例
捕捉市場情緒
大語言模型通過對實時新聞和社交媒體的分析,可以迅速捕捉到市場的情緒變化和潛在的市場動態,從而預測可能的市場波動。例如,當某公司發布了重大新聞或政策變動,模型可以根據新聞公告文本,迅速分析相關報道的正面/負面情緒,為投資者提供即時的市場趨勢預測。
具體而言,大語言模型能夠快速、全面地分析文本內容,把非結構化的文本數據轉化為向量表示的若干特征。相比傳統的自然語言處理方法,大語言模型更好地結合語境編碼詞向量,充分捕捉語義和情感信息。由此形成的結構化數據,顯著地根據語義聚集為不同類別,進而開展的情感分類,其準確程度大大提高。芝加哥大學修大成教授的研究團隊利用多個大語言模型分析了全球上市公司的新聞文本,其情感分析的準確率已經足以構建一個有相當盈利能力的投資策略。團隊指出,大語言模型能準確捕捉新聞中有情感傾向的關鍵詞,基于大語言模型的投資策略取得了優異的投資回報,在美股2004—2019年可達到49%的年化收益。清華大學五道口金融學院的張曉燕教授團隊將國內外大語言模型應用在A股上市公司新聞中,在A股市場上,大語言模型得出了較高的情感分析準確率以及優異的投資表現。(見圖1)
宏觀經濟預測
2023年4月,Joseph Lupton等摩根大通經濟學家運用基于ChatGPT的語言模型來檢測政策信號的期限,運用美聯儲過去的25年來發布的歷次聲明和官員講話數據微調模型,并建立“鷹-鴿”指數對政策信號進行了從寬松到緊縮的評級。其中,鷹派通常傾向于更嚴格的貨幣政策,包括提高利率,以控制通脹和穩定經濟。相反,鴿派更傾向于寬松的貨幣政策,保持低利率以刺激經濟增長和就業。“鷹-鴿”指數通過深入分析美聯儲官員的言論、聲明、投票記錄和其他公開可獲得的數據,為每位官員分配一個數值評分。“鷹-鴿”指數反映了美聯儲官員在貨幣政策上的立場,從而幫助投資者、經濟學家和政策制定者更好地理解美聯儲的政策走向和未來可能的經濟影響。研究者將各國先行一周的“鷹-鴿”指數與該國一年期國債利率的變化率進行回歸,在美國、歐盟、英國均取得了顯著的t值(15.5, 13.4, 7.6)。回歸系數表明,“鷹-鴿”指數上升10分,預示一周后的美國一年期國債利率上升14bp,歐洲央行一年期國債利率上升12bp,英國一年期國債利率上升12bp。(見圖2)
大語言模型在金融場景落地的監管
數據安全問題與應對
金融領域大語言模型的輸出存在數據安全隱患。在推介風險產品時,并應充分披露決策信息和產品風險。面向投資者,模型輸出應確保遵守相關金融法規和指導原則,如不發布誤導性投資建議,不進行違規的股票推薦等,確保投資者權益。此外,大語言模型的輸出內容還應公平合規,不包含任何偏見,避免涉及用戶隱私。大語言模型的訓練數據集中經常包含大量互聯網數據,而此前在互聯網上泄露的個人信息隨之進入大模型。大語言模型的使用者可以通過特定的提問方式,誘導大模型透露隱私數據,表現出對社會少數群體的偏見和歧視。模型的輸出質量取決于訓練數據集的質量。應當不斷提升訓練數據語料的安全性,排除有毒語料和不當內容;不斷增強訓練數據的代表性,使用平衡和多元化的數據集。
我國已經針對上述問題初步形成監管辦法。2023年7月,網信辦等7部委發布《生成式人工智能服務管理暫行辦法》(以下簡稱《辦法》)。《辦法》強調要在使用生成式人工智能的過程中,尊重知識產權、商業道德,保守商業秘密,不得利用算法、數據、平臺等優勢,實施壟斷和不正當競爭行為;保護他人知識產權、肖像權、名譽權、榮譽權、隱私權、個人信息權益等合法權益。
模型安全問題與應對
大語言模型面臨透明度低的模型安全問題。大數據模型的“黑箱”特性導致其解釋性不足。提高金融領域大語言模型的透明度和可解釋性,是金融工作者和大語言模型有效交互的前提。金融市場有多樣的影響因素和復雜的運作機制,當需要大語言模型直接給出金融決策時,大語言模型應當能夠展示清晰明確的決策邏輯和準確的決策信息,這對大語言模型的透明度提出了更高要求。《辦法》規定:“基于服務類型特點,采取有效措施,提升生成式人工智能服務的透明度,提高生成內容的準確性和可靠性。”
針對大語言模型透明度的問題,學界與業界正在嘗試多種解決方法。例如,通過設計問題鏈來引導大語言模型進行逐步推理,形成完整的推理過程;通過參數可視化理解大語言模型的注意力機制;通過模型蒸餾理解模型各個部分捕捉了哪些規律等。
大語言模型監管的國際經驗
美國總統拜登于2023年10月30日簽署的行政命令,確立了人工智能安全的新標準,標志著拜登政府在對人工智能技術的管理方面采取的第一項具有約束力的重大行動。這一行政令要求共享模型的安全測試結果和關鍵信息,完善模型標準和測試工具,制定嚴格的合成生物學檢查標準,建立人工智能生成內容檢測標準,建立先進的網絡安全計劃,研發制定關于人工智能與安全的國家安全備忘錄。這一行政令的實施,反映出美國政府對于人工智能技術發展速度和影響范圍的重視,同時也顯示了在確保技術進步的同時維護國家安全和公共利益的決心。通過這些措施,美國政府旨在推動人工智能技術的健康發展,確保技術進步在不損害公眾利益和國家安全的基礎上進行。
歐盟同樣注重大語言模型發展的安全性和合規性。歐盟人工智能法案(EU AI Act)由歐盟委員會于2021年4月提出,旨在為歐盟范圍內的人工智能(AI)使用制定法律框架。該法案致力于在所有行業(軍事應用除外)中為AI創造共同的法律環境。法案采用基于風險的方法,根據AI系統對人權和價值觀的潛在影響對其進行分類和監管。在2023年12月9日,歐洲議會與歐盟理事會就歐盟人工智能法案的最終版本達成一致。這標志著世界上首個全面的人工智能法律框架的誕生。歐洲AI法案基于風險對模型進行分類,對于不同類別的模型施以禁止、上市前評估審核、透明度要求審核等措施,并對不合規行為引入重罰。
好的監管框架有利于保護公民權利、推動技術創新、確保技術安全,甚至引領全球技術標準。參考大語言模型的國際監管經驗,我國也應指定更加細致、健全的大語言模型監管體系,確保大語言模型的健康、安全、高質量發展,推動大語言模型成為下一個經濟增長點,持續激發經濟增長活力。
大語言模型在金融領域的應用場景廣闊
大語言模型已經為金融行業帶來重大改變,未來還將繼續滲透金融工作者決策的方方面面,并幫助廣大投資者分析和理解金融市場。當前,大語言模型正向多模態、領域化、小型化等多個方向發展,將在另類數據處理、金融特定領域應用以及可得化、易用化等方面有進一步提升。持續發展大語言模型應用,加強大語言模型監管,引導金融大語言模型開發,中國金融市場將能在數字化、智能化方向得到更大的進步,為廣大投資者帶來福祉。
(張曉燕為清華大學五道口金融學院副院長、金融學講席教授,吳輝航為清華大學五道口金融學院博士后。責任編輯/周茗一)