周尚頤博士(Christine Chow)
作為投資專家,我們使用主成分分析(PCA)來識別影響投資組合績效的關鍵風險因素。這是與其他技術(例如多因素風險分析或與主成分分析的混合組合)一起使用的傳統統計方法之一。在過去30年中,統計分析工具箱已大大擴展。現在,我們有了一個更吸引人的選擇,使用機器學習。我們通常稱之為人工智能(AI)。
若要使人工智能在投資分析中發揮作用,我們需要三個關鍵要素:
為什么要使用AI?了解您的問題。用戶必須了解他們試圖解決的問題,并為每個應用程序設定明確的目標。這是因為AI的核心是優化工作。
我們擁有什么,缺少什么?了解您的數據。找出可用的數據以及需要創建或編譯的數據。如果涉及非結構化數據,例如新聞提要或社交媒體帖子和視頻,則必須有一種清晰的方法將非結構化數據轉換為可用格式。某些任務(如同行基準測試)需要可比較的數據,這正是投資者現在迫切需要的。本文重點介紹了當前關于通用報告準則的爭論,并分享行業合作如何超越通用報告,為投資者創建可比可信數據的例子。
怎么做?了解您的算法。一旦獲得可信的相關數據,就可以在投資組合管理中應用合適的AI技術。目標可能是最大化關鍵績效指標(例如Sharpe比率或Information比率),或最小化風險指標(例如風險價值(VaR),標準差或跟蹤誤差)。人工智能可以用來構建具模仿全指數性能特征的增強型交易所買賣基金(ETF)。它也可以用于回測和方案分析。
并非所有的投資分析都可以利用AI,但是當使用AI時,我們必須首先了解我們要解決的問題并設定明確的應用目標。
例如,“發展業務”不是一個明確的目標,而是“優化銷售”。“評估董事會的有效性”不是一個明確的目標,但“最小化連鎖董事”卻是明確的目標。這是因為從根本上講,人工智能就是要使用Deisenroth,Faisal和Ong(2020)所著的《機器學習的數學》一書中(圖1)所述的一種或四種常用技術的組合來最大化目標函數:

圖1:人工智能中的關鍵優化技術

圖2:全面的公司報告
AI可以根據傾向得分找到適合客戶購買的投資基金,通過在正確的時間和正確的價格提供相關報價來最大化購買機會。這結合了行為科學和客戶細分。即使匿名了個人數據,我們與之互動的每個使用AI進行定位的業務也很可能將我們每個人都歸為特定客戶類型。亞馬遜(Amazon)或網飛(Netflix)等公司多年來已經在其他行業實施了上述做法,它們根據我們的個人資料、過去的購買情況和瀏覽歷史,推薦下一個購買項目或下一部最喜愛的電影。
有效的預測需要高質量的人工智能分析數據。數據是目前投資業面臨的最大挑戰。
在英國兩年一度的氣候與綠色金融監管論壇上,主題演講者提出的緊迫問題指出了“誤導的現實”,即公司信息(尤其是可持續性信息)趨向于不一致。對于財務信息,國際財務報告準則(IFRS)基金會和國際會計準則理事會(IASB)已經建立了描述公司財務業績和狀況的標準化方法,以便公司財務報表在國際范圍內易于理解和可比。但是,對于可持續性信息,公司可以選擇報告標準和評級,從而導致對綠色清洗和/或可持續發展目標(SDG)清洗的擔憂。
投資行業呼吁調整數據定義和報告標準。為此,世界經濟論壇(WEF)和影響管理項目(IMP)一直在與從業人員合作,以建立一個全面的報告系統。它發布了一個概念框架,以企業價值和與氣候相關的財務披露為例,將關鍵報告標準整合在一起,包括它們如何相互關聯(圖2)。
建立一個統一的報告系統正在進行中。但是,它僅解決了部分但不是全部挑戰。
影響報告可信度的深層次問題在于公司級數據的質量。這可能與遺留IT系統中的約束、全球運營中策略應用的不一致以及難以將某些業務活動歸類為確定的和獨占的存儲庫有關。例如,Adelphi和ISSESG的《歐洲可持續金融調查》以及歐洲銀行基金會(EBF)和UNEPFI的《測試歐盟分類法在核心銀行產品中的應用》等報告都提供了實例。
為特定目的標記數據存在操作挑戰。例如,銀行企業貸款系統往往按部門和行業建立,以適應關系經理團隊結構和專業知識。款項用于一般用途貸款或循環信貸并不一定能在系統得到分類。這些問題在EBF和UNEPFI報告中被認為是一些最重大的挑戰(請參閱報告第32頁和第36和39頁的林業案例)。當貸款在集團層面得到批準,資金被分配給多個當地法律實體時,這些挑戰就被放大了。
除了上述報告和數據系統問題外,投資者還受到更多非結構化數據的轟炸。根據Wikipedia的說法,非結構化數據是指沒有預定義數據模型或沒有以預定義方式組織的信息。它通常是文本密集型的,但也可能包含日期、數字和圖像等數據。
根據NBER的論文《機器傾聽時如何說話:人工智能時代的企業披露》(Howtotalkwhenamachineislistening:corporatedisclosureintheAgeofAI),年報越來越多地被機器閱讀,用于內容提取和情緒分析。它使用一種通用的人工智能技術,稱為自然語言處理(NLP)或自然語言理解(NLU)。在美國,從美國SECEDGAR數據庫下載的機器數量占所有下載量的比例,從2003年的39%增加到2016年的78%。考慮到近幾年人工智能驅動的網絡抓取活動的爆炸性增長,到2021年,這個數字很可能已經顯著增加。
數據和分析公司如埃信華邁(IHSMarkit)開發了一個ESG報告存儲庫平臺,由其AI引擎Goldfire提供支持,以組織非結構化數據,幫助公司改進報告并構建可持續發展概況。公司可以上傳自己的報告和用戶定義的資料。該平臺使用NLP將相關信息與報告標準(如GRI(全球報告倡議)、SASB(可持續性會計標準委員會)、TCFD(氣候相關財務披露工作組)和UNSDG)相協調。其DigitalGlobe衛星圖像服務可提供地理空間數據,以跟蹤土地使用情況、檢測森林砍伐情況以及監測能源管道狀況和傳輸。
投資者越來越多地使用地理空間數據,來實時或接近實時地監視被投資公司的業務績效,并提高供應鏈的透明度。保險公司將地理空間數據用于承保政策、定價以及理賠。平安保險使用NLP技術建立了“綠色清洗”指標,以了解公司氣候披露的廣度和深度,并將其與公司特征和財務績效聯系起來。TruevalesLab已創建工具和產品來幫助投資者發現隱藏的見解。使用數據和人工智能進行投資分析的復雜性只會增加。使用錨定或官方信息源,每周平均計算以篩選新聞峰值是抵抗錯誤信息風險的多種方法之一。
在數據爆炸的時代,決定什么是重要的,以及如何使用這些信息是至關重要的。投資者應該如何應對?采取基于行業的方法似乎是最明智的。
《波塞冬原則》于2019年6月18日在紐約發布,是金融部門和航運業之間達成的一項協議,旨在將國際海事組織(IMO)關于氣候變化的政策納入航運金融決策過程。公司必須遵循所有業務活動的技術指南,包括船型編碼系統、特定的碳強度度量標準(即航運業的年度效率比(AER))的計算,以及三種允許的脫碳路徑計算方法的選擇。簽署者,主要是銀行內的航運金融實體,僅依靠技術指南確定的數據類型、數據來源和服務提供者進行評估,以確定貸款決定。因此,數據和分析的“價值鏈”在公司和金融家之間是一致的。
氣候變化是一個全球性問題。令人放心的是,《波塞冬原則》的簽署國包括發達和新興經濟體的銀行——來自歐洲和亞洲。采用行業統一的方法可以使投資者將蘋果與蘋果進行比較,從而做出明智的投資決策。
可信數據是投資分析中有效應用AI程序的命脈,這僅僅是因為有據可查的“垃圾填埋”現象。一旦質量確保相關數據可用,就可以將合適的AI技術應用于投資組合管理。目標可能是最大化關鍵績效指標(例如Sharpe比率或Information比率),或最小化風險指標(例如風險價值(VaR),標準差或跟蹤誤差)。人工智能可以用來構建具有更少的模仿全指數性能特征的增強型交易所買賣基金(ETF)。它也可以用于回測和方案分析。此類應用程序的詳細信息可能需要單獨撰寫關于“數據與AI‘再造投資組合管理”的文章。
本文作者周尚頤博士(Christine Chow)是倫敦經濟學院(LSE)法院和投資委員會成員,國際公司治理網絡(ICGN)董事會成員,英國人工智能全黨議會小組(APPG)數據治理工作組成員,香港科學技術大學(2014—2016)的金融學兼職教授。本文中表達的觀點是個人觀點,不代表作者可能以專業或個人身份與之相關的個人、機構或組織的觀點,除非明確說明。