介紹智能代碼大模型的發展歷程和代碼編程輔助演進變化,以及當前智能代碼大模型金融領域應用實踐,根據智能代碼大模型在金融領域的挑戰提出政策建議
智能代碼大模型發展歷程與代碼編程輔助演進
發展歷程
自2015年起,AI模型就已被應用在編程開發場景;2023年初,軟件行業大模型覆蓋度僅有約10%,隨著ChatGPT等大模型的發展,2023年底這個覆蓋度已達到約70%;目前智能代碼大模型在軟件開發場景的平均提效幅度約為30%,從AI參與的維度來看,剛剛進入L3級別,預計2025年底提效幅度將達到90%以上。
代碼編程輔助演進
2021年6月29日之前,智能代碼輔助工具處于1.0時代,作為簡單的代碼提效工具,主要面向開發人員,提效幅度有限;2021年6月至2024年4月進入2.0時代,以Github Copilot為代表的基于大語言模型的編碼輔助,能夠續寫代碼、提供技術問答等,但仍需較多人工干預;2024年4月至今來到2.5時代,已實現全面編程輔助,以Devin為代表的多智能體軟件工程師,能夠自我協同完成部分開發任務,但仍未完全替代開發團隊;預測到2025年底將實現全流程業務代碼生成,多模態、多智能體的大模型將覆蓋項目級開發,大幅提升開發效率。
智能代碼大模型金融領域應用實踐
當前,銀行、基金、私募基金、投行、證券公司都已開始使用智能編程工具。同花順也已自研代碼大模型,并應用在整個公司的開發流程中,目前使用人數超1100人,已占公司有效開發人數的60%左右,每月超過30萬行代碼由AI生成并上線,每月超三分之一的代碼由大模型生成,其中全流程金融業務代碼的生成能夠提升至少60%的研發效率。
智能代碼大模型在金融領域挑戰及政策建議
代碼大模型在金融領域的挑戰
一是高質量金融項目、架構、文檔、代碼數據獲取難度高,數量少;二是金融領域對結果精度要求高,但大模型對項目、架構的理解和生成能力較差;三是對使用人員綜合能力要求更高,需要既是開發專家又是金融業務專家,并且懂產品和設計;四是對開發團隊要求更高,需沉淀標準化業務代碼組件;五是對大模型的能力全面性要求更高,包括金融業務知識、取數能力、計算能力、金融邏輯推理能力等。
代碼大模型在金融領域的政策建議
一是引導行業數據合作,促進機構間市場公開金融數據的流通共享;二是加大金融領域大模型的算力扶持力度,在所有垂直行業中,金融數據及相關代碼數據體量大,獲取難度較大;三是針對垂直領域大模型快速發展對該領域造成的潛在影響進行提前干預和引導;四是關注特定垂直領域大模型的安全、信創。
(作者系浙江核新同花順網絡信息股份有限公司首席專家,本文由浙江數字經濟百人會供稿。)