潘鐵軍,鄭蕾娜,劉 軍,郭 鳴,李兆健,劉曦冉
(1.寧波大紅鷹學(xué)院 信息工程學(xué)院,浙江 寧波 315175;2.浙江萬里學(xué)院 商學(xué)院,浙江 寧波 315100;3.南京財(cái)經(jīng)大學(xué) 管理科學(xué)與工程學(xué)院,江蘇 南京 210046;4.寧波沃德信息科技發(fā)展有限公司,浙江 寧波 315100)
隨著技術(shù)的不斷發(fā)展,新一代人工智能作為中國制造產(chǎn)業(yè)升級的戰(zhàn)略高地受到了國家的高度重視。以深度學(xué)習(xí)為代表的Alpha go戰(zhàn)勝了世界圍棋大師,這代表了新一代人工智能更加接近于人類智能。它如同當(dāng)年的互聯(lián)網(wǎng)技術(shù),正在向社會、產(chǎn)業(yè)的各個方面滲透,推動經(jīng)濟(jì)社會各領(lǐng)域從數(shù)字化、網(wǎng)絡(luò)化向智能化加速躍升,高校作為新一代人工智能人才的培養(yǎng)基地,人工智能應(yīng)該成為計(jì)算機(jī)類專業(yè)實(shí)踐教學(xué)的重點(diǎn),信息工程專業(yè)實(shí)踐教學(xué)改革正是要探索“AI+”背景下實(shí)踐教學(xué)的模式創(chuàng)新。
新一代人工智能技術(shù)以深度學(xué)習(xí)為代表。目前,比較著名的有Google的Tensor flow、加州伯克利分校的Caffe、蒙特利爾理工學(xué)院的Blocks和Keras,以及Facebook開源了大量Torch的深度學(xué)習(xí)模塊和擴(kuò)展[1]。國內(nèi)有百度深度學(xué)習(xí)平臺PaddlePaddle,易學(xué)易用的特點(diǎn)非常適合教學(xué)。從2017年開始,我國政策的重點(diǎn)已經(jīng)從人工智能技術(shù)轉(zhuǎn)向技術(shù)和產(chǎn)業(yè)的融合。2017年出臺的《新一代人工智能發(fā)展規(guī)劃》明確指出:必須加快人工智能深度應(yīng)用,培育壯大人工智能產(chǎn)業(yè),為我國經(jīng)濟(jì)發(fā)展注入新動能。分三步走:第一步,到2020年人工智能總體技術(shù)和應(yīng)用與世界先進(jìn)水平同步;第二步,到2025年人工智能基礎(chǔ)理論實(shí)現(xiàn)重大突破,部分技術(shù)與應(yīng)用達(dá)到世界領(lǐng)先水平;第三步,到2030年人工智能理論、技術(shù)與應(yīng)用總體達(dá)到世界領(lǐng)先水平,成為世界主要人工智能創(chuàng)新中心,智能經(jīng)濟(jì)、智能社會取得明顯成效,為躋身創(chuàng)新型國家前列和經(jīng)濟(jì)強(qiáng)國奠定重要基礎(chǔ)。這需要大量的新一代人工智能人才,高校人工智能教育責(zé)無旁貸。
為了將人工智能與實(shí)踐教學(xué)有機(jī)結(jié)合,筆者首先確定了以高素質(zhì)、應(yīng)用型人工智能人才為培養(yǎng)目標(biāo),立足滿足傳統(tǒng)行業(yè)產(chǎn)品創(chuàng)新和服務(wù)升級的“AI+產(chǎn)業(yè)”人才培養(yǎng)需求,通過教育部協(xié)同育人項(xiàng)目建立產(chǎn)學(xué)研實(shí)踐基地,準(zhǔn)確把握新一代人工智能人才需求規(guī)格,據(jù)此重構(gòu)信息工程實(shí)踐教學(xué)體系,引入量化金融等實(shí)踐內(nèi)容,重點(diǎn)培養(yǎng)學(xué)生的人工智能創(chuàng)新思維和創(chuàng)業(yè)能力,實(shí)現(xiàn)與產(chǎn)業(yè)的無縫銜接。
新一代人工智能人才的培養(yǎng)要著眼于深度學(xué)習(xí)、大數(shù)據(jù)和云計(jì)算等新一代信息技術(shù)的學(xué)習(xí)和應(yīng)用,以及雙創(chuàng)能力的培養(yǎng)。在教育理念上,將雙創(chuàng)活動與產(chǎn)學(xué)研活動有機(jī)融合來重構(gòu)教學(xué)大綱和實(shí)踐體系,涵蓋傳統(tǒng)信息系統(tǒng)改造升級、新一代人工智能產(chǎn)品、服務(wù)構(gòu)思和實(shí)現(xiàn)的全周期。人工智能教育理念的核心就是要以新一代人工智能技術(shù)進(jìn)行產(chǎn)品創(chuàng)新、系統(tǒng)集成以及商業(yè)模式的創(chuàng)新,因此,實(shí)踐課程要以新一代人工智能技術(shù)知識傳授為“點(diǎn)”,以傳統(tǒng)行業(yè)結(jié)構(gòu)調(diào)整、產(chǎn)品升級和模式創(chuàng)新為“線”,以新一代信息人工智能產(chǎn)業(yè)培育和發(fā)展為“面”,通過“點(diǎn)、線、面”一體化的人工智能項(xiàng)目貫穿整個信息工程實(shí)踐教學(xué)的實(shí)驗(yàn)、實(shí)訓(xùn)和實(shí)習(xí)過程。在項(xiàng)目構(gòu)思和設(shè)計(jì)階段采用可公開獲得的財(cái)經(jīng)、金融大數(shù)據(jù)作為信息源,然后以量化金融作為實(shí)踐教學(xué)的主要內(nèi)容和創(chuàng)新方法,在實(shí)施和運(yùn)行階段融入雙創(chuàng)活動培養(yǎng)學(xué)生的創(chuàng)新精神和創(chuàng)業(yè)意識,從而全面提高學(xué)生的工程實(shí)踐能力,即不僅包括個人的理論知識和專業(yè)技能,而且包括團(tuán)隊(duì)意識和創(chuàng)新創(chuàng)業(yè)素質(zhì)拓展[2]。

圖1 量化金融實(shí)訓(xùn)系統(tǒng)
筆者通過問卷調(diào)查、產(chǎn)業(yè)調(diào)研和頭腦風(fēng)暴方法,結(jié)合專業(yè)轉(zhuǎn)型的中、長期規(guī)劃,并根據(jù)大數(shù)據(jù)實(shí)驗(yàn)室建設(shè),確定了一系列人工智能項(xiàng)目作為突破口,其中比較有代表性的是“量化金融實(shí)訓(xùn)系統(tǒng)”(如圖1所示)。
本項(xiàng)目以浙江省大學(xué)生學(xué)科競賽為抓手,采用同花順Mindgo量化金融平臺和MQL智能交易平臺,結(jié)合優(yōu)礦、聚寬、米寬、易盛、金字塔、交易開拓者等主流量化金融人工智能社區(qū),開發(fā)金融、財(cái)經(jīng)等領(lǐng)域的人工智能算法、軟件和系統(tǒng),為證券市場的機(jī)構(gòu)投資者(公募、私募、券商、銀行、保險等)和個人專業(yè)投資者提供智能投研工具、智能投資平臺和智能投顧服務(wù)。
將人工智能針對不同課程的教學(xué)大綱分解成多層次的實(shí)驗(yàn)、實(shí)訓(xùn)、實(shí)習(xí)子項(xiàng)目,各子項(xiàng)目既相對獨(dú)立又互有關(guān)聯(lián),在實(shí)驗(yàn)、課程設(shè)計(jì)、畢業(yè)設(shè)計(jì)等課內(nèi)教學(xué)中反復(fù)引用,在實(shí)習(xí)、實(shí)訓(xùn)、助教、助研和學(xué)科競賽等課外活動中實(shí)現(xiàn)迭代開發(fā)。新一代人工智能理論知識結(jié)合產(chǎn)業(yè)發(fā)展的實(shí)踐不斷深化,全過程體現(xiàn)產(chǎn)學(xué)研相互促進(jìn)的連續(xù)性和有序發(fā)展。新一代人工智能知識學(xué)習(xí)采用先固化、再消化、后優(yōu)化三步走:首先學(xué)習(xí)經(jīng)典的人工智能算法和新興的深度學(xué)習(xí)理論,按照已有案例重復(fù)實(shí)驗(yàn)進(jìn)行驗(yàn)證,做到實(shí)驗(yàn)?zāi)J降墓袒蝗缓笙斯ぶ悄艿闹R,并根據(jù)當(dāng)前金融行情的變化搭建創(chuàng)新的模型以指導(dǎo)實(shí)踐,將知識轉(zhuǎn)化為能力;最終實(shí)現(xiàn)模型和策略的持續(xù)優(yōu)化。
以海龜智能交易系統(tǒng)為例,首先基于MQL在外匯平臺上進(jìn)行模型的驗(yàn)證,消化海龜模型的策略和特點(diǎn);然后將其用Python語言實(shí)現(xiàn)并移植到Mindgo量化金融平臺,在股票市場進(jìn)行進(jìn)一步驗(yàn)證,反復(fù)實(shí)踐;最后,基于SVM等機(jī)器學(xué)習(xí)傳統(tǒng)方法對模型進(jìn)行優(yōu)化。由于Mindgo對Tensor flow等新一代人工智能開發(fā)工具的支持有限,因此,借助zpline開源系統(tǒng)搭建平臺(WorldTrade)、接入聚寬JQData等,并基于深度學(xué)習(xí)模型對海龜模型進(jìn)行最終優(yōu)化。將優(yōu)化后的成果對接投資機(jī)構(gòu)和國內(nèi)外著名量化交易社區(qū)進(jìn)行產(chǎn)業(yè)化輸出。整個過程結(jié)合了畢業(yè)實(shí)習(xí)、畢業(yè)設(shè)計(jì)、學(xué)科競賽、課外學(xué)術(shù)活動、雙創(chuàng)活動和素質(zhì)拓展活動,給學(xué)生及時的學(xué)分反饋和成績評價,避免因長時間實(shí)踐的枯燥性而造成學(xué)生興趣的喪失。WorldTrade實(shí)訓(xùn)平臺如圖2所示。

圖2 WorldTrade實(shí)訓(xùn)平臺
1)以C語言為基礎(chǔ)底層接口。
C語言在程序算法運(yùn)行的速度上是有目共睹的,具有很大的優(yōu)勢,決定了金融量化交易系統(tǒng)的底層速度優(yōu)勢。
2)以 MATLAB 和Python為中層打造交易系統(tǒng)框架。
MATLAB是經(jīng)典的人工智能開發(fā)語言,開發(fā)者基于MATLAB 函數(shù)庫編寫了大量經(jīng)典模型,其穩(wěn)定性和可擴(kuò)展性決定了金融量化交易系統(tǒng)具有很強(qiáng)的靈活性。
Python是新一代人工智能的主流語言,人工智能包含常用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)兩個很重要的模塊,而Python擁有matplotlib、Numpy、sklearn、keras等大量的人工智能庫,pandas、sklearn、matplotlib可以做數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)建模和繪圖,基本上機(jī)器學(xué)習(xí)對數(shù)據(jù)的爬取(scrapy)、對數(shù)據(jù)的處理和分析(pandas)、對數(shù)據(jù)的繪圖(matplotlib)和對數(shù)據(jù)的建模(sklearn),在Python中都能找到對應(yīng)的庫來進(jìn)行處理。
3)以文本信號為基礎(chǔ)信號來源。
WorldTrade以文本信號為基礎(chǔ)信號源,決定了金融量化交易系統(tǒng)的可接入能夠生成文本信號的程序化交易平臺(包括交易開拓者、金字 塔、Multi Charts、Trade Satition、Magic Quant等),同時支持編程軟件Python、R、Vba、C#、C++、Java 外部鏈接等,還可以鏈接 Wind、Sina 、Yahoo 等財(cái)經(jīng)網(wǎng)站,保證了金融量化交易系統(tǒng)可以充分整合外界資源的優(yōu)勢。
4)系統(tǒng)操作界面。
WorldTrade金融量化交易系統(tǒng)的操作界面簡潔,主界面圖右邊為本金融量化交易系統(tǒng)的各項(xiàng)交易操作。該操作系統(tǒng)可實(shí)施批量操作以及實(shí)施股票賬戶風(fēng)險監(jiān)控。系統(tǒng)包括實(shí)時股票賬戶本地股票池,本地股票可以選擇手動代碼輸入,也可以選擇交易設(shè)置的批量導(dǎo)入。
5)基于大數(shù)據(jù)分析平臺。
WorldTrade采用Nutch來采集金融大數(shù)據(jù)。不同于 Google Crawler,Internet Archive Crawler,Nutch 是一個開源Java 實(shí)現(xiàn)的搜索引擎,它提供全文搜索和Web爬蟲,支持國內(nèi)外多種網(wǎng)頁類型的信息采集,性能穩(wěn)定,采集高效,能夠節(jié)省大量編程調(diào)試的時間。WorldTrade具有高度的可擴(kuò)展性,遵守Robots 協(xié)議,可以靈活地實(shí)現(xiàn)金融數(shù)據(jù)的抓取邏輯,從互聯(lián)網(wǎng)上抓取所需要的財(cái)經(jīng)數(shù)據(jù),并且支持各種底層數(shù)據(jù)存儲模型(包括HDFS、Mysql、Hbase 等)。
WorldTrade采用ElasticSearch提高金融信息的檢索性能。ElasticSearch是一個基于Lucene的搜索服務(wù)器,它提供了一個分布式多用戶能力的全文搜索引擎,基于RESTful web接口,是當(dāng)前流行的企業(yè)級搜索引擎,實(shí)時搜索穩(wěn)定、可靠、快速。當(dāng)索引量很大、搜索請求并發(fā)很高時,需要使用SolrCloud來滿足這些需求。SolrCloud是基于Solr和Zookeeper的分布式搜索方案,它的主要思想是使用Zookeeper作為SolrCloud集群的配置信息中心統(tǒng)一管理,具有大規(guī)模、容錯、分布式索引和檢索能力[2]。SolrCloud和ElasticSearch這兩個開源的分布式搜索方案均支持分布式、實(shí)時索引,通過http請求來獲得搜索結(jié)果,部署簡單、使用方便、性能強(qiáng)大,是當(dāng)前領(lǐng)先的數(shù)據(jù)索引方案,可以很好的滿足金融數(shù)據(jù)的檢索性能。
人工智能專業(yè)實(shí)踐教學(xué)改革的場景是真實(shí)的量化金融實(shí)驗(yàn)室體驗(yàn)項(xiàng)目,但目前基于CPU的實(shí)驗(yàn)箱的傳統(tǒng)教學(xué),無法滿足以GPU為核心的新一代人工智能技術(shù)日益發(fā)展的行業(yè)需要。為此,我們采用國際先進(jìn)的人工智能一體機(jī),面向金融、財(cái)經(jīng)數(shù)據(jù)等領(lǐng)域,以大數(shù)據(jù)分析為主要手段、以深度學(xué)習(xí)為突破口,基于Python、MQL和Matlab語言,將機(jī)器學(xué)習(xí)應(yīng)用到金融工程中。所選的軟硬件配置相對比較先進(jìn)(見表1)。

表1 軟硬件配置
量化金融實(shí)驗(yàn)室的建立,將有效彌補(bǔ)傳統(tǒng)實(shí)驗(yàn)室的不足。信息管理和信息系統(tǒng)方向有關(guān)傳統(tǒng)機(jī)器學(xué)習(xí)算法的驗(yàn)證性實(shí)驗(yàn)可在現(xiàn)有實(shí)驗(yàn)室進(jìn)行;基于新一代人工智能的大數(shù)據(jù)分析和應(yīng)用創(chuàng)新,可以分階段在量化金融實(shí)驗(yàn)室中實(shí)施。
經(jīng)過師生的共同努力,量化金融實(shí)訓(xùn)系統(tǒng)順利完成(如圖3所示),綜合運(yùn)用了新一代人工智能技術(shù)中的深度學(xué)習(xí)、云計(jì)算和大數(shù)據(jù)技術(shù),這不僅實(shí)現(xiàn)了與新一代信息技術(shù)產(chǎn)業(yè)的無縫對接,也大大促進(jìn)了學(xué)生的創(chuàng)新創(chuàng)業(yè)能力的培養(yǎng),激發(fā)了大學(xué)生的學(xué)習(xí)興趣和創(chuàng)業(yè)熱情。通過收益率排名、策略分析、實(shí)戰(zhàn)對抗等模式增加了實(shí)踐教學(xué)的趣味性和真實(shí)感。

圖3 量化金融實(shí)訓(xùn)系統(tǒng)
量化金融實(shí)訓(xùn)項(xiàng)目的綜合評分三大指標(biāo)包括業(yè)績指標(biāo)(40%)、風(fēng)險指標(biāo)(40%)和風(fēng)險收益指標(biāo)(20%):業(yè)績指標(biāo)評分標(biāo)準(zhǔn)包括累計(jì)收益率(30%)、成功率(10%);風(fēng)控指標(biāo)評分標(biāo)準(zhǔn)包括收益波動率(20%)、最大回撤(20%);風(fēng)險收益指標(biāo)評分標(biāo)準(zhǔn)包括Sharpe Ratio(20%)。
基于新一代人工智能的信息工程實(shí)踐教學(xué)改革的實(shí)踐,最初起源于學(xué)校財(cái)經(jīng)特色的打造和信息工程專業(yè)轉(zhuǎn)型升級的時代需求,后以學(xué)科競賽和雙創(chuàng)活動為抓手、以人工智能實(shí)驗(yàn)室建設(shè)為契機(jī),結(jié)合教育部協(xié)同育人項(xiàng)目,將新一代人工智能的實(shí)踐教學(xué)貫穿于實(shí)驗(yàn)、實(shí)習(xí)和實(shí)訓(xùn)中,應(yīng)用于智慧金融產(chǎn)業(yè)的創(chuàng)新驅(qū)動,也促進(jìn)了學(xué)生創(chuàng)新創(chuàng)業(yè)能力的提升。