□ 武光磊
信息存儲技術和分析技術正以驚人的速度發展,技術的高速進步使實時數據也多以“加速度”的方式呈現在人們眼前。如何充分挖掘和利用這些“轉瞬即逝”的實時數據不僅是數據分析家應該正視的問題,也已成為當今“大數據”時代的研究熱點。因此,急需一種可以結合行業背景的分析方法,“因地制宜”地為提煉海量數據中有用信息而提供具體理論工具。高頻數據統計分析正好可以實現這個目的。
當前,高頻數據廣泛應用于金融、環境等眾多領域里,為金融風險管理、環境監測等多方面提供了指導和預測。南京審計大學教授孔新兵在這一領域里已研究多年,積累了豐富的經驗,他始終認為做科研就要做最前沿的,解決實際問題,還要使成果獲得廣泛應用,高頻數據正是這樣吸引著他不斷前進的。
在金融領域里,每秒鐘都會進行大量交易,利用高頻數據對其觀察,記錄頻率可達到秒級。而在環境領域里,想要對設備中的化學含量進行實時監測,利用高頻數據,觀察頻率同樣可達到秒級。超快的速度加上獨具一格的高維度、模型跳躍結構復雜等特性,高頻數據以其獨有的魅力吸引著孔新兵的研究目光。
但隨著研究的加深,孔新兵發現數據維數和記錄頻率的爆發式增長,暴露了大面板高頻數據在理論與實際應用中存在的許多問題。近年來他對存在的問題展開系統研究,并取得了多項重要成果。

孔新兵
其中,他首次建立了高維近因子模型因子收益序列和殘差序列的經驗過程理論。他還巧妙地利用高頻數據的高峰厚尾這一特點,成功給出識別純跳伊藤半鞅過程模型的方法,在一定技術假設下成功解決了檢驗功效較低的缺點,成果發表在統計學頂級雜志Annals of Statistics上。
緊接著,孔新兵很快發現盡管檢驗效率有所提高,但檢驗統計量在原假設下的收斂速度還需改進,為此他利用經驗特征函數法成功構造出一種新的檢驗統計量,使在原價設下的速度由原來的n?增加到n?,達到了最優的收斂速度。
此外,孔新兵在國際上首次開展了針對具有時變因子荷載結構的連續時間因子模型的研究,他在其中首次引入了適用于大面板高頻數據的局部主成分分析方法,成功得到具有時變因子荷載結構的連續時間因子模型的因子個數的相合估計。同時還進一步證明了在估計因子個數時與不變因子荷載矩陣這兩種情形下,無論是使用全局主成分分析方法還是經過整合的局部主成分方法,都具有同樣的收斂速度。
與此同時,他在局部主成分分析整合法的基礎上,分別給出了單個資產的系統積分波動率和個體積分波動率的相合估計及其收斂速度,然后在時變因子荷載矩陣的框架下給出了個體積分波動率矩陣及其逆矩陣的相合估計和譜范數意義下的收斂速度。
如今,在高維高頻數據統計分析方向上,孔新兵已成為國內重要的主要研究力量之一。科研之余,他還時刻不忘加強學術交流與合作,并將知識傳遞給更多的人。
孔新兵已受邀參加第十二屆中國數學會年會、第十屆中國概率統計年會、IMS-China統計會議等多個學術會議,同時多次開展國際學術交流和訪問,與悉尼大學、新加坡國立大學等高校建立了廣泛的聯系與合作。
在教學上,孔新兵一直主張以學生為主體,激發學生學習興趣,并培養學生善于表達自己見解的習慣。同時,他一方面注重夯實學生的理論基礎,另一方面也時刻兼顧培養學生的創新和動手能力。
生有涯而學無涯。過去的榮譽是認可、是鼓勵,也是動力。面向未來,孔新兵會和團隊共同攜手向前,積極揭開高頻數據中的一個個難題。