顧蕾蕾,張鑫鑫,李 柯,劉 靜,賈國柱
隨著彩票在中國的不斷普及,人們對其投資的熱情越來越高。其中獎率一般為幾百萬分之一[1]。部分沒有中獎的人會產生一些心理上的變化,這些變化可能會造成自身已有疾病的發作或者新疾病的誕生。例如:自殺、焦慮癥、精神分裂癥等。因此,檢驗彩票與心理疾病之間的長短期相關性是一個有意義的課題。
網絡搜索已經成為有關集體健康趨勢的寶貴信息來源[2]。中國最大的搜索引擎“百度”使用統計平臺 (百度索引)為許多關鍵字的搜索信息建立索引。它已成為問題研究的重要輔助工具。在經濟學中,它有效地衡量了投資者的關注度[3]。在流行病中,它監測并警示了AIDS和手足口等疾病的傳播。
結合多重分形去趨勢波動分析和去趨勢互相關分析,Zhou提出了多重分形去勢互相關分析法(MF-DCCA)[4]。它常常被用來分析時間序列之間的互相關性[5]。在本文中,百度指數被用來代替疾病的數值,我們使用MF-DCCA定量地分析了彩票與心理疾病間的互相關性和多重分形特征。
通過Python爬蟲從百度指數平臺(http://index.baidu.com/)搜集數據。數據的年限為2016年1月至2019年4月,單個長度為1 216。總體上,相比較于2017年和2018年,2016年的彩票搜索指數更高。在整個區間內,焦慮癥和自殺的指數值也遠遠高于其它疾病。
MF-DCCA常常被用來探索兩個時間序列的互相關性和多重分形特征。它首先將兩列數據構造成兩個新數據列,并生成長度為s的Ns個數據塊。在進行去趨勢處理后,使用Lambda法則得到F0(s),并轉化為冪律相關性(Log-log)。通過OLS回歸,q=2時對應為狹義Hurst指數。在Renyi指數被計算后,Legendre變換將得到奇異譜函數[5]。
互相關統計量Qcc(m)被用來檢測彩票和心理疾病之間的互相關性[5]。如果兩個序列之間不存在互相關性,統計量將會沿著卡方分布的標準值變化。如圖1所示,它在5%顯著性水平下的臨界值由黑色虛線表示,自由度m為0到300。隨著m的增加,六條線都高于虛線,這表明任意兩個時間序列間均具有顯著的互相關性。

圖1 心理疾病與彩票間的交叉相關性檢驗
參數設置為8S*時不同疾病的廣義Hurst指數。當q=2時,狹義Hurst指數被展示在表1中。
短期的互相關行為主要被外部力量影響,而長期的主要與其內在因素有關。當SS*,心理疾病與彩票之間的Hurst指數都大于0.829,其中精神分裂癥的最大值為0.973,呈現出最強的持續性特征。自殺的分形程度最大,為0.768。當二者進行對比時,我們發現長期下的Hurst指數總要高于短期,6個序列與彩票之間具有更加明顯的長程正相關性。

表1 各疾病與彩票間的Hurst指數、多重分形度( ?h)和分形譜寬度( α?)
多重分形的大小如表1所示。除焦慮癥和狂躁癥外,短期內的心理疾病與彩票間的分形譜寬度值較長期內更低,分形能力較弱。特別地,短期內的焦慮癥和長期內的自殺與彩票間互相關性的分形能力最強。
進一步,為了獲得彩票與各個指數間互相關性的每日動態變化,采用了滾動窗口的方法。它被廣泛用于探索動態特征,檢查外部沖擊的影響和預測趨勢。我們以年的倍數為窗口尺寸探索了一年和兩年窗口大小下的互相關性演變趨勢。步長均設置為1天。結果如圖2,隨著窗口大小的擴大,不同疾病與彩票間展示出了不同的互相關性特征。特別地,自殺與彩票間持續的互相關性逐漸顯著,在兩年時,該特征在所有時間內普遍明顯。
在本文中,我們運用多重分形去趨勢互相關(MF-DCCA)和滾動窗口定量地調查了心理疾病和彩票之間的動態關系。由此得出了以下結論。
1)心理疾病與彩票之間呈現出較為明顯的持續互相關性。內部因素的影響遠遠高于外部力量;
2)這種互相關性是多重分形的。短期內的焦慮癥和長期內的自殺與彩票間互相關性的分形特征最顯著;
3)不同窗口大小下的滾動窗口展現的互相關趨勢不同;
4)彩票可以作為影響心理疾病產生的來源之一。
各疾病與彩票間的關系受到各種因素的影響,且他們可能在一定時期內強化或抵消。本研究忽略了疾病對彩票的較小影響,這將在下一步工作進行探索。

圖2 以年總天數為窗口大小下的心理疾病與彩票間的滑動窗口圖