陳陽
[內容提要]社會經濟發展帶來了頻繁的社會流動,以及與流動人口相關的社會治理問題。而隨著大數據時代的到來,流動人口在社會治理研究的方法和方式上也必然發生改變。因此,有必要從大數據本身的數據特質出發,討論其對流動人口社會治理的影響及其拓展。
[關鍵詞] 大數據 流動人口 社會治理研究
一、大數據對流動人口社會治理的影響
自1989年KDD(數據庫的知識發現)概念被提出以來,大數據概念便成為了科學界追捧的寵兒。作為一種區別于傳統小型數據類型的數據集合體,大數據在概念的內涵和外延上都對傳統數據有所拓展和延伸。區別于傳統抽樣調查獲得的數據,大數據具有公認的SV特性。即Volumn(大量)、Velocity(高速)、Variety(多樣)、Value(價值)、Veracity(真實)。這五個特點在與流動人口的社會治理關聯時,也顯著地影響了流動人口的社會治理,使新時代流動人口的社會治理發生三方面的改變。
1.能夠獲取更大規模的數據,使研究者不再依靠樣本參數來推斷總體特征。傳統流動人口社會治理較多使用抽樣調查獲得數據,并以此推斷總體的特征分市,但獲得的數據量非常有限。而大數據在數據收集的渠道上則更加多元和現代。除了國家數據庫之外,企業數據、物聯網數據以及個人數據等都能成為大數據的來源。特別是隨著手機等智能終端設備的流行,越來越多的和流動人口治理相關的數據,開始基于云計算平臺進行匯總,成為超越所有傳統流動人口社會治理模式中的數據集合體。而大規模數據的集合,將使研究者不再僅通過樣本參數來推斷總體特征。用一個比喻來形容就是大數據的使用可以使研究者不再“只見樹木,不見森林”,而是直接從洞悉森林的整體局勢進行統籌規劃。同時,大數據也使得研究者能夠隨時從全局視角出發,審視某些特殊地區或個體所面臨的問題。
2.能使研究者的反應更迅捷,并協助研究者對數據進行更智能的分析與判斷。如在運用智能手機進行流動人口的數據收集時,可以通過移動網絡即時地將數據上傳到“云端”。只要移動網絡暢通,數據便可以立刻完成從獲取到保存的全過程。同時,在云端還可以部署數據處理代碼,在保存完畢之后立刻調用程序對數據計算分析。如在收集流動人口的收入時,為了收集方便,將直接以“元”作為單位,對流動人口的具體收入進行輸入。這種數據收集方法雖然精確,但是卻不利于整理。而利用強大的云平臺計算能力,將可以即時地根據輸入的具體收入數據進行分類。如將月收入3000元以下的設定為第一檔,將3001- 5000元設定為第二檔,將5001- 8000元設為第三檔,將8000元及以上的設定為第四檔。通過這樣的方式將加快流動人群社會治理相關數據的收集和轉換。
3.能容納多元的數據格式于一體,進而對流動人口社會治理相關問題的分析更加立體、真實。傳統流動人口社會治理多使用定量化的數值數據,并運用統計學進行推斷分析。而流動人口社會治理所涉及到的大數據不僅在容量層面上有所拓展,其格式也更是“有容納大,百花齊放”。除了傳統的數值型數據和文本型數據之外,流動人口社會治理相關的大數據還包含了諸如GPS位置、語音視頻多媒體文件等多元格式的數據或文件。這些多元格式的文件使得流動人口的社會治理問題研究變得更加真實和立體,在研究過程中可以隨時根據數據、聲音和影像更加真實地還原問題的本源特質,進而得出更加具體和翔實的結論及解決方案。
二、大數據對流動人口社會治理研究的拓展
1.大數據拓展流動人口社會治理的理論框架。隨著時代進步,越來越多的知識開始交叉并融。借助大數據,流動人口的社會治理將能夠完成對群體社會組織等資訊信息的收集,并充分地利用計算機模擬“演化科學解決現實世界的問題”。計算數據科學將在“機器學習”的幫助上,進一步拓展流動人口社會治理的研究范疇和疆域。此外,隨著云計算技術的日漸流行,流動人口社會治理也必然將采用全新的數據收集、整合及處理邏輯。而隨著人工智能熱度的日漸高漲,流動人口的社會治理也必然與其融合,凝集人類經驗和人工智能雙效能量。從目前發展的態勢來看,最可能實現的便是基于集人工專家經驗理論和人工智能迅捷判斷于一身的全新智庫系統。其可以有效地利用人工智能收集和流動人口社會治理相關的任何數據,并針對特定社會情境或問題進行趨勢分析與判斷,協助決策者作出有效的判斷,并及時地提出問題的解決方案。
2.大數據成為傳統流動人口社會治理問題的有效補充,提升了傳統研究的生命力。雖然大數據拓展了傳統流動人口社會治理的研究范疇和疆域,但是不能忽視大數據因其天生的缺陷很難以完全取代傳統的流動人口社會治理研究。一是大數據的數據收集方式使其對普通研究者并不是很友好。由于大數據收集起來既費時又費事,很難讓個人研究者或團隊執行,因此現在的大數據收集工作往往由政府或較大的科技公司主導,導致了個人研究者難以直接獲取到所需要的大數據。二是大數據涉及的方面較廣泛,很有可能會觸及個人隱私。當個人隱私和學術研究沖突的時候,將涉及學術倫理道德問題。對于何時使用大數據進行研究不違反倫理道德,目前還沒有明確的標準界限。所以,這必然為實際操作帶來困難。三是大數據存在“噪音”問題,這將使基于大數據研究的信效度受到質疑。由此可見,大數據雖然明顯提升了流動人群社會治理研究的范式和疆域,但不可否認它現在仍不能夠完全地取代傳統調研方法。只有將傳統研究方法和大數據研究方法合二為一時,才能有效地保證流動人口社會治理呈現出更強悍的生命力。
3.大數據拓展了流動人口社會治理的研究工具集合。大數據對流動人口社會治理的影響,不僅促使研究疆域和研究領域發生改變。同時,也在研究工具的層面有所豐富。原來,流動人口的社會治理研究更多使用單機版的SPSS作為主要的數據分析工具進行統計分析。但是,這類統計軟件往往適用于抽樣調查所獲得的不多于10萬條左右的數據集合。而當該類軟件一旦遭遇到超過10萬條以上的數據時,便會捉襟見肘,無法順暢地運行。于是,一些基于計算機分布式理念設計的大數據處理框架自然地被引入到了流動人口的社會治理研究中來。如廣為人知的Python語言在處理大數據時便會讓研究者更得心應手,并在很多方面有取代SPSS成為學術統計標準的可能。同時,隨著使用大數據工具人數的增多,一些python的開源包也應運而生。這些開源包由于目標是解決諸如流動人口社會治理等特定社會問題,因此它們在編寫的過程中必然由計算機專家和社會學家通力合作完成,隨著大數據技術不斷地進入流動人口的社會治理中,社會科學的研究者也必將為開源作出貢獻。