趙莉華
摘要:信息技術在社會發展和社會科學研究領域有著重要意義和作用。信息技術借助大數據可以提高定量研究的效率和準確性,有助于減少重復工作、節約人力物力;進一步研究信息技術大數據在社會科學研究的實際應用,并針對河北省社會學研究存在的問題,列舉了五個具有代表性、實用性和學術性的大型數據庫,建議社會科學(特別是社會學)加強對技術輔助工具和學術數據庫的使用。
關鍵詞:信息技術 大數據 社科研究
中圖分類號:C12? 文獻標識碼:A? 文章編號:1009-5349(2019)24-0242-02
信息技術的迅猛進步,使社會學定量研究的研究方法、數據采集方法、數據分析方法等都發生了重大變化。以信息技術大數據為例,大數據分析不僅是社會學,也是整個社會科學文獻情報研究的一個重要組成部分和重要研究工具。如何發揮信息技術大數據在社會科學研究中的作用,特別是如何使用各類大型數據庫和專業分析工具,科學、高效地進行社會問題研究,預測重大社會問題,精準、有效地向黨和政府提供智庫建議,是社會科學研究工作者目前面對的一個課題。
一、信息技術能提升社會科學研究成果的數量與質量
第一,信息技術可以更迅速地捕捉社會發展與社會科學研究領域的熱點,社交平臺數據;不必通過問卷調查、深入座談、對照實驗等方法來研究人類的心理或行為,直接通過大數據便可以了解人的實踐行為,尋找行為呈現出的規律性或傾向性。大數據及時、快捷、客觀、高效、準確地給出“人群畫像”,是目前社會科學研究的最好工具。
第二,信息技術借助大數據可以提高定量研究的效率,同時提升準確性。傳統數據研究有很大的時滯性,信息技術大量在社會各領域的廣泛應用,使實時獲取相關數據、即時完成數據計算成為可能。比如,想了解某景點旅客入園后分散和集中狀況,用“百度定位數據”即可得到準確數據,不需要研究者組織調查小組去各景點做田野調查。又如,想調查某位受訪者某段時間的網絡消費行為(消費數額、消費習慣和消費結構等),通過支付平臺或電商后臺數據的“賬單”功能,即可得到準確、細致的數據,相比用“回憶+計算器”的原始方式計算,既準確又快捷。
第三,信息技術大數據有助于提高科研效率,減少重復工作,節約人力物力。比如,大型調查數據庫的使用,可以減少社科研究工作者的重復、同質化田野工作。數字圖書館和文獻平臺的應用,可幫助研究者較為全面、宏觀地分析同行研究成果、當前研究狀況、未來研究趨勢。過去的紙質出版物、期刊,汗牛充棟,造成不少重復研究、無效研究,既浪費研究者的時間和精力,也浪費國家的經費和物力。
第四,信息技術大數據應用,還可以預測重大社會問題。在社會科學研究中,人口社會學關注的生育率和老齡社會風險控制,發展社會學關注的城市化進程和農民工流動情況,均可以通過數據中隱藏的規律來揭示、預測。特別是2019年年初,習近平總書記指出我國目前面臨政治、經濟、社會等七大風險,這些風險在河北省都有不同程度的體現。全省社會風險的防范與化解工作,任務重、問題多、化解難。以重大社會風險的化解帶動其他各類風險的解決,離不開信息技術大數據及各類技術工具的應用。
二、信息技術大數據在社會科學研究的應用
第一,信息技術大數據在社會科學研究領域的重要意義。在社會科學研究領域,需有組織、有計劃、有系統地收集、整理和共享大量數據,而信息技術的迅速進步使得數據庫建設和運用邁上新臺階。數據庫容量大,且存儲安全,查詢方便、迅速等,為科研工作者特別是社會學研究者,提供了全面、豐富、多樣化、低成本的數據,由政府或高校主導建設的數據庫,可以利用數據共享的優點,有效彌補各地因科研技術水平不同帶來的差異性,使大家都能接受到更為科學、客觀、應用意義強的數據資源。
第二,信息技術大數據在社會科學研究領域的現實應用。信息技術的突飛猛進,在社會學領域有廣泛的用途,特別是社會輿情研判、社會綜合治理、社會風險防控,數據調查整理等方面。以社會輿情研判為例,一些技術工具的應用,在客觀上為黨和政府及時、準確、科學地了解社會事件,提供了技術和數據上的支持。以百度熱詞指數“石家莊疫苗”為例,可看到參與網民的明顯特點:熱點地域為河北(其中:河北占80%,其他地區占20%),人群主要為男性(男性占63%,女性占37%),參與人年齡主要在40—49歲(40—49歲占56%,其他年齡段共占44%)。由數據可以分析,“40—49歲河北省男性”是在網上參與圍觀“石家莊疫苗”事件的主要人群。今后,在社會突發事件中,通過信息技術準確定位參與事件的起因、走勢、參與主體及其特征,是解決事件、防范事件擴大化的基礎。
第三,社會學研究領域對大型數據庫重視不夠,應用不足。大型數據庫主要用于社會科學研究中的定量分析。從費孝通先生《江村經濟》出版以后,定量分析開始成為我國社會科學工作者科研工作的一大方法。特別是改革開放后,社會學學科的重建,使得定量分析在我國社會學研究領域迅速發展。但是,河北省社會學研究因為起步較晚、底子較弱,至今在定量分析應用方面,與國內先進同行相比還有明顯的差距。今后河北省社科研究者應加大對社會調查五大數據庫的使用。
一是全國人口普查數據庫(NPCC)。這是以中國政府統計部門歷次人口普查資料為基礎的全文數據庫和普查數據分析系統,是國家“十二五”規劃重點電子出版物項目“中國經濟社會發展統計分析數據庫”的重要組成部分。《中國人口普查數據庫》以原版全文和Excel數據兩種形式出版中國政府統計部門歷次人口普查資料,提供原版全文、Excel數據格式,并支持統計數據指標分析,其特點是全部普查資料可按省級行政區劃和普查年份分類。
二是中國社會狀況綜合調查(CSS)。這項調查始于2005年,由中國社會科學院社會學研究所發起;關注我國居民勞動就業、家庭、社會生活和社會態度等方面數據,對轉型期我國社會變遷研究提供了翔實而科學的數據資料,對社會科學研究和政府決策具有重要的意義。
三是中國家庭追蹤調查(CFPS)。這項調查由北京大學中國社會科學調查中心實施。從三個不同層次(個體層面、家庭層面和社區層面),關注我國社會、經濟、人口、教育和健康的變化,對研究我國的經濟民生、家庭結構、教育與健康、人口流動等多個主題均有重要幫助。
四是中國健康與養老追蹤調查(CHARLS)。由北京大學發起,針對我國正進入老齡化社會這一狀況,收集我國45歲及以上中老年人的微觀數據(含個人層面和家庭層面),這一數據庫對研究老年社會學、人口社會學等相關問題,具有重要的意義。
五是中國綜合社會調查(CGSS)。這項調查始于2003年,由中國人民大學發起,是我國最早的大型、綜合、連續的學術調查項目。2007年,CGSS項目組代表中國加入國際社會調查合作組織(ISSP),成為我國社會調查與國際交流、合作的橋梁。
這五個具有實用性、連續性的數據庫各有側重,特點突出,是社會科學研究的重要數據來源和技術輔助工具。
三、結論與建議
在大數據時代,社會科學研究者應充分、積極運用信息技術,更加深入、透徹、迅捷地了解社會學研究中的新動向、新趨勢、新方法和新結論,運用數據思維和定量研究方法來回答我省面臨的一些具體實踐問題,熟練推進大數據、人工智能等信息技術,結合社會學不同方向的專業研究,針對當前社會學研究的關鍵問題,提供數據、信息和計算方面的優勢,更好地輔助社會學研究的發展。
責任編輯:孫瑤