游桃琴
(江西省地方志編纂委員會辦公室 江西 南昌 330008)
21世紀以來,信息技術飛速發展,大數據滲透到各個行業和領域,逐漸成為競爭力、創新力和生產力發展的重要手段。大數據技術,讓所有社會科學領域能夠借由前沿技術的發展從宏觀群體走向微觀個體。誰能率先實現和占有大數據,誰對大數據的挖掘更為深刻,誰就將搶占未來先機。而這取決于人們對大數據及大數據技術的認知和態度,也就是說,形成與之相適應的思維方式就成為駕馭大數據和實現其價值的關鍵。建立在大數據平臺上,運用大數據思維方式運作的地方志工作將不僅僅是一項工作,而是一項事業。當然,大數據思維方式離不開大數據的支撐,大數據是大數據思維方式出現的源頭和賴以生存的基礎。從根本上說,大數據思維方式是產生于大數據時代、立足于大數據技術之上的新觀念體系。
何為“大數據”?“大數據”通常用來形容一個公司創造的大量非結構化或半結構化數據。互聯網行業認為,“大數據”是互聯網公司在日常運營中生成、累積的用戶網絡行為數據。在維克托·邁爾·舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中,“大數據”指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據進行分析處理。美國互聯網數據中心認為,“大數據”是通過高速捕捉、發現、分析,從大容量數據中獲取價值的一種新的技術架構。我國政府還沒直接就“大數據”專有名詞提出來給予政策支持。不過,工信部發布的物聯網“十二五”規劃上,把信息處理技術作為4項關鍵技術創新工程之一被提出來,其中包括海量數據存儲、數據挖掘、圖像視頻智能分析,這都是大數據的重要組成部分。在見仁見智的回答中,有一些東西是共同的,而這即是大數據的特點。
整體性。大數據的資料量規模龐大到不能用G或T來衡量,無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助決策的資訊。物聯網、云計算、移動互聯網、車聯網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器,都在以數據的形式追蹤人們的日常生活,并將這些數據存儲在相應的數據庫中。這些數據庫以某些相關性相聯,構成大數據海量資料量的整體。
多樣性。大數據中數據類型繁多,這種類型的多樣性也讓數據被分為結構化數據和非結構化數據。相對于以往便于存儲的以文本為主的結構化數據,非結構化數據越來越多,包括網絡日志、音頻、視頻、圖片、地理位置信息等,這些多類型的數據對數據的處理能力提出了更高要求。
關聯性。大數據中的“數據”與“數字”是具有不同內涵的。一個數字背后的背景數據、評論數據、心情數據等全方位界定了該數據的意義。數據能否被賦予新的價值、實現從數字支撐到數據支撐的順利轉化,理解巨量數據的關聯性是至關重要的。發掘這些形態各異、快慢不一的數據流之間的相關性,是大數據做前人之未做、能前人所不能的機會。
開放性。大數據產生速度快、體量龐大,任何單位和個體想壟斷占有都不現實,大數據向所有合法用戶開放。海量數據本身的價值密度較低,但是經過清洗和“提純”的數據價值卻很高。這就造成大數據可以從多角度、多層面進行組合、篩選,為不同主體所使用。
曾經抽樣是獲取數據的主要手段,大數據時代,隨著數據收集、存儲、分析技術的突破性發展,更方便、快捷、動態地獲得研究對象所有有關數據成為現實。相應地,思維方式也應該從樣本思維轉向總體思維,才能更全面、系統、客觀地反映事物本來面目。
小數據時代,信息收集的有限性意味著細微的差錯會被放大,甚至可能影響整個結果的準確性,因此對樣本精確度的要求是苛刻的。大數據時代,只有5%的數據是結構化且能適用于傳統數據庫的。如果不接受混亂,剩下95%的非結構化數據都無法利用。當擁有海量即時數據時,數據的絕對精準不再是追求的主要目標,適當忽略微觀層面上的精確度,容許一定程度的錯誤與混雜,反而可以在宏觀層面擁有更好的認知和洞察力。
小數據時代,人們往往執著于現象背后的因果關系,試圖通過有限樣本數據來剖析其中的內在規律。大數據時代,人們可以通過大數據技術挖掘出事物之間隱蔽的潛在相關,幫助捕捉現在和預測未來。通過關注線性的相關關系,以及復雜的非線性相關關系,可以看到很多以前不曾注意的聯系,還可以掌握以前無法理解的復雜技術和社會動態,相關關系甚至可以超越因果關系,成為我們了解世界的更好視角,而且不易受偏見的影響。
自進入信息社會以來,人類社會的自動化、智能化水平得到明顯提升,但始終無法取得突破性進展,機器的思維方式仍屬于線性、簡單、物理的自然思維。大數據技術的發展運用,為機器智能提供契機,推進機器思維方式由自然思維轉向智能思維。隨著物聯網、云計算、社會計算、可視技術等的突破發展,大數據系統也能夠自動搜索所有相關的數據信息,并讓數據主動“發聲”,類似“人腦”一樣主動、立體、邏輯地分析數據、做出判斷,從而獲得具有洞察力和新價值的東西,甚至類似于人類的“智慧”。
中華民族有著2000多年編修地方志的優良傳統,現存舊志有8000多種、10萬多卷。新中國成立后特別是改革開放以來,在黨中央、國務院正確領導下,經過各地區各有關部門不懈努力,地方志工作取得巨大成就和豐碩成果,截至 2016年底,已出版7000多部省、市、縣三級地方志書,28000多部行業志、部門志、軍事志、武警志、專題志、鄉鎮(街道)志、村(社區)志等,2400多種地方綜合年鑒,1100多種專業年鑒。同時,整理出版舊志2800多種,出版各種志鑒理論著作1000多部,發表論文6萬多篇。建成各級各類方志館460多個;建成網站、網頁1130個;開通省級方志微信19個,市縣方志微信200多個。
習近平曾在多個場合提出,“高度重視修史修志,把歷史智慧告訴人們,激發我們的民族自豪感和自信心,堅定全體人民振興中華、實現中國夢的信心和決心。”李克強總理在第五次全國地方志工作會議的批示指出,“修志問道,以啟未來。”這些精神和指示,都包含了巨大的時代擔當和使命追求。我們應該“因時而謀、乘勢而上、順勢而為、充分挖掘、開發利用地方志資源”,主動服務大局、服務社會、服務百姓。
思維是行動的先導,環境和條件變了,思維方式就自然要隨之而變。當前,大數據思維已經成為影響我們生活方式的新的思維方式,地方志工作也必然要適應新常態,在新的思維方式下開拓和發展自身事業。
在小數據時代,由于技術條件的限制,人們只能通過把復雜的整體分解多個部分的方法來分析研究事物,并試圖用這些部分信息來描述整體特征。而在大數據時代,人們可以利用大數據技術,收集、處理和“提純”海量數據,主動關注全局,從更廣的范圍,更高的層次,更深的角度認識事物,形成基于大數據基礎上的總體思維。
當前地方志工作割裂問題比較嚴重。雖然出臺了《地方志工作條例》《全國地方志事業發展規劃綱要(2015—2020年)》等文件,但還缺乏依法治志體制,難以適應時代需要。且實際工作中,主要通過行政命令和行政手段組織實施,受各單位領導主觀意志和人員素質影響較大,區域發展極不平衡。同時,缺乏高效運行條件,處境尷尬。雖然這幾年,地方志系統極力主張主動作為,服務社會、服務大局,但“兩耳不聞窗外事,一心只編地方志”現象依舊普遍存在,導致地方志生存和競爭力極低。且從領導體制來看,國家層面,地方志未獨立設部,附屬于社科院,系統內部上下級之間僅是業務指導,無選人用人權,無考核獎懲權。
作為一項事業來說,國家層面,地方志應加強頂層設計,爭取盡快立法,取得“話語權”。才能更好地在法律授權范圍內,高規格推動地方志事業發展,獎懲分明地促進相關單位領導的重視,吸引有能力的人才加入地方志隊伍。同時,要籌謀發展合力,根據當前全國地方志的實際情況和發展趨勢,取長補短、揚長避短,統一規劃,統籌布局,在全國方志系統內形成一盤棋。省市縣層面,要突破思想束縛,爭當“活著的精神”,挖掘地方志在文化事業發展中“根”的作用,做出“拳頭”產品,主動融入經濟社會建設,貢獻綿薄之力。
容錯思維,不是縱容錯誤存在,而是接受不精確的存在,并不斷調整糾偏。在大數據時代,由于技術的進步,人們基本可以做到實時、實地采集、傳輸、處理數據,可以實時準確地把握事物的動態發展變化情況,隨時調整決策,糾正錯誤。
地方志資源最大的優勢是以結構化數據的方式存在,無論是新舊志書還是理論研究成果,都是能被傳統數據庫所容的結構化數據。從橫向來看,地方志資源反映本行政區域內自然、政治、經濟、文化、社會等方面情況,可謂名副其實的“眾手成書”的百科全書。但由于記載時間跨度長,涉及部類環節多,存在出錯概率。從縱向來看,地方志資源貫穿中華民族發展的幾千年,且因為各種原因出現過時間斷層,同一事物在不同歷史時期的記載可能出現差異甚至悖逆。
在信息受限的時代,因為缺乏參照,可能發現不了問題。但在大數據時代,信息來源廣,更新快,數據分析能力極大提升,使用者發現問題的概率上升。這就需要突破地方志資源以紙質載體為主的限制,實現信息化和數字化。同時,加強與高校、科研院所等單位和機構之間的互通交流,積極“走出去”和“請進來”,借腦思維,利用大數據平臺,不斷糾偏和實證,獲得宏觀領域更深刻的認知和把握,突出地方志資源的權威性和客觀性、科學性。
大數據時代,事物各組成要素之間的關系已經不完全是簡單的線性因果關系,而更多的是一種非線性的相關關系。通過分析研究數據變化所反映的事物之間的內在聯系以及相關關系,可以避免我們的思維方式陷入冗長的因果關系鏈,較為快捷地發現事物不同要素之間的相互關系和相互影響及相互作用方式,為快捷準確地找到解決復雜問題的方案提供有效的路徑。
地方志工作要求基本形成黨委領導、政府主持、負責地方志工作的機構(以下簡稱地方志工作機構)組織實施、社會各界廣泛參與的工作體制。當前地方志工作也確實是在黨委領導、政府主持、地方志機構組織實施下開展的。但是社會各界參與度還比較欠缺,主要在于地方志忽略民眾需求、脫離市場、自修自賞。從文字看,絕大多數志書都是機關企事業單位日常工作的條塊分割紀錄;照片多是領導開會、視察、接待外賓,大型文藝匯演,風景照;人物多是一定級別領導干部以及高級職稱、勞模、英烈為主。地方志書雖強調“述而不作”,但通篇看來歌功頌德、報喜不報憂。
鄧小平在視察南方時,曾提出“三個有利于”標準。這一標準,同樣適用于也應該是地方志工作的標準,且是唯一標準。地方志工作者要改變常年蹲守辦公室閉門造車的現狀,在發動全民供稿、眾手修志的同時,下到地頭田間、街頭巷尾、生活一線、生產前沿,保持地方志資源的新穎性和生活性,踏踏實實記錄熱火朝天的現實生活和人民身影,并從中挖掘歷史變遷、時代發展的規律,把歷史的智慧告訴人們。這樣接地氣的地方志書還會沒人看、無人讀嗎?地方志書收錄資源的變化,也必然帶來受眾的變化,改變當前地方志工作“官不官、民不民”的處境,釋放地方志的生機和活力。這樣的地方志書也才堪當“資政、存史、育人”之大任。
封閉導致混沌,而開放則會帶來生機和活力。大數據的一個鮮明特征就是開放性。從數據來源來看,大數據時代的數據建設對所有的有效數據保持開放;從數據的使用來看大數據時代的數據向所有的合法用戶保持開放,任何用戶都沒有數據特權。這種開放性為人們的智能思維奠定基礎,為我們探索掌握現實和未來事物發展的特點規律,智慧思考、超前謀劃提供支撐和條件。
地方志工作者非常重視地方志組稿、編輯、出版工作,卻忽略了最重要的讀者體驗,幾乎沒有關于讀者體驗的跟蹤和反饋。地方志工作者總認為自己擁有一座資源的寶庫,不可否認,在大數據平臺的支撐、大數據技術的應用下,地方志資源的的確確是一座中國優秀傳統文化資源的寶庫。但現實是,我們不知道誰需要寶庫中的哪些東西?誰想找到寶庫的大門卻不得?誰對于寶庫資源開發有很好的想法?寶庫有沒有漏洞需要修補?一言以蔽之,我們缺乏對讀者行為的把握。僅僅負責提供內容,并想靠內容一個維度影響讀者。在新媒體時代,傳統內容維度黏性較弱,讀者更容易被其他全新的閱讀體驗所吸引,他們的閱讀興趣隨時在發生轉移。
大數據時代,地方志工作應抓住這一歷史機遇,形成“讀者畫像”,通過與各種大數據團隊的合作、融合,了解讀者的興趣所在,并主動推送新內容不斷吸引潛在讀者、研究已有讀者,增強讀者黏性。從而突破當前地方志工作者忙得熱火朝天,讀者卻“把頭偏向一邊”的自說自話、自娛自樂的現象,營造文本、環境、工作者、讀者間的良性互動封閉環,充分發揮地方志為社會服務的作用。為國存史固然是地方志的重要作用之一,但是更需要參與當下的社會建設,為當今時代服務。這就需要解放思想,主動參與大數據時代、擁抱大數據平臺。地方志資源都是結構化數據,且橫不缺項、縱不斷線,這是非常寶貴的資源,只是條塊分割嚴重、規律性需要挖掘。建立相應的保障機制,融合大數據技術,重新分布和整合資源,在兼顧全面的基礎上,打破均衡原則,突出地域特色、時代特色,地方志資源完全可以變成平臺化的文化產品,并借助所需主體對內容的加工和深度挖掘而分享收益,使地方志更接地氣,走進社區、學校、機關、企業等,真真實實為民所用。這也是增加地方志資源利用率的一種思考角度。
習近平總書記指出,“創新是一個民族進步的靈魂,是一個國家興旺發達的不竭動力,也是中華民族最深沉的民族稟賦。在激烈的國際競爭中,惟創新者進,惟創新者強,惟創新者勝。”大數據時代已經來臨,采集、處理海量數據的平臺和技術都已具備。地方志事業要開拓發展,必然要從思想的高度、方法論的深度上進行創新改革,高屋建瓴地銳意進取,才能不負當前好機遇,譜寫地方志事業的華美篇章。