陳齊金 王昌喜
(浙江《東陽市志》編輯部 浙江 東陽 322100)
方志資料記述,靠文字顯性,憑圖片定形,更依賴確切的數據定量。確保所用數據資料的準確性,是保證志書質量的前提條件。二輪志書要反映社會由計劃經濟向市場經濟轉型及經濟體制改革,由于經濟成分多元,企業利益追求各異,數據統計本身就十分困難,其準確性更是缺乏保障??甲C方志數據資料的準確性是志書資料編排無法繞開的一項極其重要的工作。
如何考證方志數據資料的準確性呢?首先要確立方志所用數據都必須經過認真考證的指導思想。不管是舊方志或報紙上刊載的、相關單位上報的數據,還是各級政府統計部門發布的數據都要進行逐項考證。雖然統計部門的數據統計具有面對本行政區域全社會全方位、覆蓋面廣、內容深入的特點,是方志編寫的首選數據資料,但由于經濟轉型,統計口徑、范圍時會發生變化,再加上統計人員素質、工作態度的差異,統計數據信度同樣會產生各種各樣的問題。
其次,考證方志數據資料的準確性,要掌握一些基本方法。下面筆者以某縣級市統計局《1949—2008新XX六十年》(下面簡稱《新六十年》)381頁關于1997年至2006年婚姻登記情況的表格為例,作一介紹。

11-9 婚姻登記情況
事物的發展都有一定的規律,有時數據錯誤,會使事物發展過程的記載顯得不合情理。上表中1997年的“申請離婚數”是120對,而“準予登記離婚數”卻有130對。從情理分析,上世紀90年代,民政局負責婚姻登記的干部接待前來要求離婚的夫妻,先要填寫申請離婚登記表,然后做大量的思想工作,勸其和好;實在不能勸和的,再辦理離婚手續。但這里卻記載有10對沒有經過申請離婚就“被離”了,顯然有悖情理。經查該市民政局《1997年婚姻登記和收養登記工作統計表》,申請離婚數實際為170對。
在一般情況下,相同的地方,相近的時間段,調查同類的對象,所得出的統計數據應該相差不大;如果差額過大,就可能存在數據錯誤。上表中,該市一般年份的“準予登記結婚”數在6000對上下,而2003年只有常年的一半,2000年只有常年的二十分之一,顯然有問題。經查《2003年浙江民政統計資料匯編》第382頁,該市2003年的正確數據為:準予登記結婚數6249對,初婚數11667人,再婚數831人,準予登記離婚數396對。再查《2000年浙江民政統計資料匯編》第363頁,2000年的正確數據為:準予登記結婚數5890對,初婚數11277人,再婚數503人,男260人、女243人,準予離婚數210對。
統計分組表,分為封口組和開口組兩種。封口組的各項數字之和應當等于合計數。開口組不設“其它”欄,各項之和允許少于合計,但不能相差太多,要符合實際。這種關系可以通過求“和”(或差)的辦法分辨真偽。有時表中的數字還有“積”(或商)的關系。例如上表中前三欄的關系大體是:(初婚人數+再婚人數)÷2=準予登記結婚對數,一般年份都合乎這個算法。只有2004年,按格式計算應是(13196+46)÷2=6621,比原表中的“準予登記結婚對數”6618對多3對。還有2005年按格式計算為(10002+788)÷2=5395,比原表中的“準予登記結婚對數”5878對少了483對,可以判斷有問題。經查該市民政局婚姻登記處《2005年民政事業統計年報》,正確數據確實是5395對。
上面,我們采用了多種方法分析數據,而最基本的是類別比較法。我們拿到各種同類的調查統計表時,如果發現應該相同的數據變得不同了,應該相近的數據相差太遠了,我們就應該認真復查核對,看看相應數據是否真實可信,認真查明原因,加以糾正,既不能馬虎了事,又不能主觀亂改。方志志稿中的數據主要來自政府統計部門的資料,而這些資料又是有關單位上報的,如果發現統計部門資料有問題,就要查考各單位的原始資料,如發現原始數據有誤或幾處來源不一致時,應對數據作更深入的考證。
《新六十年》第450~452頁2006年至2008年《鄉鎮基本情況》的總戶數、總人口有誤,與該市公安局《人口及其變動情況統計年報表》不一致。2006年的統計數據應以2006《XX統計年鑒》分鄉鎮總戶數、總人口數為準,2007年的統計數據應以《XX改革開放三十年統計資料1978~2007》第49頁分鄉鎮總戶數、總人口數為準,2008年的統計數據應以《新六十年》第261頁2008年分鄉鎮總戶數、總人口為準。
《新六十年》第33頁1991年夏秋玉米面積310公頃,單產36800公斤。每畝單產竟高達2453公斤,不合情理,可以斷定數據有誤。那么確切數據應該是多少呢?
經查《XX統計年鑒1990—1995》,第23頁記載1991年夏秋玉米總產量11408噸,第25頁記載1991年夏秋玉米單產3630公斤,依據“總產量÷單產=公頃數”的公式,“11408噸÷3630公斤=3142公頃”。而查第21頁,1991年夏秋玉米面積為0.31千公頃,相當于310公頃,大概是在將“公頃”數轉換為“千公頃”數時弄錯了小數點的位置。隨后《XX五十年1949—1998》25頁和《新六十年》33頁面積又照抄錯數,單產重新計算錯為36800公斤,致使統計年鑒和匯編里的數字發生一系列錯誤。
講到計算核對,這里介紹兩種簡單易行的方法,在檢查數據時或許用得上。
1.檢查各項之和是否等于合計數,可先采用尾數(指個位數)相加檢驗法,如每個數字的尾數相加之和的尾數與表上原合計數的尾數不同,則原合計數肯定有誤。
2.在檢查統計表的合計數時,如果將正確數字和錯誤的數字相減,差是9(或90)的倍數,那么可能在計算時將某個數字的個位與十位(或十位與百位)的數字顛倒了?,F在多采用電腦編纂、排版,這種問題出現的幾率增高,應充分關注。例如有以下一組數字:
424 362 543 192 725 268 124 267表中原合計數為2932。
首先檢查尾數之和,4+2+3+2+5+8+4+7=35,和的尾數是5,和原表合計數的尾數“2”不同,說明原合計數有誤。要進一步查清問題所在,還應將全部數字相加,求得和是2905,與原來合計數相減,即2932-2905=27,差是9的倍數,那么,我們就只要找出個位、十位換位后,相差27的數字,大概就是725應該換成752了。經過核查,確實如此。如果差是90的倍數,就要檢查十位和百位的數字換位的問題,以此類推。
識別和校核數據正確與否是極為重要的,但在識別和校核時還應注意:
在《新六十年》中,有幾個街道和鎮鄉的統計數字變化很大,和這幾個街道及鎮的管轄范圍的變化緊密相關。區劃變了,即統計范圍變了,統計數據肯定要隨之變化,如果簡單地套用上面的差額審視法等,就會犯瞎子摸象的錯誤。
還有《新六十年》第82頁,“工業企業單位數(鄉及鄉以上、規模以上)”一欄的數據,1997年為274個,1998年為127個,是不是1998年突然壓縮了一半多?其實不然,1997年及以前的數據為鄉及鄉以上的企業數字,而1998年及以后為規模以上的企業數字,因此1998年的工業企業單位數比1997年減少了53.6%,其實整個市的企業數和工業總產值是持續增加的??梢?,分析記載的角度或口徑變了,數據也會隨之變化。我們切不可將正確的誤判為錯誤的。
發現數據錯誤,難;糾正數據錯誤,更難。審核發現錯誤只是發現問題,糾正錯誤才能解決問題。我們應該端正態度,遵循嚴謹科學、全面系統的原則,運用正確有效的方法,認真分析、把握數據資料,確保所用數據達到真實準確、彰明因果的要求,為編寫精品佳志打好資料基礎。