胡桂華, 遲璐婕
(重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院,重慶 400067)
從事人口統(tǒng)計研究的國內(nèi)外學(xué)者,很想獲得人口普查微觀記錄.可是,各國政府統(tǒng)計部門出于普查工作條例規(guī)定的微觀數(shù)據(jù)保密及采集微觀記錄的成本考慮,并不愿意提供研究人員普查微觀記錄.無論哪個國家,能夠獲得普查微觀記錄學(xué)者的工作單位通常在該國擁有很高的知名度.明尼蘇達(dá)大學(xué)獲得了美國和其他許多國家的人口普查微觀數(shù)據(jù),清華大學(xué)得到了中國2010 年人口普查住戶及個人記錄.
明尼蘇達(dá)大學(xué)人口中心的IPUMS 數(shù)據(jù)庫,免費為科研工作者提供普查微觀記錄用于科學(xué)與教育研究[1-4].這些微觀記錄包括姓名、性別、年齡、文化程度、生育、婚姻、出生、死亡、遷移、勞動力參與、職業(yè)結(jié)構(gòu)、教育和種族.IPUMS 數(shù)據(jù)庫的數(shù)據(jù)一般占所在國或地區(qū)全部普查微觀記錄的1%.除美國100%提供普查微觀記錄給IPUMS 數(shù)據(jù)庫外,其他愿意向IPUMS 數(shù)據(jù)庫提供數(shù)據(jù)的國家只會提供1%,99%的微觀記錄不會提供.中國在1982 年、1990 年和2000 年,以住戶(含家庭戶和集體戶)為抽樣單位,采取等距抽樣方法,按照1%比例向IPUMS 數(shù)據(jù)庫提供普查微觀記錄.中國國家統(tǒng)計局迄今尚未向IPUMS 數(shù)據(jù)庫提供2010 年1%普查微觀記錄.
IPUMS 從一些國家的政府統(tǒng)計部門的普查微觀記錄中抽取1%作為樣本,因此存在樣本代表性問題[5],需要對這個1%樣本進(jìn)行評估.如果100%普查微觀記錄進(jìn)入IPUMS 數(shù)據(jù)庫,就不存在樣本代表性評估問題,因為它只可能存在非抽樣誤差,而不可能存在抽樣誤差.如果明尼蘇達(dá)大學(xué)人口中心評估這個樣本的代表性,就只需要采取一重抽樣評估抽取的1%樣本的代表性.如果明尼蘇達(dá)大學(xué)人口中心將1%樣本微觀數(shù)據(jù)全部給予某個或某些研究人員使用,研究人員也只需要采取一重抽樣評估抽取的1%樣本的代表性.然而明尼蘇達(dá)大學(xué)人口中心只會給予研究人員1%樣本中的很少一部分.如果研究人員要評估他們得到的這部分樣本數(shù)據(jù)的代表性,自然是要采取二重抽樣來評估樣本的代表性.我們站在使用部分1%樣本微觀數(shù)據(jù)的研究人員的角度評估樣本代表性,根據(jù)第二重樣本構(gòu)造的男女人數(shù)估計量及抽樣方差估計量做這項工作.
研究人員在決定使用IPUMS 樣本普查微觀記錄之前,很想知悉其對總體的人口普查微觀記錄的代表性.只有當(dāng)IPUMS 樣本代表性大的時候,才可以用來進(jìn)行各種統(tǒng)計分析.抽樣理論指出[6],代表性大的樣本,其內(nèi)部結(jié)構(gòu)與總體結(jié)構(gòu)一致,能夠?qū)傮w進(jìn)行有效的估計,對總體特征做出合乎邏輯的評估.代表性小的樣本,其結(jié)構(gòu)偏離總體結(jié)構(gòu),無法代表總體,所描述的總體特征或推斷的總體參數(shù)難以反映總體的實際狀況[7,8].抽樣調(diào)查的所有工作都是圍繞如何通過設(shè)計合理的,適合于目標(biāo)總體的抽樣方式或方法來抽取代表性大的樣本來展開的.抽樣專家把代表性大的樣本稱為“好樣本”,代表性小的樣本稱為“壞樣本”.抽樣調(diào)查成功的關(guān)鍵在于抽到代表性大的“好樣本”.樣本代表性與樣本規(guī)模是兩回事情.樣本量大,并不意味著樣本代表性一定大,反之亦然.決定樣本代表性的因素除了樣本規(guī)模外,還與總體內(nèi)部單位變異性、抽樣方法、抽樣方式和分層變量的選擇等等有關(guān).有學(xué)者把樣本規(guī)模當(dāng)作是制約樣本代表性的唯一因素,寄希望于通過擴(kuò)大樣本規(guī)模而達(dá)到增大樣本代表性的目的,把樣本當(dāng)作總體,把樣本指標(biāo)當(dāng)作總體指標(biāo),忽視或從未計算抽樣方差.樣本代表性與抽樣的隨機(jī)性也不一致.完全按照隨機(jī)原則抽取的樣本的代表性不一定大.相較于簡單隨機(jī)抽樣,等距抽樣的隨機(jī)性主要是體現(xiàn)在第一個單位的選擇上,因而隨機(jī)性較差.但由于它在抽樣之前對總體單位按照某個標(biāo)志排列,又每間隔相等距離抽取一個單位,因而其樣本覆蓋總體,樣本代表性大.由于這個原因,抽樣專家傾向于使用等距抽樣.在實際抽樣工作中,美國普查局和其他一些國家的政府統(tǒng)計部門抽取樣本時使用等距抽樣,計算抽樣方差時使用簡單隨機(jī)抽樣的抽樣方差公式.
目前評估樣本代表性的方法主要有三種.一是如果樣本嚴(yán)格按照抽樣程序抽出,抽到的是概率樣本,就認(rèn)為樣本代表性大.二是如果能夠找到與總體參數(shù)(如人數(shù))很接近的指標(biāo)(如普查人數(shù)),就把依據(jù)樣本資料估計的結(jié)果與總體參數(shù)接近的指標(biāo)進(jìn)行比較.如果兩者之間差異小,就認(rèn)為樣本代表性較大.三是計算抽樣誤差.抽樣誤差越大,樣本代表性越小.抽樣誤差公式含有總體未知參數(shù),例如,抽樣平均方差中的總體方差未知.在這種情況下,用抽取的樣本資料計算的樣本方差替代總體未知方差.在抽樣調(diào)查中,總體參數(shù)永遠(yuǎn)是未知的,無法得到的.如果得到了總體參數(shù),就沒有必要進(jìn)行抽樣調(diào)查.抽樣調(diào)查目的就是估計總體參數(shù).較為理想的做法是,把這兩種方法結(jié)合起來使用,即先確保抽到的是概率樣本,再根據(jù)估計值與總體參數(shù)差異或抽樣誤差大小判斷樣本代表性.在評估IPUMS 樣本代表性之前,構(gòu)造總體參數(shù)估計量及其抽樣方差估計量.要提高樣本代表性,必須控制抽樣誤差.
控制抽樣誤差的方法有四種.一是增大樣本規(guī)模.樣本規(guī)模大,意味著樣本接近總體,依據(jù)樣本估計的總體參數(shù)接近總體參數(shù).但是,樣本規(guī)模大、調(diào)查經(jīng)費、調(diào)查時間和調(diào)查數(shù)據(jù)誤差也會相應(yīng)增加.因此,靠增大樣本規(guī)模提高樣本代表性并不是一個好方法.二是在既定樣本規(guī)模下,選擇適合的抽樣方式和分層變量,也能減少抽樣誤差.分層抽樣估計精度優(yōu)于簡單隨機(jī)抽樣和整群抽樣.分層二重抽樣,通過對第一重樣本的現(xiàn)場調(diào)查確定第二重抽樣的分層變量,能提高第二重樣本的代表性,進(jìn)而降低抽樣誤差.三是選擇適當(dāng)?shù)目傮w參數(shù)估計量.例如,三系統(tǒng)估計量的抽樣方差小于雙系統(tǒng)估計量的抽樣方差.四是盡可能利用與主要變量高度相關(guān)且質(zhì)量高的輔助變量,以提高總體參數(shù)估計精度.
從實際使用IPUMS 數(shù)據(jù)庫的人員來看,主要是國內(nèi)外人口學(xué)者,統(tǒng)計學(xué)者使用這一數(shù)據(jù)庫的很少.人口學(xué)者直接利用該數(shù)據(jù)庫的普查微觀記錄進(jìn)行人口統(tǒng)計分析.在分析之前,他們并未考慮樣本代表性問題,從未進(jìn)行樣本代表性評估或檢驗,也未交代樣本的獲取過程和計算抽樣標(biāo)準(zhǔn)誤差.我們的研究有望改變這一狀況,引起人口學(xué)者對IPUMS 樣本代表性問題的關(guān)注,從而得出合理的分析結(jié)論.
在討論樣本代表性問題時,需要特別注意的一個問題是,一個樣本是否可用,要由(而且只能由)估計量的精度(用估計量的方差或置信區(qū)間來描述)來判斷.如果樣本的使用者覺得估計量的精度是可以接受的,那么這個樣本對他來說就是可用的.換句話說,一個樣本是否可用,不能一概而論.其一,不同的使用者對精度有不同的要求,此使用者認(rèn)為可用,彼使用者可能會認(rèn)為不可用.那么,該樣本對此使用者是可用的,對彼使用者卻是不可用的.其二,估計不同的指標(biāo),各自會有精度要求,此指標(biāo)估計量的精度可以接受,彼指標(biāo)估計量的精度可能會不可以接受.那么,該樣本對此指標(biāo)是可用的,對彼指標(biāo)卻是不可用的.
研究有三個顯著特點.第一,迄今尚未發(fā)現(xiàn)國內(nèi)外其他學(xué)者關(guān)注和研究人口普查微觀數(shù)據(jù)樣本代表性問題.中國國家統(tǒng)計局每次人口普查后均未發(fā)布樣本代表性招標(biāo)課題,課題中標(biāo)者也未意識到他們得到的普查微觀記錄樣本是否對總體普查微觀記錄有代表性.因此,本研究不是對已有研究的重復(fù),而是具有獨創(chuàng)性.第二,采用分層二重抽樣方式抽取樣本,并且每重抽樣的分層變量并不相同,這確保了樣本代表性.第三,在比率估計量構(gòu)造中,使用第一重樣本資料估計作為輔助變量的總體住戶人數(shù),而不是像通常的比率估計量那樣利用已知的住戶人數(shù)指標(biāo),從而保證了估計量各項指標(biāo)統(tǒng)計上的一致性,即均為估計量,并且比率估計量的分子和分母均是雙重擴(kuò)張估計量[9-12].
從以上討論或論證可以看出:本文依據(jù)統(tǒng)計抽樣理論及美國明尼蘇達(dá)大學(xué)人口研究中心IPUMS 數(shù)據(jù)庫提供的人口普查微觀數(shù)據(jù)撰寫而成,采用隨機(jī)原則抽取樣本.如果樣本有意識抽取,則難以計算抽樣方差和判斷樣本代表性.對抽取的樣本,利用樣本人數(shù)和抽樣權(quán)數(shù),使用雙重擴(kuò)張估計量構(gòu)造總體男女人數(shù)線性估計量;為提高總體男女人數(shù)估計精度,構(gòu)造總體男女人數(shù)比率估計量;針對男女人數(shù)估計量較為復(fù)雜的問題,采用Binder 抽樣方差估計量近似計算其抽樣方差.構(gòu)造總體男女人數(shù)估計的置信區(qū)間;為便于讀者理解.利用微觀數(shù)據(jù)演示計算公式的使用方法和給出估計結(jié)果.所做的這一切工作,表明我們的研究有充足的抽樣理論依據(jù)及數(shù)據(jù)基礎(chǔ).
抽樣設(shè)計包括抽樣方式、抽樣單位確定、樣本量測算、總體參數(shù)估計量及其抽樣方差估計量構(gòu)造.
采取分層二重抽樣抽取樣本[13-15],每重抽樣的抽樣單位均為住戶.第一重抽樣層用h表示,第二重抽樣層用g表示.在第一重抽樣中,首先獲得每一層以住戶為單位的抽樣框,然后以住戶為抽樣單位,從層h的住戶抽樣框中,采取簡單隨機(jī)或等距抽樣抽取住戶樣本,樣本量為nh.第h層的住戶總數(shù)記為Nh,總體的住戶總數(shù)記為N,第一重抽樣層的總層數(shù)記為H.在第二重抽樣中,對抽取的第一重樣本住戶進(jìn)一步分層.例如,按照住戶性質(zhì)(集體戶和家庭戶)共分為G層,任意層記為g.從每一hg層,編制第一重樣本住戶抽樣框,從抽樣框中以住戶為抽樣單位采取簡單隨機(jī)或等距抽樣方式抽取第二重住戶樣本.美國、中國等為便于組織抽樣和提高樣本代表性,通常采取等距抽樣.在后面的實證分析中,我們采取等距抽樣抽取住戶樣本.
首先構(gòu)造估計總體住戶的男性和女性人數(shù)的線性估計量和比率估計量,然后構(gòu)造它們的抽樣方差及其估計量.

式(3)的估計量為

式(2)和(4)中的DE 是雙重擴(kuò)張估計量(Double Estimator)的縮寫.
如果能夠得到主要變量y的輔助變量(如某個住戶的所有成員)xi的人數(shù),那么總體輔助變量總?cè)藬?shù)的估計量^XDE為

使用第一重樣本,估計的輔助變量總?cè)藬?shù)的估計量^X(1)為

使用式(2)和(4),式(5)和(6),構(gòu)造估計總體男性和女性人數(shù)的比率估計量(Ratio Estimator)

式(2)、(4)、(7)和(8)統(tǒng)一寫成下面公式

對式(2)或(4),li1=0, li2=yi;對式(7)或(8),

事實上,當(dāng)li1=0, li2=yi時,式(9)變?yōu)?/p>


這即為式(7).
可以證明,式(9)中的線性估計量,即式(2)或(4)是下式的一個無偏估計量.





從式(20)可以看出,總體男性或女性人數(shù)估計量的抽樣方差由三項構(gòu)成(從右向左).第一項表示所有g(shù)層的總體總量的抽樣方差估計量.第二項表示所有h層的總體總量的抽樣方差的估計量.第三項表示所有交叉層hg的總體總量的抽樣方差估計量.這三項的總和表示總體的總體總量的抽樣方差估計量.
式(2)、(4)、(7)和(8)的抽樣方差,除了可以使用Binder 方法外,還可以使用分層刀切法近似計算[19,20]

其中θ為總體參數(shù),未知,其估計量為?θ,s為被剔除的普查小區(qū)t所在的層,?θ(st)為剔除t后重新算得的總體參數(shù)估計量,剔除的次數(shù)為第一重樣本小區(qū)的總數(shù)目.對式(2)、(4)、(7)和式(8),?θ分別為?Y男DE,?Y女DE,?Y男RE,?Y女DE.
估計男女人數(shù)的式(7)和(8)為比率估計量,其比率的分子和分母使用再加權(quán)擴(kuò)張估計量構(gòu)造.關(guān)于比率估計量的性質(zhì),抽樣估計理論已給出若干成熟結(jié)論.比率估計量不是無偏的,但當(dāng)樣本量n很大時,是近似無偏的,或者說這個偏差是可以忽略的.當(dāng)主變量和輔助變量的相關(guān)系數(shù)大于0.5 時,比率估計量比簡單估計量的精度要高.抽樣理論和有關(guān)文獻(xiàn)研究成果指出,在大樣本情況下,比率估計量具有相合性或一致性,在樣本量足夠大(大于30)使目標(biāo)變量與輔助變量的變異系數(shù)都小于0.1 時,由中心極限定理可知,比率估計量的極限分布近似正態(tài),可按照正態(tài)分布總體特征的區(qū)間估計,構(gòu)造比率估計量置信區(qū)間.
我們反復(fù)查閱國內(nèi)外抽樣調(diào)查專著或教材,尚未發(fā)現(xiàn)式(2)和(4)這樣的分層二重抽樣技術(shù)條件下的線性估計量是否服從正態(tài)分布的結(jié)論.因此,我們只能根據(jù)已有結(jié)論和自己的理解對式(2)和(4)是否服從正態(tài)分布做出判斷.
估計男女人數(shù)的式(2)和(4)為線性無偏估計量,具有一致性和服從正態(tài)分布.當(dāng)樣本規(guī)模足夠大時,比率估計量接近于線性估計量.這表明,線性估計量是比率估計量的一種特殊形式.既然比率估計量近似正態(tài)分布,因此,我們推測線性估計量也可能服從或近似服從正態(tài)分布.
其實,判斷一個估計量是否服從正態(tài)分布的較好辦法是,從總體中抽取若干個樣本,使用估計量計算每一個樣本的估計值,將這些估計值與估計值的個數(shù)顯示在坐標(biāo)系下,就可以根據(jù)點的分布情況,判斷估計量是否服從正態(tài)分布.在統(tǒng)計學(xué)中,均值服從正態(tài)分布就是采用這種原始方法判斷或顯示出來的.
實證目標(biāo)是,判斷美國明尼蘇達(dá)大學(xué)人口中心IPUMS 提供的1%人口普查微觀記錄樣本是否具有代表性.數(shù)據(jù)來源于IPUMS 數(shù)據(jù)庫的重慶市2000 年11 月1 日1%的樣本普查微觀記錄.采用分層二重抽樣抽取樣本.
在第一重抽樣中,將重慶市所有住戶劃分在三個抽樣層,即城市層、鎮(zhèn)層和鄉(xiāng)村層.在每個抽樣層,以住戶為抽樣單位,按照既定抽樣程序,等距抽取1%住戶樣本.第一重樣本為重慶市2000 年1%人口普查住戶資料,樣本量為93181 個住戶,來源于美國明尼蘇達(dá)大學(xué)人口中心.該中心從中國國家統(tǒng)計局獲取數(shù)據(jù).
在第二重抽樣中,對第一重樣本,按照住戶性質(zhì)進(jìn)一步分為家庭戶層和集體戶層.在每一個這樣的新層,仍然以住戶為抽樣單位,在既定抽樣程序下,等距抽取住戶樣本.其中,來源于城市第一重樣本的家庭戶層和集體戶層的樣本量分別為200 個和50 個住戶;來源于鎮(zhèn)第一重樣本的家庭戶層和集體戶層的樣本量分別為110 個和15 個住戶;來源于鄉(xiāng)村第一重樣本的家庭戶層和集體戶層的樣本量分別為600 個和10 個住戶.為了提高第二重樣本住戶的代表性,在具體確定第二重住戶樣本量時,考慮了下述因素:各層住戶總數(shù)目、樣本抽取的隨機(jī)性、各層住戶人數(shù)之間的差異、樣本中是否包含集體戶和家庭戶.
對進(jìn)入第二重樣本的每一個住戶,未發(fā)現(xiàn)單位無答復(fù)及內(nèi)容無答復(fù),也就是應(yīng)答率為100%,另外明尼蘇達(dá)大學(xué)人口中心對可疑的或錯誤的普查微觀記錄做了修正,因而不存在非抽樣誤差.
從IPUMS 數(shù)據(jù)庫及中國國家統(tǒng)計局公布的2000 年人口普查資料中,我們獲得了有關(guān)總體及樣本資料,見表1 至表3.

表1 重慶市2000 年人口普查匯總數(shù)據(jù)

表2 樣本形成過程

表3 樣本住戶人數(shù)(人)
利用表1 至表3 數(shù)據(jù),使用式(2)和(4)估計的重慶市家庭戶和集體戶的男性和女性人數(shù),見表4.

表4 基于式(2)和(4)的重慶市家庭戶及集體戶男或女人數(shù)估計值(人)
從表1 和表4 可以看出,估計的重慶市家庭戶男性人數(shù)和女性人數(shù)分別為15183516 人和14346299 人,而相應(yīng)的普查人數(shù)分別為15169064 人和14314587 人;估計的重慶市集體戶男性人數(shù)和女性人數(shù)分別為686939 人和372770 人,而相應(yīng)的普查人數(shù)分別為672365 人和356747 人.可見,無論是家庭戶,還是集體戶,估計的重慶市男性人數(shù)和女性人數(shù)的估計值均接近于男女普查人口數(shù).可見,樣本代表性大.
為了使用式(7)和(8)估計重慶市家庭戶及集體戶男性人數(shù)和女性人數(shù),首先使用式(5)得到重慶市家庭戶和集體戶人數(shù)估計值,見表5.然后利用第一重樣本住戶抽樣權(quán)數(shù),使用式(6)得到住戶的人口數(shù)估計值,見表6.

表5 基于式(5)的重慶市家庭戶和集體戶的人數(shù)估計值(人)

表6 基于式(6)的重慶市家庭戶和集體戶的人數(shù)估計值(人)
表5 和表6 數(shù)據(jù)來源于輔助信息得到的男女人口數(shù)估計值.利用表4 至表6 數(shù)據(jù),使用式(7)和(8)計算重慶市家庭戶及集體戶男女人數(shù)比率估計值,見表7.

表7 基于式(7)和(8)的重慶市家庭戶及集體戶男或女人數(shù)比率估計值(人)
表7 表明,利用輔助信息構(gòu)造的人口數(shù)估計量估計的重慶市家庭戶男性人數(shù)和女性人數(shù)分別為15182757 人和14345558 人,估計的重慶市集體戶男性人數(shù)和女性人數(shù)分別為666508 人和361665 人.與表1 比較可以看出,它們均接近于普查人數(shù).因此,樣本代表性大.
進(jìn)一步,比較表4 和表7 發(fā)現(xiàn),利用輔助信息構(gòu)造的人口數(shù)估計量比未利用輔助信息構(gòu)造的人口數(shù)估計量精度高,所估計的人數(shù)更加接近于相應(yīng)的普查人口數(shù),結(jié)果見表8.

表8 基于不同公式估計的重慶市男性和女性人數(shù)與其普查人數(shù)差異(人)
利用式(20)計算重慶市男女人數(shù)估計值的抽樣標(biāo)準(zhǔn)誤差.在95.45%概率把握程度下得到其置信區(qū)間,見表9.

表9 基于式(20)的重慶市男女人數(shù)置信區(qū)間
如果把重慶市2000 年普查人口數(shù)作為總體參數(shù)(真值),比較表1 和表9 可以看出,表9 的所有置信區(qū)間均包括了相應(yīng)的真值.這表明估計結(jié)果接近真值,樣本代表性大,估計精度較高.另外,在95.45%的概率保證程度下,依據(jù)式(7)和(8)計算的置信區(qū)間,比依據(jù)式(2)和(4)算得的置信區(qū)間都要窄,表明男女人數(shù)比率估計量的估計精度更高.
我們使用式(21)抽樣方差近似計算公式得到估計的重慶市男女人數(shù)置信區(qū)間,見表10.

表10 基于式(21)的重慶市男女人數(shù)置信區(qū)間
比較表9 和表10,以及比較使用分層刀切法和Binder 方法計算抽樣方差的過程,我們可以看出兩點.一是使用分層刀切法和本文的Binder 方法算得的置信區(qū)間存在差異.對同一估計量和同樣的樣本數(shù)據(jù)資料,采用不同的抽樣方差計算方法算得的結(jié)果有差異是正常的.二是Binder 方法的計算量明顯小于分層刀切法,這是本文使用Binder 方法原因之一.
為估計總體男性和女性人數(shù),構(gòu)造線性估計量和比率估計量.這兩個估計量可以統(tǒng)一寫在一個估計量中,采用Binder 方法計算其抽樣方差.
作為科研人員,在得到人口普查住戶及個人微觀記錄樣本后,所要做的第一項工作是檢驗其代表性.只有樣本代表性足夠,才可以使用該樣本進(jìn)行科學(xué)研究工作.例如,利用樣本資料估計人口普查覆蓋誤差和內(nèi)容誤差.
即便是國內(nèi)外知名單位,也難以獲得政府統(tǒng)計部門100%的人口普查微觀記錄,所能得到的是樣本普查微觀記錄.為了使得分析結(jié)果反映總體的普查狀況,要檢驗樣本的代表性.只有代表性大的樣本才能對總體得出可靠的分析結(jié)論.分層二重抽樣技術(shù)適合于檢驗IPUMS 樣本普查微觀記錄的代表性.
本文利用來源于IPUMS 數(shù)據(jù)庫的重慶市2000 年人口普查微觀記錄樣本,采用相關(guān)公式估計的人數(shù)與其普查人數(shù)的差異很小,抽樣誤差也小.由于本樣本嚴(yán)格按照抽樣程序抽出,并且不存在無答復(fù)和非抽樣誤差,樣本規(guī)模也適中,因此由IPUMS 數(shù)據(jù)庫提供的重慶市2000 年普查微觀記錄樣本對同期全部普查微觀記錄具有很好的代表性,可以用于各種人口統(tǒng)計分析,為相應(yīng)政策或計劃的制訂提供科學(xué)依據(jù).