尹國(guó)偉 聶鳳英 杜紹明
(1.農(nóng)業(yè)農(nóng)村部信息中心,北京 100125;2.中國(guó)農(nóng)業(yè)科學(xué)院海外農(nóng)業(yè)研究中心,北京 100081)
美國(guó)農(nóng)業(yè)部(United States Department of Agriculture,以下簡(jiǎn)稱USDA)致力于成為美國(guó)政府中最高效、最有效和最以客戶為中心的部門,是美國(guó)開(kāi)放共享涉農(nóng)數(shù)據(jù)的重要主體。USDA 制定的2018—2022年7 個(gè)戰(zhàn)略愿景[1]中有4 個(gè)明確提到了信息或數(shù)據(jù):戰(zhàn)略愿景一“確保高效落實(shí)好USDA 工作計(jì)劃,并專注于客戶服務(wù)”指出“通過(guò)現(xiàn)代化的信息技術(shù)基礎(chǔ)架構(gòu)、設(shè)施和支持服務(wù),以改善客戶體驗(yàn)”及“改善資源管理,并利用數(shù)據(jù)驅(qū)動(dòng)的分析來(lái)最大化投資回報(bào)”;戰(zhàn)略愿景四“促進(jìn)農(nóng)村繁榮與經(jīng)濟(jì)發(fā)展”指出“改善基礎(chǔ)設(shè)施、寬帶接入和連通性”;戰(zhàn)略愿景五“通過(guò)技術(shù)和研究加強(qiáng)對(duì)土地的管理”指出“利用基于科學(xué)的工具和信息來(lái)增強(qiáng)保護(hù)規(guī)劃”;戰(zhàn)略愿景七“提供安全、營(yíng)養(yǎng)豐富的食品供應(yīng)”指出“通過(guò)數(shù)據(jù)驅(qū)動(dòng)、靈活和以客戶為中心的方法來(lái)支持和鼓勵(lì)健康的飲食選擇”。USDA 有關(guān)組織機(jī)構(gòu)結(jié)合業(yè)務(wù)開(kāi)展專業(yè)領(lǐng)域數(shù)據(jù)信息資源建設(shè)工作,形成了一系列數(shù)據(jù)集、數(shù)據(jù)產(chǎn)品和基于數(shù)據(jù)的專業(yè)報(bào)告,并在線發(fā)布了豐富的可開(kāi)放獲取的涉農(nóng)數(shù)據(jù)信息資源。美國(guó)在涉農(nóng)數(shù)據(jù)開(kāi)放共享方面的做法對(duì)開(kāi)展數(shù)據(jù)信息資源建設(shè)工作,加速數(shù)字化轉(zhuǎn)型升級(jí),激發(fā)數(shù)據(jù)作為新型生產(chǎn)要素價(jià)值作用具有一定的參考價(jià)值。
美國(guó)根據(jù)其政府?dāng)?shù)據(jù)開(kāi)放法案[2]及循證決策法案[3]等有關(guān)條文要求,開(kāi)設(shè)了其政府?dāng)?shù)據(jù)門戶(Data.Gov)①https://www.data.gov并持續(xù)更新,政府機(jī)構(gòu)使用標(biāo)準(zhǔn)化的機(jī)器可讀數(shù)據(jù)格式在線開(kāi)放共享數(shù)據(jù)信息資源,并將元數(shù)據(jù)發(fā)布到數(shù)據(jù)門戶的數(shù)據(jù)目錄中,用以提升各方參與政府事務(wù)的互動(dòng)性、創(chuàng)造更多的經(jīng)濟(jì)發(fā)展機(jī)會(huì),為公共及私營(yíng)部門議事及決策提供數(shù)據(jù)支撐。
美國(guó)是對(duì)農(nóng)業(yè)數(shù)據(jù)收集比較齊全的國(guó)家,也是較早進(jìn)行農(nóng)業(yè)數(shù)據(jù)開(kāi)放的國(guó)家。目前,有關(guān)農(nóng)業(yè)數(shù)據(jù)的采集、共享和利用正對(duì)美國(guó)農(nóng)業(yè)政策制定者制定農(nóng)業(yè)部門發(fā)展的各種政策提供有力支持。不僅如此,美國(guó)各大農(nóng)場(chǎng)主協(xié)會(huì)以及涉農(nóng)企業(yè)也不惜投入大量的時(shí)間、金錢以及花費(fèi)巨大的精力去搜集被人們稱為“大數(shù)據(jù)”的涉農(nóng)數(shù)據(jù)[4]。影響作物生長(zhǎng)的因素有很多,如土壤、氣候、水分、品種、病蟲(chóng)害和雜草等,作物產(chǎn)量是這些因素的綜合結(jié)果,農(nóng)業(yè)從業(yè)者光憑經(jīng)驗(yàn)做出決策已遠(yuǎn)遠(yuǎn)不夠,需要依靠科學(xué)、概率和專業(yè)分析得出優(yōu)化決策[5]。美國(guó)政府?dāng)?shù)據(jù)門戶設(shè)置有農(nóng)業(yè)、氣候、生態(tài)系統(tǒng)、能源、地方政府、海上運(yùn)輸、海洋、老年健康等八大專題。農(nóng)業(yè)專題位列八大專題之首,內(nèi)設(shè)“更新”、“數(shù)據(jù)”、“應(yīng)用”、“開(kāi)發(fā)者”和“聯(lián)系”等欄目。其中,“更新”欄目匯集農(nóng)業(yè)生產(chǎn)、糧食安全、農(nóng)村發(fā)展、營(yíng)養(yǎng)、自然資源和區(qū)域糧食系統(tǒng)等有關(guān)的新聞信息;“數(shù)據(jù)”欄目可按主題、分類、數(shù)據(jù)類型、數(shù)據(jù)文件格式、機(jī)構(gòu)、發(fā)布者等對(duì)數(shù)據(jù)進(jìn)行過(guò)濾搜索查詢;“應(yīng)用”欄目列出了能夠幫助做出有關(guān)農(nóng)業(yè)、食品和營(yíng)養(yǎng)等明智決策的應(yīng)用程序;“開(kāi)發(fā)者”欄目鏈接到USDA網(wǎng)站的開(kāi)發(fā)者資源網(wǎng)頁(yè),可以獲取各有關(guān)部門提供的涉農(nóng)特色數(shù)據(jù)集、數(shù)據(jù)產(chǎn)品和web 服務(wù)等;“聯(lián)系”欄目可就農(nóng)業(yè)專題提出意見(jiàn)與問(wèn)題。
美國(guó)政府?dāng)?shù)據(jù)門戶2009 年5 月上線運(yùn)行[6],截至2020 年9 月15 日,數(shù)據(jù)目錄中可查詢到包括USDA等在內(nèi)199 個(gè)機(jī)構(gòu)在線發(fā)布的225 599 個(gè)數(shù)據(jù)集。其中,以USDA 機(jī)構(gòu)名義發(fā)布的數(shù)據(jù)集①https://catalog.data.gov/organization/usda-gov總計(jì)1808 個(gè),內(nèi)含396個(gè)標(biāo)記地理空間信息數(shù)據(jù)集。
美國(guó)政府?dāng)?shù)據(jù)門戶由美國(guó)總務(wù)管理局技術(shù)轉(zhuǎn)化服務(wù)中心建設(shè)和管理,技術(shù)開(kāi)發(fā)基于綜合知識(shí)檔案網(wǎng)絡(luò)(The Comprehensive Knowledge Archive Network,以下簡(jiǎn)稱CKAN)和WordPress兩個(gè)開(kāi)源框架,數(shù)據(jù)目錄中的元數(shù)據(jù)遵循開(kāi)放元數(shù)據(jù)架構(gòu)約定(字段信息包括標(biāo)題、描述、標(biāo)簽、更新情況、發(fā)布者、時(shí)間、聯(lián)系人情況等)。
CKAN 是開(kāi)放源碼數(shù)據(jù)資料入口平臺(tái),由Open Knowledge Foundation(OKF)支持發(fā)展,英國(guó)和澳大利亞政府?dāng)?shù)據(jù)門戶也基于此開(kāi)源框架。除了最重要的數(shù)據(jù)資料存取與發(fā)布外,CKAN 還支持可視化展示、標(biāo)記、搜索及過(guò)濾、分享、版本控制等,還有不少可擴(kuò)展插件,以滿足不同領(lǐng)域機(jī)構(gòu)組織的多樣化需求。CKAN使用以Python為基礎(chǔ)的Pylons網(wǎng)頁(yè)框架,數(shù)據(jù)庫(kù)使用PostgreSQL,搜索使用Apache Solr,采用Babel 支持多國(guó)語(yǔ)言(不過(guò)目前CKAN 對(duì)中文的支持并不友好,在字碼轉(zhuǎn)換和漢字識(shí)別上還存在不足)。WordPress 是一個(gè)免費(fèi)開(kāi)源的網(wǎng)站內(nèi)容管理系統(tǒng)(Content management system,CMS),用PHP 代碼編寫,并能夠與MySQL 或MariaDB 數(shù)據(jù)庫(kù)聯(lián)動(dòng),提供模板功能來(lái)支持頁(yè)面設(shè)計(jì),還可以通過(guò)插件形式拓展網(wǎng)站內(nèi)容管理功能。
美國(guó)政府在提高農(nóng)業(yè)勞動(dòng)生產(chǎn)率、保護(hù)農(nóng)業(yè)資源、宏觀調(diào)控農(nóng)業(yè)等方面取得了非常明顯的成績(jī),這與其得天獨(dú)厚的農(nóng)業(yè)自然資源相關(guān),也與農(nóng)業(yè)部門間高效組織、明確分工及一體化管理等因素密切相關(guān)[7]。USDA 網(wǎng)站②https://www.usda.gov的數(shù)據(jù)專題頁(yè)面介紹了USDA 數(shù)據(jù)治理大體情況,并給出了USDA 開(kāi)放數(shù)據(jù)目錄鏈接。USDA 成立了專門的數(shù)據(jù)治理機(jī)構(gòu),分別設(shè)置了數(shù)據(jù)治理指導(dǎo)委員會(huì)和數(shù)據(jù)治理咨詢委員會(huì)[8]來(lái)領(lǐng)導(dǎo)和實(shí)施其數(shù)據(jù)治理工作,設(shè)首席信息官辦公室(Office of Chief information officer,OCIO)負(fù)責(zé)總體信息技術(shù)戰(zhàn)略和管理。數(shù)據(jù)治理指導(dǎo)委員會(huì)成員包括首席數(shù)據(jù)官(主席)、首席評(píng)估官、首席統(tǒng)計(jì)官和有關(guān)任務(wù)領(lǐng)域的首席運(yùn)營(yíng)官;常設(shè)季度會(huì)議,以及主席確定的特別會(huì)議。數(shù)據(jù)治理咨詢委員會(huì)成員包括副首席數(shù)據(jù)官(主席),有關(guān)任務(wù)區(qū)域的助理首席數(shù)據(jù)官,來(lái)自監(jiān)察長(zhǎng)辦公室、隱私保護(hù)、地理空間計(jì)劃和資本規(guī)劃等有關(guān)方面的無(wú)表決權(quán)代表;常設(shè)每月例行會(huì)議,以及主席確定的特別會(huì)議。
USDA 構(gòu)建了以USDA 網(wǎng)站為主站,由USDA 直屬服務(wù)機(jī)構(gòu)網(wǎng)站、行政辦公室網(wǎng)站、專業(yè)服務(wù)網(wǎng)站組成的網(wǎng)站群信息服務(wù)體系[9]。USDA 開(kāi)放數(shù)據(jù)目錄①https://www.usda.gov/content/usda-open-data-catalog是公開(kāi)的USDA 數(shù)據(jù)的權(quán)威來(lái)源。USDA 有關(guān)機(jī)構(gòu)在網(wǎng)站設(shè)專題專欄在線發(fā)布各自業(yè)務(wù)領(lǐng)域數(shù)據(jù)及數(shù)據(jù)產(chǎn)品。其中,農(nóng)業(yè)市場(chǎng)服務(wù)局(Agricultural Marketing Service,以下簡(jiǎn)稱AMS)子網(wǎng)站可查詢業(yè)務(wù)清單和目錄(如全國(guó)農(nóng)貿(mào)市場(chǎng)目錄、國(guó)家食品中心目錄、有機(jī)認(rèn)證劑清單、國(guó)內(nèi)原產(chǎn)地驗(yàn)證參與者清單、批復(fù)的種子計(jì)劃、批復(fù)的有關(guān)出口計(jì)劃、牲畜飼養(yǎng)索賠審核參與者清單、出口加工蛋及蛋制品清單等),信息圖和可視化數(shù)據(jù)(如農(nóng)業(yè)與市場(chǎng)交互數(shù)據(jù)、當(dāng)?shù)睾蛥^(qū)域食品系統(tǒng)、消費(fèi)者標(biāo)簽和購(gòu)物提示等),微生物數(shù)據(jù),牛奶營(yíng)銷訂單統(tǒng)計(jì)數(shù)據(jù),國(guó)家棉花數(shù)據(jù),農(nóng)藥數(shù)據(jù),植物品種數(shù)據(jù)等;農(nóng)業(yè)研究服務(wù)局(Agricultural Research Service,以下簡(jiǎn)稱ARS)子網(wǎng)站發(fā)布有與營(yíng)養(yǎng)、食品質(zhì)量安全,動(dòng)物養(yǎng)殖與保護(hù),作物生產(chǎn)與保護(hù),自然資源與可持續(xù)農(nóng)業(yè)系統(tǒng)等有關(guān)的數(shù)據(jù)產(chǎn)品;營(yíng)養(yǎng)政策與促進(jìn)中心(Center for Nutrition Policy and Promotion,以下簡(jiǎn)稱CNPP)子網(wǎng)站列出了食品營(yíng)養(yǎng)計(jì)劃項(xiàng)目信息,兒童營(yíng)養(yǎng)數(shù)據(jù)表,食物分配計(jì)劃數(shù)據(jù)表,營(yíng)養(yǎng)援助計(jì)劃表,婦女、嬰兒和兒童營(yíng)養(yǎng)補(bǔ)充特別計(jì)劃數(shù)據(jù)表等;經(jīng)濟(jì)研究服務(wù)局(Economic Research Service,以下簡(jiǎn)稱ERS)子網(wǎng)站發(fā)布有農(nóng)業(yè)資源管理調(diào)查數(shù)據(jù),轉(zhuǎn)基因品種作物數(shù)據(jù),農(nóng)業(yè)與食品統(tǒng)計(jì)數(shù)據(jù),農(nóng)業(yè)基準(zhǔn)數(shù)據(jù)庫(kù),農(nóng)業(yè)貿(mào)易匯率數(shù)據(jù),美國(guó)農(nóng)業(yè)生產(chǎn)力數(shù)據(jù),農(nóng)產(chǎn)品生產(chǎn)和農(nóng)產(chǎn)品貿(mào)易對(duì)美國(guó)就業(yè)、經(jīng)濟(jì)產(chǎn)出的影響數(shù)據(jù),美國(guó)鄉(xiāng)村和小城鎮(zhèn)地圖集,商品成本與收益數(shù)據(jù),食源性疾病成本估算數(shù)據(jù),棉花、羊毛和紡織品數(shù)據(jù),縣級(jí)數(shù)據(jù)集,乳制品數(shù)據(jù),農(nóng)戶收入和特征數(shù)據(jù),農(nóng)場(chǎng)收入和財(cái)富統(tǒng)計(jì)數(shù)據(jù),飼料谷物數(shù)據(jù),化肥使用和價(jià)格數(shù)據(jù),糧食獲取研究圖集,糧食供應(yīng)量(人均)數(shù)據(jù),食物消費(fèi)及營(yíng)養(yǎng)攝入數(shù)據(jù),糧食價(jià)格展望及預(yù)警數(shù)據(jù),美國(guó)糧食安全監(jiān)測(cè)數(shù)據(jù),全國(guó)家庭食品購(gòu)置調(diào)查數(shù)據(jù),美國(guó)對(duì)外農(nóng)產(chǎn)品貿(mào)易數(shù)據(jù),果樹(shù)、堅(jiān)果數(shù)據(jù),水果和蔬菜價(jià)格數(shù)據(jù),國(guó)際農(nóng)業(yè)生產(chǎn)力數(shù)據(jù),國(guó)際農(nóng)產(chǎn)品供需及貿(mào)易基準(zhǔn)數(shù)據(jù),國(guó)際糧食安全評(píng)估數(shù)據(jù),畜牧和肉類國(guó)內(nèi)數(shù)據(jù),畜禽肉國(guó)際貿(mào)易數(shù)據(jù),主要土地用途數(shù)據(jù),農(nóng)產(chǎn)品從生產(chǎn)到消費(fèi)價(jià)差數(shù)據(jù),牛奶生產(chǎn)成本估算數(shù)據(jù),主要農(nóng)業(yè)投入和產(chǎn)出標(biāo)準(zhǔn)化價(jià)格數(shù)據(jù),小麥、水稻、油料、蔬菜、豆類、糖類等生產(chǎn)、供應(yīng)、消費(fèi)、貿(mào)易及價(jià)格數(shù)據(jù),季度居家食物價(jià)格數(shù)據(jù),城鄉(xiāng)結(jié)合體代碼,季節(jié)平均價(jià)格預(yù)測(cè)數(shù)據(jù),州出口數(shù)據(jù),有關(guān)人口、收入、貧困、糧食安全、教育、就業(yè)、農(nóng)場(chǎng)特征等國(guó)家級(jí)、州級(jí)數(shù)據(jù),美國(guó)生物能源統(tǒng)計(jì)數(shù)據(jù),美國(guó)食品進(jìn)口數(shù)據(jù)等;農(nóng)場(chǎng)服務(wù)局(Farm Service Agency,以下簡(jiǎn)稱FSA)提供的FSAfarm+系統(tǒng)可在線查詢公共土地?cái)?shù)據(jù)、相關(guān)農(nóng)場(chǎng)數(shù)據(jù)以及其他生產(chǎn)者信息,可為辦理貸款、保險(xiǎn)等業(yè)務(wù)提供參考;食品安全檢驗(yàn)服務(wù)局(Food Safety and Inspection Service,以下簡(jiǎn)稱FIS)子網(wǎng)站及時(shí)更新認(rèn)可實(shí)驗(yàn)室名單、實(shí)驗(yàn)室采樣數(shù)據(jù)、季度抽樣數(shù)據(jù)報(bào)告等;外國(guó)農(nóng)業(yè)服務(wù)局(Foreign Agricultural Service,以下簡(jiǎn)稱FAS)子網(wǎng)站提供按商品和目的地國(guó)家分類的每周更新的美國(guó)出口銷售信息(Exports Sales Reporting,以下簡(jiǎn)稱ESR),海外辦事處對(duì)影響農(nóng)業(yè)生產(chǎn)和貿(mào)易的問(wèn)題的見(jiàn)解和分析(Global Agricultural Information Network,以下簡(jiǎn)稱GAIN),有關(guān)農(nóng)產(chǎn)品、魚(yú)類、森林和紡織品國(guó)際貿(mào)易當(dāng)前和歷史數(shù)據(jù)系統(tǒng)(Global Agricultural Trade System,以下簡(jiǎn)稱GATS),有關(guān)美國(guó)以及主要生產(chǎn)國(guó)和消費(fèi)國(guó)的農(nóng)產(chǎn)品生產(chǎn)、供應(yīng)和配給數(shù)據(jù)(Production Supply and Distribution,以下簡(jiǎn)稱PSD)。美國(guó)最早的農(nóng)業(yè)科技合作項(xiàng)目就是由FAS 承擔(dān)的USDA 資助的植物收集,與原產(chǎn)國(guó)的合作方共同執(zhí)行[10]。
統(tǒng)計(jì)調(diào)查數(shù)據(jù)是美國(guó)涉農(nóng)數(shù)據(jù)的重要組成部分。美國(guó)國(guó)家農(nóng)業(yè)統(tǒng)計(jì)局(National Agricultural Statistical Service,以下簡(jiǎn)稱NASS)作為USDA 的專業(yè)統(tǒng)計(jì)機(jī)構(gòu),負(fù)責(zé)收集、分析和分發(fā)有關(guān)美國(guó)最新最全面的涉農(nóng)數(shù)據(jù),每年開(kāi)展上百項(xiàng)經(jīng)常性調(diào)查項(xiàng)目,每5 年進(jìn)行一次農(nóng)業(yè)普查,還參與建設(shè)其他國(guó)家的農(nóng)業(yè)統(tǒng)計(jì)系統(tǒng)。農(nóng)業(yè)普查涉及美國(guó)農(nóng)場(chǎng)和牧場(chǎng)及其經(jīng)營(yíng)者的全部數(shù)據(jù),通過(guò)農(nóng)業(yè)普查,生產(chǎn)者可以向全國(guó)展示農(nóng)業(yè)的價(jià)值和重要性,以影響決定美國(guó)農(nóng)業(yè)未來(lái)的決策。農(nóng)民和牧場(chǎng)主可以使用農(nóng)業(yè)普查數(shù)據(jù)幫助自己預(yù)估經(jīng)營(yíng)前景,進(jìn)而做出更為明智的決定;公司和合作社使用這些數(shù)據(jù)來(lái)為農(nóng)業(yè)生產(chǎn)者提供更好服務(wù);社區(qū)計(jì)劃者使用這些數(shù)據(jù)為農(nóng)村居民提供所需服務(wù);立法者在制定農(nóng)場(chǎng)政策和計(jì)劃時(shí)會(huì)使用相關(guān)的人口普查數(shù)據(jù)。
USDA 設(shè)有農(nóng)業(yè)統(tǒng)計(jì)咨詢委員會(huì),通過(guò)召開(kāi)由NASS 與世界農(nóng)業(yè)展望委員會(huì)(World Agricultural Outlook Board,以下簡(jiǎn)稱WAOB)、FSA、ERS、AMS、FAS以及美國(guó)人口普查局合作組織的數(shù)據(jù)用戶會(huì)議,使數(shù)據(jù)使用者了解對(duì)農(nóng)業(yè)重要的各種統(tǒng)計(jì)信息計(jì)劃最近和即將發(fā)生的變化,并征求對(duì)這些計(jì)劃的意見(jiàn)和建議。NASS 有關(guān)改善農(nóng)業(yè)統(tǒng)計(jì)的國(guó)際項(xiàng)目在幫助非洲、中南美洲、亞洲以及中歐和東歐的30 多個(gè)發(fā)展中國(guó)家和新興市場(chǎng)國(guó)家發(fā)展和改進(jìn)其農(nóng)業(yè)統(tǒng)計(jì)工作方面發(fā)揮了重要作用。通過(guò)幫助其他國(guó)家改善其農(nóng)業(yè)統(tǒng)計(jì)系統(tǒng),USDA 評(píng)估世界糧食和纖維產(chǎn)量的能力也得到了提高。與世界各地的其他農(nóng)業(yè)統(tǒng)計(jì)學(xué)家建立牢固的工作關(guān)系,進(jìn)而有機(jī)會(huì)收集改進(jìn)美國(guó)農(nóng)業(yè)統(tǒng)計(jì)系統(tǒng)的新思路,而接觸其他文化和工作環(huán)境則可以增強(qiáng)自身解決問(wèn)題的能力。
NASS 制定了數(shù)據(jù)調(diào)查工作指南,明確了數(shù)據(jù)范圍、內(nèi)容、頻率、方法和用途等。涉農(nóng)數(shù)據(jù)統(tǒng)計(jì)調(diào)查項(xiàng)目涉及:全國(guó)農(nóng)業(yè)分類調(diào)查,目標(biāo)產(chǎn)量,農(nóng)用化學(xué)品,農(nóng)產(chǎn)品價(jià)格及價(jià)格指數(shù),農(nóng)業(yè)資源管理,作物產(chǎn)量/庫(kù)存,蜜蜂和蜂蜜,肉雞孵化場(chǎng),現(xiàn)金租金,魚(yú)生產(chǎn),牛庫(kù)存,牛飼料,農(nóng)業(yè)普查,邊遠(yuǎn)地區(qū)農(nóng)業(yè)普查,水產(chǎn)養(yǎng)殖普查,園藝專業(yè)普查,雞和雞蛋,冷庫(kù),保護(hù)效果評(píng)估,棉花軋花,縣農(nóng)業(yè)生產(chǎn),作物進(jìn)度/條件,當(dāng)前農(nóng)業(yè)產(chǎn)業(yè)報(bào)告,乳制品和價(jià)格,農(nóng)場(chǎng)勞動(dòng),花藝,水果和堅(jiān)果,豬庫(kù)存,灌溉與水管理(以前是農(nóng)場(chǎng)和牧場(chǎng)灌溉),灌溉機(jī)構(gòu),六月區(qū)域(June Area),牲畜屠宰,當(dāng)?shù)厥称窢I(yíng)銷實(shí)踐,牛奶產(chǎn)量和所有牛奶價(jià)格,貂,苗圃和圣誕樹(shù)生產(chǎn),非農(nóng)谷物庫(kù)存,有機(jī)農(nóng)業(yè),家禽屠宰,綿羊和山羊庫(kù)存,鱒魚(yú)生產(chǎn),火雞,蔬菜,土地使用權(quán)、所有權(quán)和過(guò)渡。
以調(diào)查項(xiàng)目“六月區(qū)域(June Area)”為例進(jìn)行簡(jiǎn)要說(shuō)明。六月區(qū)域調(diào)查是國(guó)家農(nóng)業(yè)統(tǒng)計(jì)局(NASS)年度規(guī)模最大的調(diào)查項(xiàng)目之一,為整個(gè)調(diào)查計(jì)劃提供重要的實(shí)用工具。收集到的數(shù)據(jù)用于提供直接的面積估計(jì)和抽樣覆蓋率的度量。六月區(qū)域調(diào)查采用區(qū)域抽樣框架。除阿拉斯加外,所有州的區(qū)域框架均按土地用途劃分。基于土地面積的主要抽樣單位完全覆蓋了該土地上發(fā)生的所有農(nóng)業(yè)活動(dòng),因此也涵蓋了該州的所有經(jīng)營(yíng)者。從每個(gè)土地利用層次中選擇將近11 000個(gè)分區(qū)(較小單元大約2.6km2)作為樣本,以進(jìn)行數(shù)據(jù)收集。采訪在選定區(qū)域范圍內(nèi)運(yùn)營(yíng)的所有農(nóng)場(chǎng)經(jīng)營(yíng)者。在給定的年份中,在抽樣的細(xì)分范圍內(nèi)確定大約85 000 個(gè)農(nóng)業(yè)和非農(nóng)業(yè)土地使用區(qū)域。通過(guò)識(shí)別,將對(duì)在范圍邊界內(nèi)經(jīng)營(yíng)農(nóng)場(chǎng)或有資格成為農(nóng)場(chǎng)的農(nóng)民進(jìn)行35 000 多次詳細(xì)的個(gè)人訪談。每5 年,對(duì)3000 多個(gè)額外部分進(jìn)行抽樣,以作為人口普查的補(bǔ)充工作。
(1)項(xiàng)目?jī)?nèi)容。六月區(qū)域調(diào)查的目的是要說(shuō)明范圍邊界內(nèi)的每英畝土地,所有農(nóng)業(yè)活動(dòng)和土地用途。收集作物面積,谷物庫(kù)存,牲畜庫(kù)存,生豬庫(kù)存,綿羊庫(kù)存,家禽庫(kù)存,土地價(jià)值,現(xiàn)金租金,農(nóng)場(chǎng)編號(hào)和銷售收入數(shù)據(jù)。
(2)用途。現(xiàn)代農(nóng)業(yè)日益要求提供可靠,及時(shí)和詳細(xì)的信息。關(guān)于美國(guó)農(nóng)村的經(jīng)濟(jì)數(shù)據(jù)和統(tǒng)計(jì)數(shù)據(jù)變得越來(lái)越重要,六月區(qū)域調(diào)查在這些計(jì)劃領(lǐng)域中扮演著至關(guān)重要的角色。調(diào)查覆蓋的農(nóng)作物,牲畜和經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)有助于建立穩(wěn)定的經(jīng)濟(jì)氛圍,并降低生產(chǎn)、銷售和分銷業(yè)務(wù)的風(fēng)險(xiǎn)。
(3)頻率。六月區(qū)域調(diào)查每年進(jìn)行一次。
(4)方法。六月區(qū)域調(diào)查的數(shù)據(jù)收集完全在6 月的前兩周通過(guò)個(gè)人訪談完成。此外,被調(diào)查者必須檢查航空照片以識(shí)別每個(gè)田間邊界并報(bào)告種植的農(nóng)作物。種植面積數(shù)據(jù)是當(dāng)前作物年度數(shù)據(jù),而牲畜和種群數(shù)據(jù)是6月1日數(shù)據(jù)。
(5)其他。六月區(qū)域調(diào)查為多個(gè)遙感項(xiàng)目和地理信息系統(tǒng)研究與產(chǎn)品開(kāi)發(fā)提供了參考,同時(shí)也為其他研究項(xiàng)目提供支持。
NASS 僅發(fā)布聚合的統(tǒng)計(jì)數(shù)據(jù),而不發(fā)布單個(gè)或特定農(nóng)場(chǎng)的數(shù)據(jù)。快速統(tǒng)計(jì)系統(tǒng)①https://www.nass.usda.gov/Quick_Stats/Lite/index.php(Quick Stats System,以下簡(jiǎn)稱QSS)和人口普查數(shù)據(jù)查詢工具②https://www.nass.usda.gov/Quick_Stats/CDQT/chapter/1/table/1(Census Data Query Tool,以下簡(jiǎn)稱CDQT)是結(jié)構(gòu)化統(tǒng)計(jì)調(diào)查數(shù)據(jù)和農(nóng)業(yè)普查數(shù)據(jù)的最佳來(lái)源。快速統(tǒng)計(jì)系統(tǒng)可以按產(chǎn)品、位置或時(shí)間段等自定義查詢,在線獲取常用的統(tǒng)計(jì)數(shù)據(jù)信息,并能導(dǎo)出數(shù)據(jù)文件,提供應(yīng)用程序編程接口(Application Programming Interface,以下簡(jiǎn)稱API)對(duì)快速統(tǒng)計(jì)數(shù)據(jù)庫(kù)中統(tǒng)計(jì)數(shù)據(jù)信息的直接訪問(wèn),可以使用PHP、PERL 等任何支持HTTP GET 請(qǐng)求的編程語(yǔ)言調(diào)用數(shù)據(jù)接口。基于Web 的人口普查數(shù)據(jù)在線查詢工具,可用于訪問(wèn)和下載美國(guó)“農(nóng)業(yè)普查”出版物中人口等有關(guān)表格級(jí)數(shù)據(jù)。在NASS 子網(wǎng)站上發(fā)布的VegScape 工具可通過(guò)基于衛(wèi)星的美國(guó)作物狀況植被評(píng)估和監(jiān)測(cè)Web 服務(wù)提供數(shù)據(jù)服務(wù)和制圖能力,還列出了地理空間數(shù)據(jù)可視化查詢?nèi)肟冢刹榭吹乩砜臻g數(shù)據(jù)交互式地圖,如某些州的土地利用地層、農(nóng)田數(shù)據(jù)層、作物景觀、災(zāi)害分析等。
美國(guó)彰顯其涉農(nóng)領(lǐng)域影響力的重要方式之一是發(fā)布基于數(shù)據(jù)的專業(yè)報(bào)告。從數(shù)據(jù)到報(bào)告,USDA 有一套嚴(yán)密的工作機(jī)制[11]。USDA 發(fā)布的官方報(bào)告,都是在WAOB 組織下,由專門的委員會(huì)進(jìn)行審核發(fā)布,委員會(huì)對(duì)報(bào)告質(zhì)量負(fù)責(zé)。WAOB 協(xié)調(diào)美國(guó)農(nóng)業(yè)部的商品預(yù)測(cè)項(xiàng)目(包括商品供需預(yù)測(cè)和中長(zhǎng)期農(nóng)業(yè)展望等),監(jiān)測(cè)世界各地的自然災(zāi)害等情況,收集全球作物和畜牧業(yè)生產(chǎn)數(shù)據(jù)和進(jìn)出口信息等[12]。如月度《世界農(nóng)產(chǎn)品供需評(píng)估報(bào)告》(World Agricultural Supply and Demand Estimates Report,以下簡(jiǎn)稱WASDER)由WAOB 主持下的多個(gè)跨部門商品預(yù)測(cè)委員會(huì)(Interagency Commodity Estimates Committees,以下簡(jiǎn)稱ICECs)召開(kāi)閉門會(huì)議后發(fā)布。中長(zhǎng)期展望報(bào)告雖然由ERS 為主導(dǎo)進(jìn)行研究撰寫,但最終報(bào)告審核發(fā)布由WAOB 主持下的國(guó)際農(nóng)業(yè)預(yù)測(cè)委員會(huì)(International Agriculture predict Committee,以下簡(jiǎn)稱IAPC)負(fù)責(zé),成員來(lái)自WAOB、ERS、FAS 等11 個(gè)部門。報(bào)告的發(fā)布有明確的先后順序:每月的WASDER 是后續(xù)其他報(bào)告的起點(diǎn),月報(bào)發(fā)布后,ERS 及其他有關(guān)單位才會(huì)陸續(xù)發(fā)布更詳細(xì)的解讀報(bào)告以及農(nóng)場(chǎng)收入、食物價(jià)格預(yù)測(cè)、政策建議等報(bào)告;未來(lái)十年的展望報(bào)告用上年11 月的月度供需報(bào)告作為開(kāi)始點(diǎn),以確保短期報(bào)告和長(zhǎng)期報(bào)告的內(nèi)在一致性。
USDA 基于豐富的數(shù)據(jù)信息資源和強(qiáng)大的分析研究能力,出版發(fā)布有系列專業(yè)報(bào)告,可通過(guò)經(jīng)濟(jì)、統(tǒng)計(jì)和市場(chǎng)信息系統(tǒng)①https://usda.library.cornell.edu(Economics,Statistics and Market Information System,以下簡(jiǎn)稱ESMIS)獲取。ESMIS由美國(guó)康奈爾大學(xué)曼恩圖書(shū)館維護(hù),涵蓋美國(guó)和國(guó)際農(nóng)業(yè)及相關(guān)主題的2100 多種報(bào)告出版物,來(lái)自NASS、ERS、AMS、WAOB和FAS等機(jī)構(gòu)。
美國(guó)涉農(nóng)數(shù)據(jù)共享平臺(tái)①https://data.nal.usda.gov(Ag Data Commons)是存儲(chǔ)與糧食、農(nóng)業(yè)有關(guān)的研究數(shù)據(jù)的信息資料庫(kù),致力于實(shí)現(xiàn)政府資助的研究數(shù)據(jù)可公開(kāi)、可訪問(wèn)且可機(jī)讀,使得其既符合數(shù)據(jù)公開(kāi)要求,又能回應(yīng)公共訪問(wèn)需求。USDA 國(guó)家農(nóng)業(yè)圖書(shū)館(National Agricultural Library,以下簡(jiǎn)稱NAL)通過(guò)數(shù)據(jù)共享平臺(tái)提供數(shù)據(jù)服務(wù),使獲得USDA經(jīng)費(fèi)資助的項(xiàng)目數(shù)據(jù)和相關(guān)數(shù)據(jù)產(chǎn)品可查找、可獲取、可互操作和可重用。
涉農(nóng)數(shù)據(jù)共享平臺(tái)存儲(chǔ)的數(shù)據(jù)資源涉及農(nóng)學(xué)、基因組學(xué)、水文學(xué)、土壤、農(nóng)業(yè)生態(tài)系統(tǒng)、可持續(xù)性科學(xué)和經(jīng)濟(jì)統(tǒng)計(jì)等多學(xué)科,數(shù)據(jù)集標(biāo)識(shí)信息包含標(biāo)題、描述、作者和開(kāi)放作者身份標(biāo)識(shí)(Open Researcher and Contributor ID,以下簡(jiǎn)稱ORCID)、發(fā)行人、ISO 主題類別、時(shí)間、地理邊界、數(shù)據(jù)聯(lián)系人姓名和電子郵件、標(biāo)簽、相關(guān)代碼、許可、資金來(lái)源、資源標(biāo)題、資源文件格式、資源鏈接等信息。涉農(nóng)數(shù)據(jù)共享平臺(tái)對(duì)訪問(wèn)和使用的限制很小,用戶無(wú)需注冊(cè)帳戶或登錄即可訪問(wèn)、查詢、下載數(shù)據(jù)集,并能夠根據(jù)需要選擇使用所提供的數(shù)據(jù)分析軟件應(yīng)用工具(通常鏈接到外部托管的開(kāi)放源代碼)。涉農(nóng)數(shù)據(jù)共享平臺(tái)中所有數(shù)據(jù)均帶有開(kāi)放許可證,使用標(biāo)準(zhǔn)DKAN 端點(diǎn)提供所有已發(fā)布數(shù)據(jù)集及其元數(shù)據(jù)的JSON 列表,以供符合條件的數(shù)據(jù)被提取列入美國(guó)數(shù)據(jù)門戶相應(yīng)數(shù)據(jù)目錄中,提供的API 可查詢所存儲(chǔ)的所有數(shù)據(jù)。CKAN 和DKAN 是國(guó)內(nèi)學(xué)者研究的兩種主要開(kāi)源平臺(tái)[13]。DKAN 是受CKAN啟發(fā)的基于Drupal的開(kāi)放式數(shù)據(jù)平臺(tái)工具,提供了一個(gè)“data.json”索引來(lái)滿足美國(guó)政府對(duì)開(kāi)放項(xiàng)目數(shù)據(jù)的要求,使政府、非營(yíng)利組織和大學(xué)等能夠輕松地向公眾發(fā)布數(shù)據(jù),并由專門提供數(shù)字化服務(wù)的機(jī)構(gòu)CivicActions 進(jìn)行維護(hù)。DKAN 的設(shè)計(jì)目標(biāo)之一是使擁有廉價(jià)托管環(huán)境的任何人都可以輕松創(chuàng)建開(kāi)放數(shù)據(jù)目錄,能夠非常方便地對(duì)接到采用PHP 或Drupal技術(shù)框架的項(xiàng)目。
涉農(nóng)數(shù)據(jù)共享平臺(tái)上有專門頁(yè)面以圖表形式展示平臺(tái)月度運(yùn)營(yíng)指標(biāo)有關(guān)情況,比如注冊(cè)用戶數(shù)、數(shù)據(jù)集公開(kāi)量、下載量、搜索量等。截至2020 年8 月31日,涉農(nóng)數(shù)據(jù)共享平臺(tái)注冊(cè)用戶數(shù)為540,提交數(shù)據(jù)的注冊(cè)用戶數(shù)為169(占比31%);公開(kāi)數(shù)據(jù)集記錄3022 條;2015 年以來(lái)最高的月度下載量為2019 年11月份的4335;2020 年最高的月度搜索量為7 月份的1773。
從美國(guó)涉農(nóng)數(shù)據(jù)開(kāi)放共享情況可看出,美國(guó)涉農(nóng)數(shù)據(jù)類別多、內(nèi)容豐富、連續(xù)性強(qiáng)、容易獲取、方便分析處理,基于或圍繞數(shù)據(jù)形成了多種數(shù)據(jù)管理信息系統(tǒng)及系列數(shù)據(jù)產(chǎn)品,設(shè)置了專門的數(shù)據(jù)治理機(jī)制、機(jī)構(gòu),并且在法律層面作出了有關(guān)規(guī)定。特別是,美國(guó)對(duì)于政府涉密數(shù)據(jù)和政府非涉密但敏感數(shù)據(jù)的分類分級(jí)管理極大程度地平衡了數(shù)據(jù)開(kāi)放與數(shù)據(jù)安全之間的關(guān)系,還采用多種類型的數(shù)據(jù)授權(quán)協(xié)議促進(jìn)數(shù)據(jù)安全開(kāi)放與充分利用[14]。USDA 連續(xù)、及時(shí)公開(kāi)發(fā)布的生產(chǎn)、庫(kù)存、供需、消費(fèi)、進(jìn)出口、價(jià)格等涉農(nóng)數(shù)據(jù)信息,增強(qiáng)了市場(chǎng)透明度、提高了市場(chǎng)運(yùn)行服務(wù)效率。美國(guó)在國(guó)際涉農(nóng)領(lǐng)域的競(jìng)爭(zhēng)力和影響力,與其所開(kāi)展的涉農(nóng)數(shù)據(jù)信息資源建設(shè)工作成效密切相關(guān)。從全球范圍來(lái)看,未來(lái)的農(nóng)業(yè)技術(shù)競(jìng)爭(zhēng)將圍繞大數(shù)據(jù)展開(kāi),農(nóng)業(yè)的生產(chǎn)過(guò)程正被大數(shù)據(jù)深刻地影響[15]。未來(lái)10 年,美國(guó)將致力于推動(dòng)更快地收集、分析、存儲(chǔ)、共享和集成高度異構(gòu)的農(nóng)業(yè)生產(chǎn)數(shù)據(jù)集的能力,推動(dòng)農(nóng)業(yè)領(lǐng)域數(shù)據(jù)驅(qū)動(dòng)的發(fā)展[16]。全面、準(zhǔn)確、有效的數(shù)據(jù)能夠?yàn)榭茖W(xué)決策提供有力支撐,美國(guó)開(kāi)放共享的涉農(nóng)數(shù)據(jù)信息資源在日益積累,關(guān)注、跟蹤美國(guó)涉農(nóng)數(shù)據(jù)信息資源建設(shè)進(jìn)展、深入研究美國(guó)涉農(nóng)部門數(shù)據(jù)管理機(jī)制和所使用的技術(shù)工具,對(duì)開(kāi)展涉農(nóng)數(shù)據(jù)信息資源建設(shè)及管理工作具有積極意義。
農(nóng)業(yè)大數(shù)據(jù)學(xué)報(bào)2020年3期