摘要:蔬菜是農民增收致富的“錢袋子”,也是城市居民餐桌上的“菜籃子”。京津冀協同發展下,動態監測蔬菜產銷信息對于穩固區域蔬菜供應、提升農業資源配置效率、增加農民收入以及推動區域一體化發展具有重要意義。本數據集匯聚了京津冀地區2021—2023年108種蔬菜的產銷數據,包括種植面積、種植方式、銷售價格、銷售數量、銷售去向、銷售渠道等。數據涵蓋京津冀地區83個區縣,415個微觀生產主體監測點,涉及蔬菜種植大戶、家庭農場、合作社和企業。本數據集可為該區域蔬菜種植規劃、產量與價格預測、市場供需等研究等提供數據支撐。

1引言
蔬菜是人類飲食結構中的重要組成部分,更是衡量一個國家或地區居民生活質量高低、營養健康水平優劣的關鍵性指標。國家統計數據顯示,2023年我國蔬菜產量達8.3億噸[1],年人均占有量約593公斤,基本實現蔬菜周年均衡供應與民眾對蔬菜多樣化需求。然而,蔬菜產業蓬勃發展、市場化程度不斷提升的同時也面臨一些風險和挑戰,特別是價格波動,不僅影響菜農的經濟收益、種植積極性和消費者的購買力,還威脅蔬菜市場的穩定與可持續發展。
因此,圍繞蔬菜價格的研究一直是學界研究的熱點問題。Cao[2]基于遼寧凌源黃瓜每日采購價格數據和北京新發地批發價格數據,研究分析了新鮮蔬菜供應鏈上的價格形成機制;李優柱[3]選取山東、北京產銷地5年的青椒、西紅柿價格日度數據,研究了極端氣溫沖擊下蔬菜產銷市場價格溢出效應;沈辰[4]基于全國重要批發市場28種蔬菜5年價格數據,運用季節分解和H-P濾波法,分析得出我國蔬菜批發價格波動4大類型,即趨勢波動、周期波動、季節波動和隨機波動。在價格預測方面,國內外學者基于不同尺度、不同品種的蔬菜價格數據,采用LSTM、BP、ARIMA、SARIMA等單一模型或多模型相結合來預測蔬菜價格[5-7],以期為生產者科學決策、相關政策制定等提供支撐。
京津冀是我國北方經濟最發達、人口最密集地區,區域農產品流通市場的分布存在較為顯著的空間依賴性。監測數據顯示,2022年北京市批發市場蔬菜上市量 60% 以上來自河北、山東省,其中7—9月份,外埠蔬菜供應中河北占據絕對主導地位,平均占比約 55.9%[8] 。將本區域視為一個有機整體實施蔬菜產銷信息統籌監測,對于確保本區域蔬菜供應的穩定性、推動農業資源的高效配置、促進農民增收以及區域協同發展均具有深遠的戰略意義與實踐價值。本數據集匯聚了京津冀地區微觀生產主體尺度蔬菜種植與產地銷售數據,可為該區域蔬菜種植規劃、產量與價格預測、市場供需研究等提供數據支撐。
2 數據采集與處理方法
2.1 監測點設置
京津冀蔬菜產銷監測旨在實時把握區域內蔬菜生產和銷售態勢,監測區域選擇充分考慮了區縣發展定位和蔬菜產業現狀,監測范圍力求廣泛覆蓋北京、天津和河北的蔬菜主要生產區縣。監測點選擇須具備以下條件,一是具有一定種植規模,一般不低于50畝;二是監測點要有代表性,所種植的蔬菜品種是當地大面積生產的大宗品種;三是監測點以蔬菜種植大戶、家庭農場、合作社、企業等經濟實體為主;四是監測點信息員有責任心,積極配合數據采集工作,確保數據的代表性、實用性和可持續性。北京地區每個區縣一般設置不少于10個監測點,天津、河北地區每個區縣一般設置不低于5個監測點,各區縣實際監測點數量根據實際數據采集情況動態調整。京津冀監測點區域分布詳見表1,共計涵蓋83個區縣,415個監測點。

2.2數據采集與處理
蔬菜產銷數據采集分為兩個階段,即生產數據采集和銷售數據采集,由監測點根據蔬菜種植品種、茬口進行數據采集報送。某個品種蔬菜定植后啟動生產數據采集,若該品種幾次定植日期相隔較近(界定為5天以內),可算為一個茬口,作為一條生產數據采集;蔬菜第一次上市銷售后進行銷售數據采集,對于持續采摘上市銷售的蔬菜品種,以全部采摘銷售完成結束銷售數據采集,對于一次或者兩次即完成采摘收獲并監測點自行儲存的品種,以賣出該品種所有儲存蔬菜,作為本品種本茬口蔬菜銷售數據采集結束的時間點。生產數據與銷售數據之間是一對多的關系,一條生產數據對應多條銷售數據。
3 數據內容
本數據集包含京津冀2021—2023年108種蔬菜的產銷數據,共計18.7萬余條。生產數據項包括種植品種、種植面積、定植日期、品質、種植方式,銷售數據包括上市日期、銷售日期、銷量、銷售價格、銷售去向、銷售渠道。其中,銷售去向主要是了解蔬菜在京津冀區域內部以及區域外的分銷情況,包括銷往河北、銷往北京、銷往天津和銷往其他省市4種銷售去向,各種銷售去向比例加和為 100% ;銷售渠道主要指蔬菜賣給了誰,包括經紀人、菜市場、批發市場、超市、合作社、網絡、機關學校食堂、其他等8種常規渠道,各種銷售渠道比例加和為 100% 。日期類數據格式為年-月-日(YYYY-MM-DD),種植面積、銷量、銷售價格數據單位分別為畝、斤、元/斤,銷售去向和銷售渠道數據單位為 % 。數據集部分示例數據如表2所示。

4數據質量控制與評估
4.1規范數據采集
制定京津冀蔬菜監測點產銷數據采集規范,明確數據采集要求,對數據采集方式和時效性作出統一、明確的規定,確保數據采集的規范性和一致性。搭建京津冀蔬菜產銷管理系統,方便監測點數據采集和數據審核、管理。保持數據采集人員相對固定,人員變更及時進行數據采集培訓,保證數據采集質量。
4.2數據審核與校驗
固定專人進行數據核驗,特別是針對銷售價格以超過近期平均銷售價格 50% 作為異常值判斷閾值,進行數據人工確認。一般采用歷史數據對比和電話核驗兩種方式,確保數據的準確性與合理性。
5 數據價值與使用建議
本數據集通過微觀生產主體尺度的產銷數據采集,形成了產銷一體化數據鏈條,精準反映了蔬菜生產種植與銷售動態。數據集數據精度與時效性均較高,彌補了傳統宏觀統計數據的不足。與政府發布的批發市場蔬菜價格數據相結合,可以構建形成“生產端-流通端”雙維數據協同的實時市場監測與預警體系。
本數據集不僅能夠支持農業生產規劃、市場趨勢預測、種植結構優化等傳統農業經濟研究,還可為產量與價格預測、市場供需分析、供應鏈優化等提供關鍵數據支撐。其中的特色數據,銷售去向數據能夠精準追蹤蔬菜流向,對于量化分析區域間供需匹配度有重要價值;銷售渠道數據基本全覆蓋當前蔬菜銷售全渠道,對于渠道趨勢分析、渠道效率對比以及銷售策略優化等有重要作用。此外,數據集在政策評估、農民生計研究、區域經濟發展分析等領域也具有一定應用潛力,結合機器學習、大數據挖掘、GIS等技術,可以推動數據驅動的農業科學研究與創新應用。
本數據集在持續更新,能夠動態捕捉蔬菜產業的實時變化,為長期研究提供了可靠的數據基礎。
6 數據可用性
開放訪問,遵從CCBY-NC-ND4.0協議。
https://cstr.cn/17058.11.sciencedb.agriculture.00193;
https://doi.org/10.57760/sciencedb.agriculture.00193。
數據作者分工職責
陳麗,論文撰寫與修改。
王劍,數據采集工作部署協調。
趙安平,數據采集方案與論文架構設計。
王曉東,論文架構設計與修改完善。
劉娟,數據質量控制。
王詩睿、寧曉涵,數據審核與校驗。
王增飛、楊唯佳,數據整理與分析。
倫理聲明
本文數據不涉及倫理聲明相關的內容。
利益沖突聲明
作者聲明,全部作者均無會影響研究公正性的財務利益沖突或個人利益沖突。
參考文獻
[1] 國家統計局:農業發展闊步前行現代農業譜寫新篇- -新中國75 年經濟社會發展成就系列報告之二.htps://www.stats.gov.cn/sj/ sjjd/202409/t20240910_1956334.html
[2] CAOYL,MOHIUDDIN M. Sustainable emerging country agro-food supplychains:fresh vegetable price formation mechanismsinrural China.Sustainability,2019,11(10):2814.https://doi.org/10.3390/ su11102814
[3] 李優柱,付輝,楊鴻宇.蔬菜產銷市場價格波動溢出效應研究:基于極 端氣溫沖擊視角.農林經濟管理學報,2023,22(3):311-321.
[4] 沈辰,張玉梅,李志強.我國不同類型蔬菜價格波動分解與貢獻分析. 中國蔬菜,2015,1(5):52.
[5] 彭紅星,鄭楷航,黃國彬,等.基于BP、LSTM和ARIMA模型的蔬菜 價格預測.中國農機化學報,2020,41(4):193-199.
[6] LIYZ,LICG,ZHENGMY.Ahybrid neural networkandH-Pfilter modelfor short-term vegetable price forecasting.Mathematical Problemsin Engineering,2014.DOI:10.1155/2014/135862.
[7] LIB,DINGJQ,YINZQ,etal.Optimized neural network combined model based on the induced ordered weighted averagingoperator for vegetableprice forecasting.Expert Systems with Applications,2021, 168.DOI:10.1016/j.eswa.2020.114232.
[8] 趙安平,趙友森,王曉東,等.北京市蔬菜供需平衡研究.中國農業信 息,2023,35(2):53-62. 引用格式:陳麗,王劍,趙安平,王曉東,劉娟,王詩睿,寧曉涵,王增飛,楊唯佳.2021-2023年京津冀蔬菜產銷監測數據集[J].農業大數據學報,2025,2):
276-280. DOI: 10.19788/j.issn.2096-6369.100054. CITATION:CHENLiWANGJian,ZHAOAnPing,WANGXiaoDong,LIUJuan,WANGSiRuiNNGXiaoHanWANGZengFei,YANGWei MonitoringDatasetofVegetableProductioandSalesinBeijing-Tanjin-HebeiRegion(2-023)[J].JoualofAgriculturalBigData
2025,7(2):276-280. DOI: 10.19788/j.issn.2096-6369.100054.
Abstract: Vegetables areoneoftheimportantsupporting industriesforagricultureandruraleconomyand alsoan important componentofthe\"vegetablebasket\"forurbanandruralresidents.UnderthecoordinateddevelopmentoftheBeijing-Tianjin-Hebei region,dynamicmonitoringofvegetableproductionandsalesiformationisofgeatsignficanceforstabilzingregionalvegetable supply,improvingagriculturalresourcealocationeficiencyincreasingfarmers'income,andpromotingregionalintegration development.This dataset gathersthe productionandsalesdataof108 types ofvegetables intheBeijing-Tianjin-Hebei region from 2021to023,includingdataindicatorssuchasplantingarea,plating method,sales price,salesquantitysales destiatio,sales chanels,etc.Thedatacovers83districtsandcountiesinheBeijing-Tianjin-Hebeiregion,with415microproductionetitis selectedamotongpoitsdggetableroersfmilysoperatiesdterprss.Tisatasetanrodedata support for vegetable planting planning,yield and priceforecasting, market supplyand demandresearch, etc.intheregion.
Keywords: vegetable; production and sales monitoring;Beijing-Tianjin-Hebei region
