中国环境空气数据集 - 少样本空气污染源解析研究用
| 数据集 | 路径 | 说明 | 时间范围 | 文件数 |
|---|---|---|---|---|
| CHAP | CHAP/ | 中国高分辨率空气质量月均值数据 | 2019-2024 | 432 |
| CN-air | CN-air/ | 中国城市空气质量监测数据 | 2019-2024 | 6 |
| Source Profiles | source_profiles/ | 各类污染源成分谱 | - | 21 |
| ERA5-GEE | era5_gee/ | 气象再分析数据(月均) | 2019-2024 | 72 |
6种污染物月均值网格数据,分辨率约0.01°:
| 污染物 | 变量名 | 文件命名 | 大小 |
|---|---|---|---|
| PM2.5 | CHAP_PM2.5 | CHAP_PM25_M1K_YYYYMM_V*.nc | ~464 MB |
| PM10 | CHAP_PM10 | CHAP_PM10_M1K_YYYYMM_V*.nc | ~596 MB |
| CO | CHAP_CO | CHAP_CO_M1K_YYYYMM_V*.nc | ~261 MB |
| SO2 | CHAP_SO2 | CHAP_SO2_M1K_YYYYMM_V*.nc | ~394 MB |
| NO2 | CHAP_NO2 | CHAP_NO2_M1K_YYYYMM_V*.nc | ~435 MB |
| O3 | CHAP_O3 | CHAP_O3_M1K_YYYYMM_V*.nc | ~485 MB |
空间范围: 73.46°E - 134.93°E, 17.97°N - 53.67°N
NC文件结构:
lat: float32[nlat=3571]
lon: float32[nlon=6148]
{污染物}: uint16[nlat, nlon] # 月均浓度 (μg/m³)| 文件 | 时间范围 | 说明 |
|---|---|---|
城市_20190101-20191231.parquet | 2019 | 城市级空气质量日均值 |
城市_20200101-20201231.parquet | 2020 | 同上 |
城市_20210101-20211231.parquet | 2021 | 同上 |
城市_20220101-20221231.parquet | 2022 | 同上 |
城市_20230101-20231231.parquet | 2023 | 同上 |
城市_20240101-20241231.parquet | 2024 | 同上 |
Parquet Schema: 城市, 日期, AQI, PM2.5, PM10, SO2, NO2, CO, O3 等
源解析研究所需的各类污染源成分谱数据(PM, 常规组分, 有机组分, 气态组分等):
| 类别 | 文件数 |
|---|---|
| 工业燃烧源 | 2 |
| 工业工艺过程 | 1 |
| 民用燃烧源 | 6 |
| 生物质燃烧 | 1 |
| 畜牧源 | 1 |
| 道路移动源 | 1 |
| 非道路移动源 | 4 |
| PM源谱(5类) | 5 |
来源: Google Earth Engine ECMWF/ERA5_LAND/DAILY_AGGR 逐日聚合后按月平均
分辨率: 25000m (约0.25°)
| GEE变量名 | 说明 |
|---|---|
temperature_2m | 2m气温 (K) |
dewpoint_temperature_2m | 2m露点温度 (K) |
u_component_of_wind_10m | 10m东向风 (m/s) |
v_component_of_wind_10m | 10m北向风 (m/s) |
surface_pressure | 地面气压 (Pa) |
total_precipitation_sum | 总降水量 (m) |
surface_solar_radiation_downwards_sum | 地表下行短波辐射 (J/m²) |
区域: 73.5°E - 135.0°E, 17.97°N - 73.5°N
下载方式: GEE JavaScript代码导出到Google Drive
git clone https://atomgit.com/GewisLab/CNEnvAir.git
cd CNEnvAirNetCDF (CHAP):
import xarray as xr
ds = xr.open_dataset("CHAP/CHAP_PM25_NC/CHAP_PM2.5_M1K_201901_V4.nc")
pm25 = ds["PM2.5"].values # numpy array
print(ds)Parquet (CN-air):
import pandas as pd
df = pd.read_parquet("CN-air/城市_20190101-20191231.parquet")
print(df.head())源成分谱:
import pandas as pd
df = pd.read_parquet("source_profiles/PM_source_Industrial_boiler.parquet")
print(df.head())ERA5 TIF:
import rasterio
with rasterio.open("era5_gee/era5_201901.tif") as src:
data = src.read()
print(src.crs)| 格式 | 适用场景 | 优势 |
|---|---|---|
.nc (NetCDF) | 栅格/网格数据 | 自描述,跨平台 |
.parquet | 表格/站点数据 | 列式存储,压缩率高 |
.tif (GeoTIFF) | 栅格数据 | GIS兼容 |
如使用本数据集,请注明来源。
如有数据问题,请提交Issue。