广东省公共资源交易平台爬虫 https://ygp.gdzwfw.gov.cn/#/44/jygg

Go to file

广东省公共资源交易平台爬虫

本项目是一个 Python 爬虫程序，用于抓取广东省公共资源交易平台的中标结果公告。

功能特性

创建并激活虚拟环境 (推荐)

python3 -m venv venv
source venv/bin/activate  # macOS/Linux
# 或 venv\Scripts\activate  # Windows

直接运行脚本，程序将自动抓取发布日期为今天的“中标结果”公告。

python ygp_crawler.py

使用 --start-date 和 --end-date 参数（格式：YYYY-MM-DD）。

python ygp_crawler.py --start-date 2026-02-01 --end-date 2026-02-04

使用 -o 或 --output 参数指定输出 CSV 文件的路径（默认为 results.csv）。

python ygp_crawler.py --start-date 2026-02-01 --end-date 2026-02-04 -o my_data.csv

使用 -i 或 --incremental 参数启用增量爬取模式。脚本会自动读取已有 CSV 文件，计算时间范围，只抓取新数据。

自动计算日期范围（推荐）：

# 自动从已有数据的最新日期+1开始，爬取到今天
python ygp_crawler.py -i

手动指定日期范围：

# 在增量模式下手动指定日期范围
python ygp_crawler.py -i --start-date 2026-02-01 --end-date 2026-02-04

增量爬取特性：

{
  "项目标题": "某某项目中标结果公示",
  "发布时间": "2026-02-04 17:30:02",
  "详细链接": "https://ygp.gdzwfw.gov.cn/#/44/new/jygg/v3/A?noticeId=..."
}

项目标题,发布时间,详细链接
某某项目中标结果公示,2026-02-04 17:30:02,https://ygp.gdzwfw.gov.cn/#/44/new/jygg/v3/A?...