当前位置: 首页 > news >正文

# 自动定时运行Python爬虫脚本教程(Windows任务计划程序)

一、环境准备

  • 操作系统:Windows 10 或以上
  • Python版本:3.6及以上(示例用的是D:\python\python.exe
  • 依赖库:requests, beautifulsoup4, lxml
    安装命令:
    pip install requests beautifulsoup4 lxml
    

* Python脚本路径示例:`Y:\0 数据汇总\农业干旱监测日报\download_drought.py`---## 二、Python脚本示例```python
import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin
from datetime import datetime
import osURL = "https://www.nmc.cn/publish/agro/disastersmonitoring/Agricultural_Drought_Monitoring.htm"
SAVE_DIR = r"Y:\0 数据汇总\农业干旱监测日报"
os.makedirs(SAVE_DIR, exist_ok=True)def download_image():headers = {"User-Agent": "Mozilla/5.0"}try:r = requests.get(URL, headers=headers, timeout=10)r.raise_for_status()soup = BeautifulSoup(r.content, "lxml")# 精确定位图片标签img_tag = soup.select_one("div:nth-of-type(1) > div:nth-of-type(2) > img")if not img_tag:print("未找到图片")returnimg_url = urljoin(URL, img_tag['src'])print("图片URL:", img_url)timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")file_name = f"drought_monitor_{timestamp}.jpg"save_path = os.path.join(SAVE_DIR, file_name)img_data = requests.get(img_url, headers=headers).contentwith open(save_path, "wb") as f:f.write(img_data)print(f"保存成功:{save_path}")except Exception as e:print("下载失败:", e)if __name__ == "__main__":download_image()
```---## 三、用任务计划程序定时运行Python脚本### 1. 编写批处理文件(可选)创建一个批处理文件 `run_download.bat`,内容:```bat
D:\python\python.exe "Y:\0 数据汇总\农业干旱监测日报\download_drought.py"
pause
```* `D:\python\python.exe` 替换为你的Python解释器路径
* 也可以直接任务计划里调用python执行脚本,不必须用批处理---### 2. 打开任务计划程序* 按`Win`键,输入“任务计划程序”,点击打开---### 3. 创建基本任务* 右侧点击“创建基本任务...”
* 输入任务名称,例如“每日农业干旱监测图片下载”,点击“下一步”---### 4. 触发器设置* 选择触发时间:每天 / 每周 / 开机时 等,根据需要选择
* 设置具体时间,例如每天08:00,点击“下一步”---### 5. 操作设置* 选择“启动程序”,点击“下一步”* 程序或脚本:如果用批处理,填写批处理文件完整路径,如:```Y:\0 数据汇总\农业干旱监测日报\run_download.bat```如果直接调用Python:```D:\python\python.exe```* 添加参数(可选,如果直接调用Python执行脚本,这里填写Python脚本路径):```"Y:\0 数据汇总\农业干旱监测日报\download_drought.py"```* 起始位置(可选)填写Python脚本所在目录:```Y:\0 数据汇总\农业干旱监测日报```* 点击“下一步”---### 6. 完成任务创建* 查看设置确认无误,点击“完成”---### 7. 测试任务* 在任务计划程序库找到刚建的任务
* 右键点击 → “运行”
* 查看任务运行情况,确认图片已下载至指定目录---## 四、注意事项* 路径中包含空格或中文时,尽量使用双引号括起来
* 确保Python解释器路径正确,且Python环境已安装依赖库
* 任务执行用户应有访问文件夹权限
* 若遇权限问题,任务属性中“使用最高权限运行”可尝试勾选---这样,你就可以通过Windows任务计划程序,实现定时自动运行Python爬虫脚本,自动下载目标图片并保存。---如果需要,我可以帮你写批处理脚本或远程调试具体问题。```
```
http://www.lryc.cn/news/609827.html

相关文章:

  • 项目实战二:RPC
  • 17.6 超拟人大模型CharacterGLM技术解析:92.7%角色一致性+虚拟偶像互动提升300%,如何吊打GPT-4?
  • C++-异常
  • Python----大模型(量化 Quantization)
  • MySQL详解(一)
  • 从零开始的云计算生活——项目实战
  • 商标续展如果逾期了还有办法补救吗?
  • 消息系统技术文档
  • 学习嵌入式第十九天
  • 系统一个小时多次Full GC,导致系统线程停止运行,影响系统的性能,可靠性
  • 靶场(二十八)---小白心得靶场体会---Mantis
  • 前端VUE基础环境搭建
  • STM32_Hal库学习SPI
  • ctfshow:pwn85(高级ROP 64 位 Partial-RELRO)、pwn141
  • 探访WAIC2025:当AI成为双刃剑,合合信息如何破解真假难题
  • ZYNQ-按键消抖
  • 如何在 Ubuntu 24.04 LTS 上安装 Docker
  • Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现路口车辆速度的追踪识别(C#代码UI界面版)
  • Apache Spark 的结构化流
  • bypass
  • 基于PSO-NSGAIII混合优化的生产调度算法matlab仿真,输出甘特图,对比PSO和NSGAIII
  • 开源的现代数据探索和可视化平台:Apache Superset 从 PyPI 安装 Superset
  • 基于深度学习的医学图像分析:使用PatchGAN实现医学图像分割
  • 优选算法 力扣 11. 盛最多水的容器 双指针降低时间复杂度 贪心策略 C++题解 每日一题
  • AI开灯的几种方法,与物理世界的交互过渡
  • AUTOSAR CP:深度揭秘APPL层(Application Layer)!SWC分配策略与端口交互的终极指南
  • 交叉验证:原理、作用与在机器学习流程中的位置
  • LeetCode 135:分糖果
  • lodash的替代品es-toolkit详解
  • 认识爬虫 —— xpath提取