当前位置: 首页 > article >正文

python集成inotify-rsync实现跨服务器文件同步

1、实现功能

        通过结合 Python 的 watchdog 库(类似 Linux 的 inotify 机制)和 rsync 命令,实现了文件系统变化的实时监控和增量同步。下面详细解释其工作原理和运行方式:

2、核心工作原理

2.1、文件监控

        使用watchdog库监控源目录的文件变化(创建、修改、删除、移动)。

        1)监听事件类型:modified、created、deleted、moved;

        2)所有变更会被收集到pending_changes集合中,避免重复处理。

2.2、增量同步

        通过rsync命令将变化的文件同步到远程服务器:

        1)使用--delete参数确保目标目录与源目录完全一致。

        2)通过--exclude参数支持忽略特定文件或目录(如临时文件、日志)。

2.3、事件合并

        设置 1 秒的延迟(sync_delay),将短时间内的多次变更合并为一次同步操作,减少不必要的网络传输。

3、环境准备

Step1、python环境

# 1. 安装 rsync 
sudo apt update -y 
sudo apt install rsync -y # 2. 验证安装 
rsync --version

Step2、python环境

pip install watchdog # 用于文件监控

Step3、主机环境

SSH相关操作:

        将本机公钥内容添加到被连接的目标主机 ~/.ssh/authorized_keys 文件中。其中,authorized_keys文件权限要可读写;

# SSH秘钥对生成
ssh-keygen -t rsa -b 4096 -C "your_name" # 生成ssh-key# 如何实现ssh免密登录
方案1:
ssh-copy-id -i id_rsa_linux.pub name@ip # 将本机公钥内容就添加到服务器authorized_keys文件中了,name@ip为远程主机用户名、IP方案2:
将本机公钥id_rsa.pub拷贝到远程目标主机
cat id_rsa.pub >> ~/.ssh/authorized_keys # 将公钥添加到authorized_keys
chmod -R 600 ~/.ssh/authorized_keys # 添加权限# SSH秘钥连接测试是否成功
ssh name@ip 

4、示例代码

#!/usr/bin/env python3
# coding: utf-8
"""
pip install watchdog  # 用于文件监控
sudo apt install rsync -y
"""import os
import time
import subprocess
import logging
import argparse
from pathlib import Path
from watchdog.observers import Observer
from watchdog.events import FileSystemEventHandler, FileSystemMovedEvent, EVENT_TYPE_MODIFIED, EVENT_TYPE_CREATED, \EVENT_TYPE_DELETED, EVENT_TYPE_MOVED# 配置日志
logging.basicConfig(level=logging.INFO,format='%(asctime)s - %(levelname)s - %(message)s',handlers=[logging.FileHandler("sync_monitor.log"),logging.StreamHandler()]
)class RsyncHandler(FileSystemEventHandler):def __init__(self, source_dir, target_host, target_dir, exclude_patterns=None, ssh_key=None):self.source_dir = os.path.abspath(source_dir)self.target_host = target_hostself.target_dir = target_dirself.exclude_patterns = exclude_patterns or []self.ssh_key = ssh_keyself.last_sync_time = time.time()self.pending_changes = set()self.sync_delay = 1  # 合并1秒内的变更def enqueue_change(self, event):"""将变更加入待处理队列"""path = event.src_pathif isinstance(event, FileSystemMovedEvent):path = event.dest_pathrel_path = os.path.relpath(path, self.source_dir)self.pending_changes.add(rel_path)# 安排延迟同步,合并短时间内的多次变更if time.time() - self.last_sync_time > self.sync_delay:self.perform_sync()def on_modified(self, event):if not event.is_directory:logging.info(f"修改: {event.src_path}")self.enqueue_change(event)def on_created(self, event):logging.info(f"创建: {event.src_path}")self.enqueue_change(event)def on_deleted(self, event):logging.info(f"删除: {event.src_path}")self.enqueue_change(event)def on_moved(self, event):logging.info(f"移动: {event.src_path} -> {event.dest_path}")self.enqueue_change(event)def build_rsync_command(self):"""构建rsync命令"""cmd = ["rsync", "-avz", "--delete"]# 添加排除模式for pattern in self.exclude_patterns:cmd.extend(["--exclude", pattern])# 添加SSH密钥选项if self.ssh_key:cmd.extend(["-e", f"ssh -i {self.ssh_key}"])# 添加源目录和目标cmd.extend([f"{self.source_dir}/", f"{self.target_host}:{self.target_dir}/"])return cmddef perform_sync(self):"""执行rsync同步"""if not self.pending_changes:returnlogging.info(f"同步变更: {', '.join(self.pending_changes)}")self.pending_changes.clear()try:cmd = self.build_rsync_command()logging.debug(f"执行命令: {' '.join(cmd)}")result = subprocess.run(cmd,capture_output=True,text=True,check=True)logging.info(f"同步成功: {result.stdout.strip()}")self.last_sync_time = time.time()except subprocess.CalledProcessError as e:logging.error(f"同步失败: {e.stderr.strip()}")except Exception as e:logging.error(f"发生错误: {str(e)}")def main():parser = argparse.ArgumentParser(description="文件同步监控工具 (Inotify + Rsync)")parser.add_argument("source", help="源目录路径")parser.add_argument("target_host", help="目标主机 (user@host)")parser.add_argument("target_dir", help="目标目录路径")parser.add_argument("-e", "--exclude", action="append", help="排除模式 (可重复使用)")parser.add_argument("-k", "--ssh-key", help="SSH私钥路径")parser.add_argument("-i", "--initial-sync", action="store_true", help="启动时执行初始同步")args = parser.parse_args()# 验证源目录存在source_dir = os.path.abspath(args.source)if not os.path.isdir(source_dir):logging.error(f"源目录不存在: {source_dir}")returnlogging.info(f"开始监控目录: {source_dir}")logging.info(f"目标服务器: {args.target_host}:{args.target_dir}")# 创建事件处理器event_handler = RsyncHandler(source_dir,args.target_host,args.target_dir,args.exclude,args.ssh_key)# 执行初始同步if args.initial_sync:logging.info("执行初始同步...")event_handler.perform_sync()# 创建观察者observer = Observer()observer.schedule(event_handler, path=source_dir, recursive=True)observer.start()try:while True:time.sleep(1)except KeyboardInterrupt:observer.stop()observer.join()if __name__ == "__main__":main()
http://www.lryc.cn/news/2396079.html

相关文章:

  • 005 ElasticSearch 许可证过期问题
  • Spring AI 系列之使用 Spring AI 开发模型上下文协议(MCP)
  • [Python] Python运维:系统性能信息模块psutil和系统批量运维管理器paramiko
  • Linux 简单模拟实现C语言文件流
  • ArcPy错误处理与调试技巧(3)
  • 小程序使用npm包的方法
  • Asp.Net Core SignalR的协议协商问题
  • Rust 学习笔记:发布一个 crate 到 crates.io
  • 剪枝中的 `break` 与 `return` 区别详解
  • Spring Boot 4.0实战:构建高并发电商系统
  • Vert.x学习笔记-EventLoop与Context的关系
  • 2025030给荣品PRO-RK3566开发板单独升级Android13的boot.img
  • 由enctype-引出post与get的关系,最后深究至请求/响应报文
  • 排序算法衍生问题
  • Mac电脑上本地安装 redis并配置开启自启完整流程
  • STP(生成树协议)原理与配置
  • 搭建基于VsCode的ESP32的开发环境教程
  • 【MFC】初识MFC
  • C++.二分法教程
  • 如何通过数据分析优化项目决策
  • 2024年数维杯国际大学生数学建模挑战赛B题空间变量协同估计方法研究解题全过程论文及程序
  • leetcode hot100刷题日记——34.将有序数组转换为二叉搜索树
  • thinkphp 5.1 部分知识记录<一>
  • RAG:面向知识密集型自然语言处理任务的检索增强生成
  • MVVM、MVC的区别、什么是MVVM
  • 网页自动化部署(webhook方法)
  • 线性代数入门:轻松理解二阶与三阶行列式的定义与理解
  • AU6825集成音频DSP的2x32W数字型ClaSSD音频功率放大器(替代TAS5825)
  • 华为云Flexus+DeepSeek征文|DeepSeek-V3/R1商用服务体验全流程
  • Go语言的原子操作