阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

Linux下使用rsync同步目录

115次阅读
没有评论

共计 2581 个字符,预计需要花费 7 分钟才能阅读完成。

本文描述了 Linux 下使用 rsync 单向同步两个机器目录的问题。使用 rsync 同步后可以保持目录的一致性(含删除操作)。

数据同步方式

从主机拉数据

备机上启动的流程

同步命令:

rsync -avzP --delete root@{remoteHost}:{remoteDir} {localDir}

参数说明:

-a 参数,相当于 -rlptgoD(-r 是递归 -l 是链接文件,意思是拷贝链接文件;-p 表示保持文件原有权限;-t 保持文件原有时间;-g 保持文件原有用户组;-o 保持文件原有属主;-D 相当于块设备文件);-z 传输时压缩;-P 传输进度;-v 传输时的进度等信息;

示例:

rsync -avzP --delete root@192.168.1.100:/tmp/rtest1 /tmp/

向备机推数据

主机上启动的流程

同步命令:

rsync -avzP --delete {localDir} root@{remoteHost}:{remoteDir}

示例:

rsync -avzP --delete /tmp/rtest1 root@192.168.1.101:/tmp/

自动同步配置

描述同步时不输入密码的配置的方法。

使用 ssh key

该方法可以直接使用 rsync 命令进行同步,同步过程中无需输入密码

  • 在主机上产生 ssh key :

    ssh-keygen -t rsa

  • 在备机上加入 pubkey

    ssh-copy-id -i ~/.ssh/id_rsa.pub root@192.168.1.101

    或者手动添加:

    在主机上执行以下命令获取 pubkey:

    cat ~/.ssh/id_rsa.pub
    

    在备机上加入 key 内容:

    vi ~/.ssh/authorized_keys
    

使用 pexpect 自动输入密码

示例代码如下:

#!/usr/bin/env Python
# -*- coding: utf-8 -*-

import pexpect
import time
import traceback

def doRsync(user,passwd,ip,srcDir,dstDir,timeout=3600):
    cmd = "rsync -azPq --delete {srcDir} {rUser}@{rHost}:{dstDir}".format(rUser = user,rHost=ip,srcDir=srcDir,dstDir=dstDir)
    try:
        ssh = pexpect.spawn(cmd,timeout=timeout)
        print cmd
        i = ssh.expect(['password:', 'continue connecting (yes/no)?'], timeout=5)
        if i == 0 :
            ssh.sendline(passwd)
        elif i == 1:
            ssh.sendline('yes')
            ssh.expect('password:')
            ssh.sendline(passwd)
        ssh.read()
        ssh.close()
    except :
        #print traceback.format_exc()
        pass

if __name__ == '__main__':
    doRsync("root","123456","192.168.1.101","/tmp/rtest1","/tmp")

上面是使用 python 实现的代码,大家可根据情况用其它语言实现该功能。

其它

1、rsync 在执行过程中被 kill 掉会怎么样;

http://unix.stackexchange.com/questions/5959/how-can-i-pause-resume-rsync

It is safe to kill an rsync process and run the whole thing again; it will continue where it left off. It may be a little inefficient, particularly if you haven’t passed –partial (included in -P), because rsync will check all files again and process the file it was interrupted on from scratch.

rsync 被 kill 掉是安全的,下次启动时还可以正常工作。

2、rsync 不能指定时间段;

1)该问题可以通过 kill 来解决
2)或者使用 pexpect 的 timeout 参数来控制
3)可以先通过 find 查找过滤出文件夹的名字,然后使用 rsync 进行同步 这个可以根据现有业务的特征进行,比如:

find /tmp -name '*' -newermt '2016-03-08' ! -newermt '2016-03-20'

3、rsync 在写文件过程中同步(比如录音过程中执行 rsync 操作)

经测试,rsync 会同步部分文件内容,文件写入完成后再执行 rsync 会保持文件的一致

4、当文件数量达到百万级以上时,rsync 同步时扫描改变的文件非常耗时

RSync 实现文件备份同步详解   http://www.linuxidc.com/Linux/2014-09/106967.htm

利用 inotifywait 监控主机文件和目录 http://www.linuxidc.com/Linux/2013-03/81075.htm

利用 inotify+rsync 实现 Linux 文件批量更新 http://www.linuxidc.com/Linux/2012-01/52132.htm

inotify-tools+rsync 实时同步文件安装和配置 http://www.linuxidc.com/Linux/2012-06/63624.htm

rsync 同步完整配置 http://www.linuxidc.com/Linux/2013-06/85781.htm

CentOS 6.5 下 Rsync 远程同步 http://www.linuxidc.com/Linux/2014-05/101084.htm

Linux 文件夹对比并提取的差分文件技巧 -rsync 的妙用 http://www.linuxidc.com/Linux/2016-02/128307.htm

Rsync 的详细介绍 :请点这里
Rsync 的下载地址 :请点这里

本文永久更新链接地址 :http://www.linuxidc.com/Linux/2016-08/134394.htm

正文完
星哥说事-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-21发表,共计2581字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中