前言
linux 环境下说到数据复制第一个映入脑海的命令还是 cp
,毕竟它用起来很方便,但是只能完成本地数据的拷贝,如果想实现本地和远程主机之间的数据拷贝可以使用 scp
,有些文章会把它翻译成 “ssh copy”,但实际上它的全称是 “secure copy”,不过它确实利用了ssh协议,缺点就是只能全量拷贝,如果想完成增量拷贝可以选择 rsync
命令,官网 rsync.samba.org 比较简陋,但很符合GNU的风格。
rsync的特点
- 可实现增量同步,即只同步发生变化的数据
- 可保持原文件或目录的权限、时间、软硬连接、属主、组等所有属性均保持不变
- 支持拷贝特殊文件,如连接文件、设备等
- 排除指定文件或目录同步的功能,相当于打包命令tar的排除功能
- rsync本身不对数据加密,可使用rcp/rsh/ssh等方式来配合传输文件
- 支持匿名的活认证的进程模式传输,可实现方便安全的数据备份和镜像
rsync 传输模式
- 本地方式,类似cp,可完成本机数据的拷贝复制
- 远程方式,类似scp,但可实现增量复制,可以将数据从本地推送至服务端,也可以将数据从服务端拉取到本地
- 守护进程方式,区分客户端和服务端,可以启动
rsyncd
服务(未使用过需研究)
rynsc 命令格式
Local: rsync [OPTION...] SRC... [DEST]
Access via remote shell:
Pull: rsync [OPTION...] [USER@]HOST:SRC... [DEST]
Push: rsync [OPTION...] SRC... [USER@]HOST:DEST
Access via rsync daemon:
Pull: rsync [OPTION...] [USER@]HOST::SRC... [DEST]
rsync [OPTION...] rsync://[USER@]HOST[:PORT]/SRC... [DEST]
Push: rsync [OPTION...] SRC... [USER@]HOST::DEST
rsync [OPTION...] SRC... rsync://[USER@]HOST[:PORT]/DEST
常用的还是第2种和第3种,第一种是本地复制,一般用cp
代替就够了,4~7
用于守护进程模式,至今我还没用过
rsync 命令选项
-v, --verbose 详细模式输出。
-q, --quiet 精简输出模式。
-c, --checksum 打开校验开关,强制对文件传输进行校验。
-a, --archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD。
-r, --recursive 对子目录以递归模式处理。
-R, --relative 使用相对路径信息。
-b, --backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为~filename。可以使用--suffix选项来指定不同的备份文件前缀。
--backup-dir 将备份文件(如~filename)存放在在目录下。
-suffix=SUFFIX 定义备份文件前缀。
-u, --update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件,不覆盖更新的文件。
-l, --links 保留软链结。
-L, --copy-links 想对待常规文件一样处理软链结。
--copy-unsafe-links 仅仅拷贝指向SRC路径目录树以外的链结。
--safe-links 忽略指向SRC路径目录树以外的链结。
-H, --hard-links 保留硬链结。
-p, --perms 保持文件权限。
-o, --owner 保持文件属主信息。
-g, --group 保持文件属组信息。
-D, --devices 保持设备文件信息。
-t, --times 保持文件时间信息。
-S, --sparse 对稀疏文件进行特殊处理以节省DST的空间。
-n, --dry-run现实哪些文件将被传输。
-w, --whole-file 拷贝文件,不进行增量检测。
-x, --one-file-system 不要跨越文件系统边界。
-B, --block-size=SIZE 检验算法使用的块尺寸,默认是700字节。
-e, --rsh=command 指定使用rsh、ssh方式进行数据同步。
--rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息。
-C, --cvs-exclude 使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件。
--existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件。
--delete 删除那些DST中SRC没有的文件。
--delete-excluded 同样删除接收端那些被该选项指定排除的文件。
--delete-after 传输结束以后再删除。
--ignore-errors 及时出现IO错误也进行删除。
--max-delete=NUM 最多删除NUM个文件。
--partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输。
--force 强制删除目录,即使不为空。
--numeric-ids 不将数字的用户和组id匹配为用户名和组名。
--timeout=time ip超时时间,单位为秒。
-I, --ignore-times 不跳过那些有同样的时间和长度的文件。
--size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间。
--modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0。
-T --temp-dir=DIR 在DIR中创建临时文件。
--compare-dest=DIR 同样比较DIR中的文件来决定是否需要备份。
-P 等同于 --partial。
--progress 显示备份过程。
-z, --compress 对备份的文件在传输时进行压缩处理。
--exclude=PATTERN 指定排除不需要传输的文件模式。
--include=PATTERN 指定不排除而需要传输的文件模式。
--exclude-from=FILE 排除FILE中指定模式的文件。
--include-from=FILE 不排除FILE指定模式匹配的文件。
--version 打印版本信息。
--address 绑定到特定的地址。
--config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件。
--port=PORT 指定其他的rsync服务端口。
--blocking-io 对远程shell使用阻塞IO。
-stats 给出某些文件的传输状态。
--progress 在传输时显示传输过程。
--log-format=formAT 指定日志文件格式。
--password-file=FILE 从FILE中得到密码。
--bwlimit=KBPS 限制I/O带宽,KBytes per second。
-h, --help 显示帮助信息。
常用组合
从上面描述的选项可以看到,这个命令的参数特别多,但实际使用时只需要掌握一些常用组合即可:
保留文件原属性拷贝
rsync -avz jerry@82.156.125.169:/data/logs /data/backuplogs
从远程主机将目录 /data/logs
拷贝到本地,对应目录为 /data/backuplogs
,保留文件原有属性,包括权限、时间、软硬连接、属主、组等
删除目标目录中S再原目录不存在的文件
rsync -avz --delete --progress /data/logs 82.156.125.169:/data/backuplogs
将本地 /data/logs
目录推送到远程目录 82.156.125.169:/data/backuplogs
下,同时删除在原目录下不存在的文件,这个参数组合特别适合用来完全同步两个目录的内容
限制网速传输
rsync -avz --bwlimit=1024 /data/logs 82.156.125.169:/data/backuplogs/
同步数据时限制传输速度为1024kBytes/s(就是1MB/s),防止占用过多带宽,可以根据需要调整数值,注意末尾加了一个斜杠 /
表示将原目录同步到目标目录下,而不是与目标目录完全同步,这一点在实践中要注意
断点续传
rsync -avz --partial /data/logs root@82.156.125.169:/data/backuplogs
传输时保留那些因故没有完全传输的文件,来是加快随后的再次传输
总结
- 本地拷贝数据用
cp
,远程拷贝选scp
,如果想实现增量复制拷贝可以使用rsync
rsync
可以将数据从本地推送至服务端,也可以将数据从服务端拉取到本地,也可以使用daemon
模式rsync
最常用的命令组合就是avz
,可以保留文件原有属性进行递归拷贝- 使用
rsync
命令传输数据时注意目录末尾的斜杠/
,加上它表示目录下的内容,使用时要注意不要覆盖错了
“人类一思考,上帝就发笑”。虽然我们已经总结了万物,终究还是渺小和无知的代表,但我们可以利用这些渺小的总结,在有限的生命内过的更好,一些看似无法到达和接触的领域,在被划分整理之后显得那么苍白,他想笑就让他去笑吧,毕竟我们只需要为自己的有限生命而负责~
本文含有隐藏内容,请 开通VIP 后查看