想象一下,你是一个运维工程师,负责管理一台生产服务器。某天凌晨,业务系统因为一次误操作删除了关键数据,老板怒气冲冲地找到你:“数据呢?备份呢?”如果你事先写好了一个备份脚本,定时运行,甚至还能压缩存储节省空间,那你就可以淡定地回复:“别慌,数据我已经备份好了。”这种底气,来自于你对工具的掌控和对细节的把控。
这个脚本的目标很简单:
- 指定一个源目录,扫描里面的所有文件。
- 将这些文件备份到目标位置。
- 用压缩工具打包备份,节省磁盘空间。
- 加上时间戳,让每次备份都有迹可循。
看似简单,但细节决定成败。我们会从基础命令讲起,一步步带你实现这个脚本。
准备工作:工具与环境
在动手之前,我们需要确保环境就绪。假设你用的是Linux系统(比如Ubuntu、CentOS),以下是我们会用到的工具和命令:
- bash:Shell脚本的运行环境,通常Linux默认就是它。可以用echo $SHELL检查是否为/bin/bash。
- cp:用于复制文件和目录。
- tar:经典的压缩工具,支持打包和压缩。
- date:生成时间戳,方便追踪备份时间。
- mkdir:创建目录。
- ls:列出目录内容(虽然我们不常用它,但了解一下有备无患)。
- find:查找文件的神器(稍后会用到)。
确保这些命令可用,运行which cp tar date mkdir ls find检查它们的路径。如果某个命令缺失,可以用包管理器安装(比如apt install tar或yum install tar)。
脚本设计:从需求到实现
我们先明确需求:
- 输入:源目录路径(比如/var/www/data)。
- 输出:备份文件,压缩后存到目标目录(比如/backup)。
- 功能:备份所有文件,带时间戳,压缩为.tar.gz格式。
- 额外要求:脚本要健壮,能处理目录不存在、权限不足等情况。
基于此,我们设计一个脚本,命名为backup.sh。以下是逐步实现的过程。
动手写脚本
1. 创建脚本文件并添加解释器
新建文件:
touch backup.sh
chmod +x backup.sh # 赋予执行权限
用编辑器(比如vim或nano)打开,写入第一行:
#!/bin/bash
这告诉系统用bash解释器运行脚本。
2. 定义变量
为了让脚本灵活,我们用变量存储路径和时间戳:
# 源目录(需要备份的目录)
SOURCE_DIR="/var/www/data"
# 目标目录(备份存储位置)
BACKUP_DIR="/backup"
# 当前时间戳,格式为年月日-时分秒,例如 20250330-143022
TIMESTAMP=$(date +"%Y%m%d-%H%M%S")
# 备份文件名
BACKUP_FILE="backup-$TIMESTAMP.tar.gz"
- date +"%Y%m%d-%H%M%S":生成如20250330-143022的时间戳。%Y是年,%m是月,%d是日,%H是小时,%M是分钟,%S是秒。
- 用变量的好处是后续修改路径或文件名时只需调整这里。
3. 检查目录是否存在
脚本不能假设一切顺利,我们得先检查目录:
# 检查源目录是否存在
if [ ! -d "$SOURCE_DIR" ]; then
echo "错误:源目录 $SOURCE_DIR 不存在!"
exit 1
fi
# 检查目标目录是否存在,不存在则创建
if [ ! -d "$BACKUP_DIR" ]; then
echo "目标目录 $BACKUP_DIR 不存在,正在创建..."
mkdir -p "$BACKUP_DIR"
if [ $? -ne 0 ]; then # 检查mkdir是否成功
echo "错误:无法创建目标目录 $BACKUP_DIR,请检查权限!"
exit 1
fi
fi
- [ ! -d "$SOURCE_DIR" ]:-d测试目录是否存在,!取反,条件为真表示目录不存在。
- exit 1:退出脚本,返回非零状态码表示失败。
- mkdir -p:递归创建目录,即使父目录不存在也不会报错。
- $?:上一个命令的退出状态,0表示成功,非0表示失败。
4. 执行备份与压缩
核心功能来了:备份并压缩。我们用tar命令一步到位:
echo "开始备份 $SOURCE_DIR 到 $BACKUP_DIR/$BACKUP_FILE ..."
tar -czf "$BACKUP_DIR/$BACKUP_FILE" -C "$SOURCE_DIR" .
if [ $? -eq 0 ]; then
echo "备份成功!文件保存为:$BACKUP_DIR/$BACKUP_FILE"
else
echo "错误:备份失败,请检查权限或磁盘空间!"
exit 1
fi
- tar -czf:
- -c:创建新归档文件。
- -z:用gzip压缩。
- -f:指定输出文件。
- -C "$SOURCE_DIR" .:切换到源目录后打包当前目录(.)的内容,避免在压缩包中包含完整路径。
- 检查$?确保备份成功。
5. 完整脚本
把以上部分合起来,backup.sh如下:
#!/bin/bash
# 源目录(需要备份的目录)
SOURCE_DIR="/var/www/data"
# 目标目录(备份存储位置)
BACKUP_DIR="/backup"
# 当前时间戳,格式为年月日-时分秒,例如 20250330-143022
TIMESTAMP=$(date +"%Y%m%d-%H%M%S")
# 备份文件名
BACKUP_FILE="backup-$TIMESTAMP.tar.gz"
# 检查源目录是否存在
if [ ! -d "$SOURCE_DIR" ]; then
echo "错误:源目录 $SOURCE_DIR 不存在!"
exit 1
fi
# 检查目标目录是否存在,不存在则创建
if [ ! -d "$BACKUP_DIR" ]; then
echo "目标目录 $BACKUP_DIR 不存在,正在创建..."
mkdir -p "$BACKUP_DIR"
if [ $? -ne 0 ]; then
echo "错误:无法创建目标目录 $BACKUP_DIR,请检查权限!"
exit 1
fi
fi
# 执行备份与压缩
echo "开始备份 $SOURCE_DIR 到 $BACKUP_DIR/$BACKUP_FILE ..."
tar -czf "$BACKUP_DIR/$BACKUP_FILE" -C "$SOURCE_DIR" .
if [ $? -eq 0 ]; then
echo "备份成功!文件保存为:$BACKUP_DIR/$BACKUP_FILE"
else
echo "错误:备份失败,请检查权限或磁盘空间!"
exit 1
fi
测试与优化
测试脚本
保存后运行:
./backup.sh
如果/var/www/data有文件(比如test.txt),你会在/backup下看到类似backup-20250330-143022.tar.gz的文件。用tar -xzf解压验证:
tar -xzf /backup/backup-20250330-143022.tar.gz -C /tmp
检查/tmp下是否还原了文件。
优化建议
- 支持参数输入:
修改脚本接受命令行参数:
SOURCE_DIR=${1:-"/var/www/data"}
BACKUP_DIR=${2:-"/backup"}
运行时可指定路径:./backup.sh /data /backup。
- 日志记录:
添加日志:
LOG_FILE="/var/log/backup.log"
echo "$(date): 备份完成,文件:$BACKUP_DIR/$BACKUP_FILE" >> "$LOG_FILE"
- 清理旧备份:
删除7天前的备份:
find "$BACKUP_DIR" -name "backup-*.tar.gz" -mtime +7 -exec rm -f {} \;
- -mtime +7:修改时间超过7天的文件。
- -exec rm -f {} \;:删除匹配的文件。
进阶命令
- find:查找文件非常强大。例如,备份特定类型文件:
tar -czf "$BACKUP_FILE" $(find "$SOURCE_DIR" -name "*.txt")
- rsync:如果需要增量备份,可以替换cp:
rsync -av "$SOURCE_DIR/" "$BACKUP_DIR/temp" && tar -czf "$BACKUP_FILE" -C "$BACKUP_DIR/temp" .
- gzip vs bzip2 vs xz:tar -czf用gzip,-j用bzip2,-J用xz,压缩率依次递增,但速度递减。
运维中的实际应用
这个脚本虽小,却能融入更大的运维体系。比如:
- 用cron定时运行:crontab -e添加0 2 * * * /path/to/backup.sh,每天凌晨2点备份。
- 结合云存储:备份后用scp或aws s3 cp上传到远程服务器。
本文暂时没有评论,来添加一个吧(●'◡'●)