【MySQL核心】MySQL 数据恢复-ibd2sql

发布于:2024-08-13 ⋅ 阅读:(57) ⋅ 点赞:(0)

【MySQL核心】MySQL 数据文件恢复-ibd2sql

简介

ibd2sql 是一个将 MySQL ibd 文件解析成 SQL 语句的工具,它可以解析出建表语句和 SQL 语句,并且支持 MySQL8.* 和 MySQL5.* 版本。可以解析损坏的 ibd 文件来获取可用的信息,这对于数据表损坏的场景非常友好。接下来一起了解下他的神奇功能。

项目地址:https://github.com/ddcw/ibd2sql

注意: 执行操作前先请备份数据,注意磁盘空间大小

安装

  • 在使用项目前,请安装 python3

windows 可以直接下载:https://github.com/ddcw/ibd2sql/archive/refs/heads/main.zip

linux:

# 安装python 3
yum install -y python3

# 下载安装包
wget https://github.com/ddcw/ibd2sql/archive/refs/heads/main.zip

# 解压
unzip main.zip

# 进入安装目录
cd ibd2sql-main

详细参数可以参见如下连接:

https://github.com/ddcw/ibd2sql/blob/e571766b00f3b728ecbcbc7a7f612bc8e04715dd/docs/USAGE.md

使用

ibd2sql 原生支持 mysql8.0 对于 mysql5.6/5.7 的文件解析也需要依赖 mysql8.0 的 ibd 文件来解析出建表语句。

也就是说当你要解析 mysql5.6/5.7 的 ibd 文件时,需要先在 mysql8.0 的实例中创建需要恢复的表,ibd2sql 需要使用新建表的 ibd 文件来解析出建表信息(用来支持获取insert 语句)。

这里就有一个问题了,如果你没有建表语句是不是就不能使用 ibd2sql 了? 你可以使用 dbsake 工具来获取 mysql 5.* 版本的建表语句。可以看我写的 dbsake 的文章来获取用法。注意不要使用 mysqlfrm 工具,可能存在解析的数据字段长度不精确,获取时间字段有问题等问题。

用法(mysql 8.0)

解析表结构
python3 main.py xxx.ibd --ddl
  • –ddl 获取建表语句
解析表数据
python3 main.py xxx.ibd --sql
  • –sql 获取 insert 数据
解析表结构和数据
python3 main.py xxx.ibd --ddl --sql
解析误删的数据
python3 main.py xxx.ibd --sql --delete
  • –delete 获取误删数据
解析分区表

分区表需要指定元数据信息

python3 main.py --sdi-table /your_path/ddcw_partition_range#p#p0.ibd   /your_path/ddcw_partition_range#p#p1.ibd --sql
  • –sdi-table 指定存储建表语句的 ibd 文件 后面跟要恢复的文件

用法(mysql 5.6/5.7)

mysql 5.6/5.7 需要先用 dbsake 工具获取建表语句并导入到 mysql8.0 中,用来给ibd2sql获取元数据信息。

# 提取ddl
dbsake frmdump test.frm 

# 导入 MySQL 8 
dbsake frmdump test.frm  |mysql 

# 解析
python3 main.py --sdi-table /your_mysq8_path/ddcw_alltype_table.ibd /your_mysql5_path/ddcw_alltype_table.ibd  --sql --mysql5
  • –sdi-table 指定 mysql8 的 ibd 文件
  • –mysql5 代表恢复的是 MySQL 5 版本的数据

针对 ibd 文件损坏的场景(重点)

对于 ibd 文件损坏的场景,可以使用按数据页进行解析。

mysql8
python3 main.py /your_path/test.ibd  --sql --page-start 1000 --page-count 1 2>/dev/null
  • /your_path/test.ibd 你的需要恢复的 ibd 文件路径
  • –sql 解析成 SQL
  • –page-start 指定开始解析的页数
  • –page-count 指定向后解析多少页
mysql5
python3 main.py  --sdi-table /your_mysql8_path/test.ibd    /your_mysql5_path/test.ibd  --sql --page-start 1000 --page-count 1  2>/dev/null
  • –sdi-table 指定 mysql8 的 ibd 文件

  • /your_mysql5_path/test.ibd 你的需要恢复的 ibd 文件

  • –page-start 指定开始解析的页数

  • –page-count 指定向后解析多少页

ibd 文件损坏实战(mysql5)

使用两个脚本来并发解析损坏的 ibd 文件,主脚本用来计算数据页数量,按照空闲的 CPU 核心数开启 N 个批处理子脚本。

使用前请安装 mysql8 的实例,用来创建表。

使用前请安装 dbsake 命令,用来生成表 ,以下链接获取。

https://blog.csdn.net/weixin_45385457/article/details/141135847

vim ibd2sql.sh

#!/bin/bash

table_name="$1"                                           # 要解析的表名
old_data_path="/data1/mysql-5.6.16-winx64/data_old/test"  # 老的数据库路径(保存 ibd 文件的库路径)
mysql8_data_path="/mydata/3309/test"                      # 新的 mysql8 的 路径(保存 ibd 文件的库路径)
mysql8_conn="/usr/local/mysql/mysql80/bin/mysql -S /mydata/3309/mysql.sock test " # mysql8 连接信息
output_path=/tmp/table_data                               # 输出 .sql 文件的路径


filename="${table_name}.ibd"
>${output_path}/${table_name}.sql

# dbsake 获取表结构  sed 过滤后 导入 mysql8
/usr/local/bin/dbsake frmdump ${old_data_path}/${table_name}.frm |sed  's#datetime DEFAULT NULL#datetime null DEFAULT NULL#g'|sed  's#timestamp DEFAULT NULL#datetime null DEFAULT NULL#g'  ${mysql8_conn}
if [ $? -ne 0 ];then
    echo "MySQL 表结构导入失败"
    exit
fi
sleep 1 

# 指定 mysql8 的 ibd 文件生成建表语句
python3 main.py ${mysql8_data_path}/${filename} --ddl  >>${output_path}/${table_name}.sql

# 计算文件大小
filesize=`stat -c %s ${old_data_path}/${filename}`

# 获取数据页数量
maxpagecount=$[ ${filesize} / 16384 ]
current_page=1

# 循环数据页
while [ ${current_page} -le ${maxpagecount} ];do
	echo "-- ${filename} ${maxpagecount}  PAGE NO: ${current_page}" >>ibd_progress_${table_name}.log; 
	current_page=$[ ${current_page} + 1 ]
	
	# 指定生成回滚 sql
	timeout 2s python3 main.py  --sdi-table  ${mysql8_data_path}/${filename}  ${old_data_path}/${filename} --sql --mysql5 --page-start ${current_page} --page-count 1  >>${output_path}/${table_name}.sql
done

ibd 文件损坏实战(mysql8)

同上,只是不需要 dbsake 和安装其他实例了,可以直接解析 ibd 文件。

vim ibd2sql.sh

#!/bin/bash

table_name="$1"                              # 要解析的表名
old_data_path="/data1/mysql8/data_old/test"  # 老的数据库路径(保存 ibd 文件的库路径)
output_path=/tmp/table_data                  # 输出 .sql 文件的路径


filename="${table_name}.ibd"
>${output_path}/${table_name}.sql

# 指定 mysql8 的 ibd 文件生成建表语句
python3 main.py ${old_data_path}/${filename} --ddl  >>${output_path}/${table_name}.sql

# 计算文件大小
filesize=`stat -c %s ${old_data_path}/${filename}`

# 获取数据页数量
maxpagecount=$[ ${filesize} / 16384 ]
current_page=1

# 循环数据页
while [ ${current_page} -le ${maxpagecount} ];do
	echo "-- ${filename} ${maxpagecount}  PAGE NO: ${current_page}" >>ibd_progress_${table_name}.log; 
	current_page=$[ ${current_page} + 1 ]
	
	# 指定生成回滚 sql
	timeout 2s python3 main.py  ${old_data_path}/${filename} --sql --page-start ${current_page} --page-count 1  >>${output_path}/${table_name}.sql
done

运行

sh ibd2sql.sh 

# 后台运行更稳定 nohup &

完整解决方案参见:https://blog.csdn.net/weixin_45385457/article/details/141136121