阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

MySQL大表删除解决方案

137次阅读
没有评论

共计 3046 个字符,预计需要花费 8 分钟才能阅读完成。

一、表删除问题汇总

(1)、MySQL 如何删除表
(2)、删除大表如何优化、解决

二、删除表原理与优化

删除表原理上分为 2 部分
<1>buffer pool 页面清除过程
在删除表的时候,Innodb 会将文件在 buffer pool 中对应的页面清除。对于删除表的页面清除,只需要将页面从 flash 队列中删除即可,而不需要去做 flush 操作,减小对系统的冲击。
问题 1 :如果 buffer pool 很大,或者是在 buffer pool 中有很多需要被 flush 的页面,那么此时遍历扫描页面时就会占用比较长的时间,导致其他事务在用到相应 buffer pool 实例时被阻塞,从而影响整个数据库性能。
优化:涉及源码,优化困难
<2> 删除 ibd 磁盘文件的过程
问题 1 :表文件过大,直接删除会瞬时占用大量 IO,造成 IO 阻塞
优化 :使用 硬链
原理:一个磁盘上的文件,可以由多个文件系统的文件引用,这多个文件的完全相同的,都指向同一个磁盘上的文件,当我们删除任何一个文件的时候,都不会影响真实的文件,只是会将其引用数据减 1,只有当被引用数目变为 1 的时候,再次删除文件,才会真正被删除。删除时,这两种情况的区别很明显,一个是在减少被引用数目,一个是真正做 IO 来删除它
操作
ln /data/mydata/my3306/testdb/table1.ibd     /data/mydata/my3306/testdb/table1.ibd.hdlk
ls -lh    /data/mydata/my3306/testdb 查看文件引用数(应该为 2)
 
问题 2 :做完硬链,真正的大文件删除问题,直接 rm 删除,会造成 IO 瞬时高峰
优化 :使用工具, 多次少量的删除
原理:利用系统文件的truncate,脚本工具为slowrm
 

三、slowrm

注:此工具作者为“贾春生”,此处只分享~

3.1、需求

缓解大表删除带来的 IO 瞬间压力

3.2、slowrm 功能

<1> 将大文件按照指定速度进行删除,降低 IO 瞬间压力

3.3、slowrm 实现

3.3.1、背景描述

先简要介绍下 slowrm 工具开发的背景。
我们曾在《linux_mysql_DROP_TABLE操作步骤》中提到,对于大表的删除,应当先建立硬链,drop table后,再删除表数据文件。
对于大表的数据文件,可能会达到 10G,也可以是100G 级别,甚至更大。在 linux 下,这样的大文件在使用 rm 时,无疑会导致 IO 资源被强行占用,表现为硬盘的 io_util 基本上是 100% 左右,会对其它 IO 操作造成阻塞。更可怕的是,rm单个文件的过程是个原子过程,无法使用 killkill -9来杀死 rm 进程,只能乖乖的等待它结束。
如果是在繁忙的线上服务所在的机器上做这样的删除操作,很可能会对线上服务产生影响。因此需要有一个平滑删除大文件的方案。而这样的方案最终是与数据库无关的,而是一个通用方案

3.3.2、设计思路

 
对于删除大文件的操作,采用每次将文件截断一点,分多次截断,最终直至文件大小被截断为0
如下面的过程示例:
block_size = 1024576bytes;
while file_size >=block_size
begin
ftruncate (file, new_size);
(其中(old_size -new_size = block_size)
sleep 0.05 seconds;
end
ftruncate(file, 0);

因为既然 rm 一个文件是不可中断的,那么我们就将删除过程打散,分多次删除一个,每次删除一点。幸好现在的 linux 提供了支持该思路的 APItruncate/ftruncate 函数,可以对文件截断至任意长度 ()。经过测试,发现每次截断一点,分多次截断,最终直至文件大小被截断为0,这样删除大文件需要更多的时间,但是对磁盘IO 的影响却大大减小了。因此采用该思路是可行的。

 

3.4、slowrm 使用

slowrm  [OPTIONS]  FILES
对删除文件的方式与 rm 类似。

3.4.1、选项及参数

该工具的使用主要涉及两个参数:
 -b   #size
每次需要截断掉的文件大小,单位为字节,参数值需要是整数,默认值4096 * 256Bytes(= 1MB);
 -s   #seconds
每两次截断操作之间的时间间隔,单位为秒,参数值可以为小数。这两个参数用以控制删除速度,及删除过程对磁盘 IO 的压力。默认值0.1 second
 -h, –help

查看帮助信息。

 
 
直接输入 slowrm,或输入slowrm –hslowrm –help可以查看帮助。
MySQL 大表删除解决方案
 

3.4.2、删除速度

     实际上,可以看出,由#size * #seconds = #ioBPS Bytes/s
即可计算得出每秒该操作消耗的 IO 吞吐量 ( 字节数),也即大约每秒文件所减小的字节数。
    可以看到默认删除速度是: 4096 * 256Bytes / 0.1second= 10MB/s,被删除的文件每秒钟可以减少10MB
用户可以通过上述两个参数来控制删除的速度以及对磁盘 IO 的压力。
 

3.5、slowrm 与 rm 对比

使用方式     slowrm    rm    备注
提示是否删除     默认支持    rm -i    默认 slowrm 会询问用户是否删除每一个指定文件
删除单个文件 slowrm file    rm file    相同
删除多个文件 显示指定文件    slowrm file1 file2 file3rm file1 file2 file3 
使用通配符    slowrm file*    rm file* 
删除硬链 硬链数大于 1 删除硬链同 rm    删除硬链实际执行的就是 unlink
硬链数等于 1   

低速删除文件   

全速删除文件    实质上在判断硬链数上逻辑是一样的,只是最后一个硬链的删除方式不同
强制删除文件 slowrm -f
slowrm –force   
rm -f
rm –force   
相同
控制删除速度控制速度slowrm -s 0.1 -b 262144 file (2MB/s)不支持 
默认速度    slowrm file 
对应参数 -s 0.1 -b 1048576(10MB/s)
一般使用默认参数即可
删除其他类型文件目录,软链    不支持  
递归删除目录 rm -rf 目录 
 
可见,一般情况下,还是使用 rm 删除即可。
在需要低 IO 负载删除大文件时,可以使用slowrm

slowrm对于 rm 是起到一个补充的作用。

 
 

3.6、注意

3.6.1、删除文件类型

目前,该工具只支持删除具体常规文件,无法对目录进行递归删除,但可以支持对多个文件进行删除,如slowrm *.logmysql.err.2014*
也无法对软链接,文件等进行删除。

3.6.2、硬链的删除

如果 slowrm 要删除的文件的硬链接数目大于1,那么就会直接删除该硬链;

如果待删除的文件硬链数目等于1,那么会按照平滑删除的方式,逐步截断该文件。

 
 

3.7、测试使用

制造大文件
MySQL 大表删除解决方案

 开始删除
 

MySQL 大表删除解决方案

大小情况
MySQL 大表删除解决方案
 
 
压力情况
Device:         rrqm/s   wrqm/s     r/s     w/s    rMB/s    wMB/s avgrq-sz avgqu-sz   await  svctm  %util
MySQL 大表删除解决方案

3.8、日常使用

1、开启一个 screen
screen -S slowrm_test
 
2、开始删除文件
slowrm file 
或者指定速度,正常默认即可(10MB/s)

本文永久更新链接地址:http://www.linuxidc.com/Linux/2017-06/145038.htm

正文完
星哥说事-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-22发表,共计3046字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中