slave_rows_search_algorithms参数hash_scan的实现方法

498次阅读

没有评论

共计 1880 个字符，预计需要花费 5 分钟才能阅读完成。

slave_rows_search_algorithms 由三个值的组合组成：TABLE_SCAN，INDEX_SCAN，HASH_SCAN。

TABLE_SCAN,INDEX_SCAN (默认配置，表示如果有索引就用索引，否则使用全表扫描)

HASH_SCAN 可以部分解决无主键表导致的复制延迟问题。

当表上无主键或唯一键时，那么对于在该表上做的 DML，如果是以 ROW 模式复制，则每一个行记录前镜像在备库都可能

产生一次全表扫描（或者二级索引扫描），大多数情况下，这种开销都是非常不可接受的，并且会产生大量的延迟。

hash_scan 的实现方法

简单的讲，在 apply rows_log_event 时，会将 log_event 中对行的更新缓存在两个结构中，分别

是：m_hash, m_distinct_key_list。m_hash：主要用来缓存更新的行记录的起始位置，

是一个 hash 表；m_distinct_key_list：如果有索引，则将索引的值 push 到 m_distinct_key_list，如果表没有索引，

则不使用这个 List 结构；其中预扫描整个调用过程如下：Log_event::apply_event

Rows_log_event::do_apply_event

Rows_log_event::do_hash_scan_and_update

Rows_log_event::do_hash_row (add entry info of changed records)

if (m_key_index < MAX_KEY) (index used instead of table scan)

Rows_log_event::add_key_to_distinct_keyset ()

当一个 event 中包含多个行的更改时，会首先扫描所有的更改，将结果缓存到 m_hash 中，如果该表有索引，则将索引的值

缓存至 m_distinct_key_list List 中，如果没有，则不使用这个缓存结构，

而直接进行全表扫描。

执行 stack 如下：

#0 handler::ha_delete_row

#1 0x0000000000a4192b in Delete_rows_log_event::do_exec_row

#2 0x0000000000a3a9c8 in Rows_log_event::do_apply_row

#3 0x0000000000a3c1f4 in Rows_log_event::do_scan_and_update

#4 0x0000000000a3c5ef in Rows_log_event::do_hash_scan_and_update

#5 0x0000000000a3d7f7 in Rows_log_event::do_apply_event

#6 0x0000000000a28e3a in Log_event::apply_event

#7 0x0000000000a8365f in apply_event_and_update_pos

#8 0x0000000000a84764 in exec_relay_log_event

#9 0x0000000000a89e97 in handle_slave_sql

#10 0x0000000000e341c3 in pfs_spawn_thread

#11 0x0000003a00a07851 in start_thread ()

#12 0x0000003a006e767d in clone ()

执行过程说明：

Rows_log_event::do_scan_and_update

open_record_scan()

do

next_record_scan()

if (m_key_index > MAX_KEY)

ha_rnd_next();

else

ha_index_read_map(m_key from m_distinct_key_list)

entry= m_hash->get()

m_hash->del(entry);

do_apply_row()

while (m_hash->size > 0);

从执行过程上可以看出，当使用 hash_scan 时，只会全表扫描一次，虽然会多次遍历 m_hash 这个 hash 表，但是这个扫描

是 O(1), 所以，代价很小，因此可以降低扫描次数，提高执行效率。

正文完

星哥玩云-微信公众号

发表至：数据库技术

2022年1月22日

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

Linux下命令行安装WebLogic 10.3.6

关于 Redis 主从同步初认识

InnoDB事务日志（redo log 和 undo log）详解

MySQL Batched Key Access (BKA)原理和设置使用方法举例

slave_rows_search_algorithms参数hash_scan的实现方法

150元打造低成本NAS小钢炮，捡一块3865U工控板

星哥带你玩飞牛NAS-11：咪咕视频订阅部署全攻略

星哥带你玩飞牛 NAS-10：备份微信聊天记录、数据到你的NAS中!

星哥带你玩飞牛NAS-13：自动追番、订阅下载 + 刮削，动漫党彻底解放双手！

星哥带你玩飞牛NAS-14：解锁公网自由！Lucky功能工具安装使用保姆级教程

大龙虾OpenClaw的token不够吃了？用免费的 APIKey 续命

每天一个好玩的网站-手机博物馆-CHAZ 3D Experience

4盘位、4K输出、J3455、遥控，NAS硬件入门性价比之王

150元打造低成本NAS小钢炮，捡一块3865U工控板

飞牛NAS升级到最新版，有线无法获取IP、无线网络莫名打开的BUG问题

免费图片视频管理工具让灵感库告别混乱

如何安装2026年最强个人助理ClawdBot、完整安装教程

2026 退税正式开始！单独计税 vs 合并计税，选对多退几千元

OpenClaw与QQ频道完美对接，操作简单一步到位

免费获得大模型的Api-Key的方法：英伟达提供GLM-4.7、Minimax M2.1模型和GitHub的AI大模型API申请

免费无广告！这款跨平台AI RSS阅读器，拯救你的信息焦虑