阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

测试一体机ASM failgroup的相关问题处理

449次阅读
没有评论

共计 5399 个字符,预计需要花费 14 分钟才能阅读完成。

环境:3 台虚拟机 RHEL 7.3 + Oracle RAC 11.2.0.4
问题现象:RAC 运行正常,ASM 磁盘组 Normal 冗余,有 failgroup 整体故障,有 failgroup 配置错误。
温馨提示:本文并不是市场上任何一款商业的一体机产品,只是我为了学习这类分布式存储架构自己模拟的实验环境,为了区分我暂时称之为 xData 吧 ^_^。

1. 问题现象确认

2. 重新加入 CELL01 的盘

3. 修改 failgroup 的配置

1. 问题现象确认
SQL> select group_number, name, total_mb, free_mb, USABLE_FILE_MB, offline_disks, state, type from v$asm_diskgroup;

GROUP_NUMBER NAME                            TOTAL_MB    FREE_MB USABLE_FILE_MB OFFLINE_DISKS STATE                  TYPE
———— —————————— ———- ———- ————– ————- ———————- ———-
          1 CRS                                  2000      1170            585            0 MOUNTED                NORMAL
          2 DATA                                40960      35652          7586            0 MOUNTED                NORMAL

SQL>  select group_number, disk_number, name, path, failgroup, mode_status, voting_file  from v$asm_disk order by 1, 2;

GROUP_NUMBER DISK_NUMBER NAME                          PATH                    FAILGROUP            MODE_STATUS    VO
———— ———– —————————— ———————– ——————– ————– —
          0          0                                /dev/CELL01-data2                            ONLINE        N
          0          1                                /dev/CELL01-data1                            ONLINE        N
          0          2                                /dev/CELL01-crs1                            ONLINE        Y
          1          1 CRS_0001                      /dev/CELL02-crs2        CRS_0001            ONLINE        Y
          1          2 CRS_0002                      /dev/CELL03-crs3        CRS_0002            ONLINE        Y
          2          0 DATA_0000                      /dev/CELL03-data1      DATA_0000            ONLINE        N
          2          1 DATA_0001                      /dev/CELL03-data2      DATA_0001            ONLINE        N
          2          2 DATA_0002                      /dev/CELL02-data1      CELL02              ONLINE        N
          2          3 DATA_0003                      /dev/CELL02-data2      CELL02              ONLINE        N

9 rows selected.

可以看到不但 CELL01 节点的所有盘被删除,而且 CELL03 节点的数据盘,failgroup 目前也配置不正确!

2. 重新加入 CELL01 的盘
由于时间超过默认的 3.6h,offline 的盘已经被删除,只有重新加入 CELL01 的盘才可以。
alter diskgroup CRS add disk ‘/dev/CELL01-crs1’;
alter diskgroup DATA ADD FAILGROUP CELL01 disk ‘/dev/CELL01-data1’, ‘/dev/CELL01-data2’ rebalance power 5;

直接这样加盘很可能会遇到下面这类错误,因为这些盘之前是被使用过的:
SQL> alter diskgroup CRS add disk ‘/dev/CELL01-crs1’;
alter diskgroup CRS add disk ‘/dev/CELL01-crs1’
*
ERROR at line 1:
ORA-15032: not all alterations performed
ORA-15033: disk ‘/dev/CELL01-crs1’ belongs to diskgroup “CRS”

这个问题可以通过 dd 盘头,也可以加盘尝试加 force 参数来解决,我这里选择 dd 盘头的方式:
[root@db01 ~]# dd if=/dev/zero of=/dev/CELL01-crs1 bs=8k count=1000
1000+0 records in
1000+0 records out
8192000 bytes (8.2 MB) copied, 0.0691801 s, 118 MB/s

dd 盘头之后再次尝试添加就可以顺利完成:
SQL> alter diskgroup CRS add disk ‘/dev/CELL01-crs1’;

Diskgroup altered.

同样的,将 CELL01 的数据盘也重新加入到 DATA 磁盘组中,failgroup 名称为 CELL01:
SQL> alter diskgroup DATA ADD FAILGROUP CELL01 disk ‘/dev/CELL01-data1’, ‘/dev/CELL01-data2’ rebalance power 5;

Diskgroup altered.

通过 v$asm_operation 视图可以查看磁盘重新平衡的进度,直到下面的查询不再返回结果说明重平衡完成:
SQL> select * from v$asm_operation;

GROUP_NUMBER OPERATION  STATE        POWER    ACTUAL      SOFAR  EST_WORK  EST_RATE EST_MINUTES ERROR_CODE
———— ———- ——– ———- ———- ———- ———- ———- ———– ——————–
          2 REBAL      RUN              5          5        366        529        348          0
SQL> select * from v$asm_operation;

no rows selected

3. 修改 failgroup 的配置

CELL03 的数据盘,failgroup 目前配置还不正确。
SQL> alter diskgroup DATA drop disk DATA_0000, DATA_0001;

Diskgroup altered.

查询 v$asm_operation 视图可以查看磁盘重新平衡的进度,完成后再重新加回磁盘组,指定确切的 failgroup(CELL03):
SQL> alter diskgroup DATA ADD FAILGROUP CELL03 disk ‘/dev/CELL03-data1’, ‘/dev/CELL03-data2’ rebalance power 5;

Diskgroup altered.

再次关注重平衡进度,最后查询一切正常,结果如下:
SQL> col path for a50
SQL> select group_number, disk_number, name, path, failgroup, mode_status, voting_file  from v$asm_disk order by 1, 2;

GROUP_NUMBER DISK_NUMBER NAME                          PATH                    FAILGROUP            MODE_STATUS    VO
———— ———– —————————— ———————– ——————– ————– —
          1          0 CRS_0000                      /dev/CELL01-crs1        CRS_0000            ONLINE        Y
          1          1 CRS_0001                      /dev/CELL02-crs2        CRS_0001            ONLINE        Y
          1          2 CRS_0002                      /dev/CELL03-crs3        CRS_0002            ONLINE        Y
          2          0 DATA_0000                      /dev/CELL03-data1      CELL03              ONLINE        N
          2          1 DATA_0001                      /dev/CELL03-data2      CELL03              ONLINE        N
          2          2 DATA_0002                      /dev/CELL02-data1      CELL02              ONLINE        N
          2          3 DATA_0003                      /dev/CELL02-data2      CELL02              ONLINE        N
          2          4 DATA_0004                      /dev/CELL01-data1      CELL01              ONLINE        N
          2          5 DATA_0005                      /dev/CELL01-data2      CELL01              ONLINE        N

9 rows selected.

SQL> select group_number, name, total_mb, free_mb, USABLE_FILE_MB, offline_disks, state, type from v$asm_diskgroup;

GROUP_NUMBER NAME                            TOTAL_MB    FREE_MB USABLE_FILE_MB OFFLINE_DISKS STATE                  TYPE
———— —————————— ———- ———- ————– ————- ———————- ———-
          1 CRS                                  3000      2033            516            0 MOUNTED                NORMAL
          2 DATA                                61440      56012          17766            0 MOUNTED                NORMAL

说明:一般我会将磁盘组的兼容性参数设置为 11.2,如有特殊需求,还可以设置 disk_repair_time(默认 3.6h)。
SQL> col COMPATIBILITY for a30
SQL> col DATABASE_COMPATIBILITY for a30
SQL> select NAME, COMPATIBILITY, DATABASE_COMPATIBILITY from v$asm_diskgroup;

NAME                          COMPATIBILITY                  DATABASE_COMPATIBILITY
—————————— —————————— ——————————
CRS                            11.2.0.0.0                    11.2.0.0.0
DATA                          11.2.0.0.0                    11.2.0.0.0

– 设置 DATA 磁盘组 disk_repair_time(可理解为磁盘离线删除的时间)属性为 4.5h
SQL> ALTER DISKGROUP data SET ATTRIBUTE ‘disk_repair_time’ = ‘4.5h’;
Diskgroup altered.

更多 Oracle 相关信息见Oracle 专题页面 https://www.linuxidc.com/topicnews.aspx?tid=12

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-22发表,共计5399字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中

星哥玩云

星哥玩云
星哥玩云
分享互联网知识
用户数
4
文章数
19348
评论数
4
阅读量
7805752
文章搜索
热门文章
开发者必备神器:阿里云 Qoder CLI 全面解析与上手指南

开发者必备神器:阿里云 Qoder CLI 全面解析与上手指南

开发者必备神器:阿里云 Qoder CLI 全面解析与上手指南 大家好,我是星哥。之前介绍了腾讯云的 Code...
星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛 NAS-6:抖音视频同步工具,视频下载自动下载保存 前言 各位玩 NAS 的朋友好,我是星哥!...
云服务器部署服务器面板1Panel:小白轻松构建Web服务与面板加固指南

云服务器部署服务器面板1Panel:小白轻松构建Web服务与面板加固指南

云服务器部署服务器面板 1Panel:小白轻松构建 Web 服务与面板加固指南 哈喽,我是星哥,经常有人问我不...
我把用了20年的360安全卫士卸载了

我把用了20年的360安全卫士卸载了

我把用了 20 年的 360 安全卫士卸载了 是的,正如标题你看到的。 原因 偷摸安装自家的软件 莫名其妙安装...
星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛NAS-3:安装飞牛NAS后的很有必要的操作

星哥带你玩飞牛 NAS-3:安装飞牛 NAS 后的很有必要的操作 前言 如果你已经有了飞牛 NAS 系统,之前...
阿里云CDN
阿里云CDN-提高用户访问的响应速度和成功率
随机文章
4盘位、4K输出、J3455、遥控,NAS硬件入门性价比之王

4盘位、4K输出、J3455、遥控,NAS硬件入门性价比之王

  4 盘位、4K 输出、J3455、遥控,NAS 硬件入门性价比之王 开篇 在 NAS 市场中,威...
仅2MB大小!开源硬件监控工具:Win11 无缝适配,CPU、GPU、网速全维度掌控

仅2MB大小!开源硬件监控工具:Win11 无缝适配,CPU、GPU、网速全维度掌控

还在忍受动辄数百兆的“全家桶”监控软件?后台偷占资源、界面杂乱冗余,想查个 CPU 温度都要层层点选? 今天给...
我用AI做了一个1978年至2019年中国大陆企业注册的查询网站

我用AI做了一个1978年至2019年中国大陆企业注册的查询网站

我用 AI 做了一个 1978 年至 2019 年中国大陆企业注册的查询网站 最近星哥在 GitHub 上偶然...
一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸

一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸

一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸 前言 作为天天跟架构图、拓扑图死磕的...
告别Notion焦虑!这款全平台开源加密笔记神器,让你的隐私真正“上锁”

告别Notion焦虑!这款全平台开源加密笔记神器,让你的隐私真正“上锁”

  告别 Notion 焦虑!这款全平台开源加密笔记神器,让你的隐私真正“上锁” 引言 在数字笔记工...

免费图片视频管理工具让灵感库告别混乱

一言一句话
-「
手气不错
开发者福利:免费 .frii.site 子域名,一分钟申请即用

开发者福利:免费 .frii.site 子域名,一分钟申请即用

  开发者福利:免费 .frii.site 子域名,一分钟申请即用 前言 在学习 Web 开发、部署...
Prometheus:监控系统的部署与指标收集

Prometheus:监控系统的部署与指标收集

Prometheus:监控系统的部署与指标收集 在云原生体系中,Prometheus 已成为最主流的监控与报警...
星哥带你玩飞牛NAS-5:飞牛NAS中的Docker功能介绍

星哥带你玩飞牛NAS-5:飞牛NAS中的Docker功能介绍

星哥带你玩飞牛 NAS-5:飞牛 NAS 中的 Docker 功能介绍 大家好,我是星哥,今天给大家带来如何在...
开源MoneyPrinterTurbo 利用AI大模型,一键生成高清短视频!

开源MoneyPrinterTurbo 利用AI大模型,一键生成高清短视频!

  开源 MoneyPrinterTurbo 利用 AI 大模型,一键生成高清短视频! 在短视频内容...
星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛NAS-6:抖音视频同步工具,视频下载自动下载保存

星哥带你玩飞牛 NAS-6:抖音视频同步工具,视频下载自动下载保存 前言 各位玩 NAS 的朋友好,我是星哥!...