之前RAC环境出现了故障,节点2操作系统崩溃,重装系统后,CRS添加成功,但是CRS启动有问题,排查发现节点2 ASM的+DATA diskgroup无法mount,报如下错误:
ORA-15063: ASM discovered an insufficient number of disks for diskgroup "DATA"
在ASM实例上检查磁盘组和磁盘的状态,发现+DATA diskgroup的6块盘有3块是MEMBER,有3块是PROVISIONED。
NOMOUNT状态,导致添加操作失败,而尝试在目前正常工作的节点添加磁盘,结果同样报错:
-
SQL> alter diskgroup DATA add disk'/dev/oracleasm/disks/OADB_DATA_300G_6';
-
alter diskgroup DATA add disk'/dev/oracleasm/disks/OADB_DATA_300G_6'
-
*
-
ERROR at line 1:
-
ORA-15032: not all alterations performed
-
ORA-15029: disk'/dev/oracleasm/disks/OADB_DATA_300G_6' is already mounted by this instance
解决办法要么是重建ASM磁盘,要么直接修改ASM磁盘头信息。重建的话耗时太长,因为有本地备库,随时可切换,最终确定通过KFED工具直接修改ASM磁盘头信息。
步骤如下:
1、首先编译kfed
#cd $ORACLE_HOME/rdbms/lib
#make -f ins_rdbms.mk ikfed
2、用kfed读取故障ASM磁盘头信息
通过kfed分别读取故障ASM磁盘头信息和正常ASM磁盘头信息,发现故障磁盘头标红地方与正常ASM磁盘头不一致,故障ASM磁盘信息如下:
kfdhdb.ub4spare[39]: 104436 ; 0x198: 0x000197f4
kfdhdb.acdb.ub2spare: 43605 ; 0x1de: 0xaa55
正常ASM磁盘头信息该项为0
3、修复步骤:
a、通过kfed read /dev/oracleasm/disks/OADB_DATA_DISK_1 > /tmp/disk1.txt 导出磁盘头信息
b、修改kfdhdb.ub4spare[39]: 104436 ; 0x198: 0x000197f4 为 kfdhdb.ub4spare[39]: 0 ; 0x198: 0x00000000 ; 修改kfdhdb.acdb.ub2spare: 43605 ; 0x1de: 0xaa55为kfdhdb.acdb.ub2spare: 0 ; 0x1de: 0x0000
c、通过kfed merge /dev/oracleasm/disks/OADB_DATA_DISK_1 text=/tmp/disk1.txt
d、另外两块磁盘也执行如上操作
e、sqlplus / as sysasm ——select group_number, disk_number, mount_status, header_status, name, path from v$asm_disk; 发现磁盘头信息已显示为MEMBER,+DATA也成功mount
网站栏目:KFED修复ASM磁盘头
文章分享:
http://www.cdkjz.cn/article/gccsej.html