决定在什么时候应该更换Exadata服务器上的硬盘
(Doc ID 2661785.1)
Last updated on MAY 08, 2020
适用于:
Exadata Database Machine X2-8 - 版本 All Versions 和更高版本Exadata X3-8 Hardware - 版本 All Versions 和更高版本
Exadata X3-2 Quarter Rack - 版本 All Versions 和更高版本
Exadata X3-2 Full Rack - 版本 All Versions 和更高版本
Exadata Database Machine X2-2 Full Rack - 版本 All Versions 和更高版本
本文档所含信息适用于所有平台
用途
这篇文章解释了哪些I/O error需要直接更换硬盘,哪些I/O error不需要更换硬盘而是做进一步调查. I/O error可以因为不同原因不同地点被报出, 不是每个I/O error都是由于坏硬盘引起而需要更换硬盘
排错步骤
To view full details, sign in with your My Oracle Support account. |
|
Don't have a My Oracle Support account? Click to get started! |
文档内容
用途 |
排错步骤 |
关于硬盘错误处理: |
Case R1.存储服务器的alerthistory日志显示硬盘的 S.M.A.R.T状态变成了 “ Predictive failure “: |
Case R2.存储服务器的alerthistory显示drivelun有一个关键错误,而且并没有错误恢复的提示: |
Case R3.DB服务器中 Megacli状态显示硬盘状态"Firmware state: (Unconfigured Bad)" 或者"Firmware状态为“Failed”: |
Case R4. 数据库服务器的硬盘状态为online,但是磁盘故障预警计数 > 0. |
Case R5.存储服务器的drive cell状态为” warning ”, MegaCli状态为”Firmware State: (Unconfigured Bad)”. Alerthistory日志可能报告这个硬盘状态为”未检测到”的状态. |
Case R6.Alerthistory的硬盘状态变为“Warning - Poor Performance”,尽管Megacli里硬盘 状态为 "Firmware State: Online", 并且没有error count. |
下面列举的情况不推荐做硬盘更换: |
Case N1.一些Media Error被sundiag日志里的MegaCLIPdList or LdPdInfo 命令输出发现,这些Media Error同时也在physicaldisk命令输出中被发现: |
Case N2.一些其它 Error被sundiag日志里的MegaCLIPdList or LdPdInfo 命令输出发现: |
Case N3.DB服务器上的ASM日志中的*.trc 文件 显示如下类似的错误信息: |
Case N4.使用了Exadata plug-ins的Oracle Enterprise Manager 使用者可能所有I/O error 被标记为”critical”. |
Case N5. 硬盘firmware状态为Unconfigured(good). |
Case N6. 存储服务器硬盘第二个正常状态报出后会紧跟着报”Warning - Confined Offline" |
参考 |