My Oracle Support Banner

Fujitsu GLS を使用している環境でネットワークリソースが OFFLINE になる (Doc ID 2019455.1)

Last updated on FEBRUARY 20, 2019

適用範囲:

Oracle Database - Enterprise Edition - バージョン 11.2.0.4 以降
Oracle Database Cloud Schema Service - バージョン N/A 以降
Oracle Database Exadata Cloud Machine - バージョン N/A 以降
Oracle Database Exadata Express Cloud Service - バージョン N/A 以降
Oracle Cloud Infrastructure - Database Service - バージョン N/A 以降
この文書の内容はすべてのプラットフォームに適用されます。
本文書利用上のご注意
  本文書は英語の文書 <Document 2013699.1> (最終メジャー更新日: 2015年06月11日) の日本語翻訳版です。
  英語の文書のメジャー更新に応じて本文書を随時更新いたします。

現象

GLS による NIC のフェイルオーバーが実施される前に、ネットワークリソースが予期せず OFFLINE になります。
この事象が発生した際は、orarootagent.log に以下の様な出力が見られます。 

[crsd orarootagent_root.log]

19:17:09.795: [ora.net1.network][check] getActiveInterface enter loop timeout = 30{ <--(***) タイムアウトのカウントに入ります
19:17:10.796: [ora.net1.network][check] Checking if net0 Interface is fine
19:17:10.796: [ora.net1.network][check] Interface Name = net0
19:17:10.796: [ora.net1.network][check] Primary IP = XXX.XXX.XXX.XXX
19:17:10.817: [ default][155]ICMP Ping from XXX.XXX.XXX.XXX to UNKNOWN
:
19:17:10.823: [ora.net1.network][check] ICMP Ping Exception in sCheckLink
19:17:10.823: [ora.net1.network][check] Checking if net4 Interface is fine
19:17:10.823: [ora.net1.network][check] Exception in checkNetInterface
ignoring
19:17:10.823: [ora.net1.network][check] Interface Name = net0
19:17:10.823: [ora.net1.network][check] Primary IP = XXX.XXX.XXX.XXX
19:17:10.845: [ default][155]ICMP Ping from XXX.XXX.XXX.XXX to UNKNOWN

:
:
:
19:17:20.229: [ora.net1.network][check] ICMP Ping Exception in sCheckLink
19:17:20.229: [ora.net1.network][check] getActiveInterface::checkLink = 0
19:17:20.229: [ora.net1.network][check] getActiveInterface exit } return 0 <--(***) 約 10 秒後にタイムアウトのカウントが終わります

19:17:20.230: [ AGFW][9] ora.net1.network XXXXX 1 state changed
from: ONLINE to: OFFLINE

 

変更点

本事象は、以下の4つすべての条件に該当する場合に発生します。

1) Fujitsu PRIMECLUSTER GLS を使用している環境である
2) 環境に Patch:18143836 が適用されている
3) GLS で管理されている NIC が通信不可の状態であるが、GLS の障害検出時間に達していない 
4) GLS で管理されている NIC の通信不可の状態が 10 秒以上継続している 

* messages の出力例

19:17:09 XXX mac: [ID 486395 kern.info] NOTICE: igb0 link down <-- (***) NIC のダウンを検知

:

19:17:31 XXX hanet: [ID 532911 user.error] ERROR: 87000: polling status changed: Primary polling failed. (net0,target=XXX.XXX.XXX.XXX)
19:17:31 XXX hanet: [ID 910662 user.info] INFO: 89100: logical IP address is inactivated. (XXX.XXX.XXX.XXX)
19:17:31 XXX hanet: [ID 590586 user.info] INFO: 88900: interface is inactivated. (net0)
19:17:32 XXX hanet: [ID 790143 user.info] INFO: 88800: interface is activated. (net4) <-- (***) NIC のダウンを検知してからフェイルオーバーに 10 秒以上要している 

(*) Patch:18143836 は以下のパッチセットに含まれています。
  - PSU 11.2.0.4.6 以降
  - PSR 12.1.0.2

原因

To view full details, sign in with your My Oracle Support account.

Don't have a My Oracle Support account? Click to get started!


本書の内容
現象
変更点
原因
解決策
参照情報

My Oracle Support provides customers with access to over a million knowledge articles and a vibrant support community of peers and Oracle experts.