My Oracle Support Banner

[Linux OS] Exadata 環境において "order:5" の Page Allocaton Failure が多数発生してシステムハング状態になる事象 (Doc ID 2066182.1)

Last updated on AUGUST 04, 2018

適用範囲:

Linux OS - バージョン Oracle Linux 5.5 以降
Linux x86-64
この事象はクラスタ間通信に Infiniband を使用する Exadata 環境において発生します。

現象

本事象はシステムがメモリ圧迫状態の際に発生しえます。Exadata では Infiniband 上のIP通信における MTU ペイロードサイズは 65520 です。そのため、通信パケットを生成するために確保するメモリとして、この MTU およびオーバーヘッド分のメモリ量、おおよそ 32 ページ (1 ページ 4kbyte, order 5) 分の連続した領域を要します。 システムがメモリ圧迫状態に陥ると、32 ページ分の連続したメモリ領域の確保が難しくなります。order 5 以下単位のメモリ領域でさえ確保が難しくなる場合があります。

/var/log/messages ログファイルやシリアルコンソールには、以下のような "page allocation failure" メッセージが多数出力されます。コールトレースにはネットワーク初期化コード、主に __alloc_skb() 関数からの呼び出しでメモリ要求を実行していることがわかります。

 "page allocation failure" メッセージがシステムログに出力されるに伴い、サーバがハングアップ状態 (操作応答が無い、フリーズ状態になる) になったり、状況によっては突然再起動される場合もあります。

原因

To view full details, sign in with your My Oracle Support account.

Don't have a My Oracle Support account? Click to get started!


My Oracle Support provides customers with access to over a million knowledge articles and a vibrant support community of peers and Oracle experts.