問題判別とヒント - public.dhe.ibm.compublic.dhe.ibm.com/software/dw/jp/websphere/was/... ·...
Transcript of 問題判別とヒント - public.dhe.ibm.compublic.dhe.ibm.com/software/dw/jp/websphere/was/... ·...
1
Edge Components V7 ガイド
問題判別とヒント
2
2
Agenda
まず確認すべきサイト
Load Balancer構成の注意点
Windows環境の注意点
問題判別のための情報収集
3
3
まず確認すべきサイト
4
4
まず確認すべきサイト
Edge Components InfoCenter製品マニュアル
http://publib.boulder.ibm.com/infocenter/wasinfo/v7r0/index.jsp?topic=/com.ibm.websphere.edge.doc/welcome.html
TroubleShooting: EDGE Load Balancer for Version 6.0, 6.1, and 7.0トラブルシューティングのための基本情報集(英語)
http://www-01.ibm.com/support/docview.wss?rs=180&uid=swg21321596
Edge Components Load Balancer iFix情報Load BalancerのiFix情報
http://www-06.ibm.com/software/jp/websphere/download/ifix/was/edge/
WASサポート・サイトTechnoteや既知の障害情報
http://www-306.ibm.com/software/webservers/appserv/was/support/
WebSphere デベロッパー・ドメイン日本語の技術情報や連載記事、ワークショップ資料
http://www-6.ibm.com/jp/software/websphere/developer/
テクニカル・サポート検索過去のQA情報
http://www-1.ibm.com/support/jp/search/
5
5
Load Balancer構成の注意点
6
6
Load Balancer と NTP
Load BalancerマシンではNTPを無効にすることを推奨HA構成時に、ハートビートにより相互監視を行うロジックの中でシステム時間が使われており、NTPにより時間の調整が行われると、予期せぬテイクオーバーの原因となることがあります
NTPをやむを得ず使用する場合には、sleuthモードで許容される時間の変更幅を0.1秒以内に設定し稼動させるようにしてください。また、それでも問題が発生した場合には、Best Effortでのサポートとなります。なお、問題判別のために、NTPを停止した状態で再現テストを実施していただく必要がありますのでご注意ください
予期せぬテイクオーバーへのその他の対処方法Heartbeat間隔を広げ、 Heartbeatの断絶の可能性を減らす
dscontrol executor set hatimeout <断絶を許容する秒数(デフォルト2)>
広げすぎると障害発生時の検知が遅くなりますので注意が必要です
Heartbeatを2重化し、Heartbeatの断絶の可能性を減らすHeartbeatを2重化した際にはReachabilityの設定が必要になります
詳細はノートのリンク先をご確認ください
Network Time Protocol support with WebSphere Edge Components
http://www-01.ibm.com/support/docview.wss?rs=180&uid=swg21178386
7
7
Load Balancer と NIC チーミング
Load BalancerマシンではNICのチーミングはサポートされません
Fault Tolerance(フェイルオーバー構成)とPort Aggregation(アクティブ-アクティブ構成)のネットワーク構成がサポートされないことがシステム要件に明記されています
Windows teaming、Linux bonding、AIX NIB(Network Interface Backup)などがこのネットワーク構成に該当します
NIC障害に関しては、Load Balancerがテイクオーバーし、バックアップ機が処理を行う事で可用性を確保します
詳細はノートのリンク先をご確認ください
【注意事項 - Edge Components Load Balancer V6.1/V7.0】サポート情報の更新について (WAS-09-025)
http://www-06.ibm.com/jp/domino01/mkt/cnpages1.nsf/page/default-000A6F6C
8
8
Load Balancer と仮想化テクノロジー
WAS製品はAIXのDLPARやVMwareといった仮想化テクノロジーを一般的にはサポートしています
ただし、Load Balancerのようなカーネルに依存する製品については、特別の考慮事項が必要です
Load Balancer製品は仮想化環境でテストされているわけではないため、必ず、テスト環境で十分なテストを実施して下さい
問題が発生した場合、仮想化環境ではない環境で同様の問題が発生するか、テストを依頼する場合があります
Load Balancerの正副機を物理的に同一のマシンに配置すると、マシン障害時のケースではSingle Point of Failureとなりますのでご注意ください
詳細はノートのリンク先をご確認ください
仮想化テクノロジーに対するサポート
http://www-06.ibm.com/software/jp/websphere/support/virtualization/
Virtualization support for WebSphere Application Server Network Deployment Load Balancer
http://www-01.ibm.com/support/docview.wss?rs=180&uid=swg21265712
9
9
IHS/WAS 以外のサーバーへの割り振りについて
基本的にLoad BalancerはWAS環境への振り分けを行う製品です
WAS環境以外への振り分けもサポートされますが、WAS環境の場合でも同一の問題が発生することが前提となります
HTTP/HTTPS以外のプロトコルについても、技術的に振り分けは可能ですが、やはりWAS環境でも同一も問題が発生することがサポートの条件となります
詳細はノートのリンク先をご確認ください
Support of Edge Components of IBM WebSphere Application Server V6.0.2 and V6.1
http://www-01.ibm.com/support/docview.wss?rs=180&uid=swg21305987
IBM WebSphere Application Server Network Deployment V 7.0 license agreement
http://www-03.ibm.com/software/sla/sladb.nsf/displaylis/F28DEEC36644E9FE002574BF0060D8E8
10
10
Windows 環境の注意点
11
11
メディア検出
ネットワーク障害の際に正常にTakeoverを行うためには、Windowsの「メディア検出」機能を無効にする必要があります
メディア検出を無効にしていない場合、ネットワークがリンクダウンした場合に、Windowsがそれを検知し、インターフェースからIPアドレスが除去されてしまいます
C:¥Documents and Settings¥Administrator>ipconfig
Windows IP Configuration
Ethernet adapter ローカル エリア接続:
Media State . . . . . . . . . . . : Media disconnected
C:¥Documents and Settings¥Administrator>
C:¥Documents and Settings¥Administrator>dscontroljava.rmi.ConnectIOException: Exception creating connection to: 9.188.198.196; nested exception is:
java.net.NoRouteToHostException: No route to host: connectエラー: サーバーが応答していません。
C:¥Documents and Settings¥Administrator>
dscontrolコマンドはdsserverと通信しますが、IPアドレスが除去されてしまっていると正しく通信ができません
12
12
メディア検出の無効化
メディア検出を無効化の設定はレジストリエディタにより行います
レジストリ エディタ (Regedt32.exe) を使用して、レジストリにある次のキーを表示します
HKEY_LOCAL_MACHINE¥System¥CurrentControlSet¥Services¥Tcpip¥Parameters
次のレジストリ値を追加し、コンピューターを再起動します値の名前 : DisableDHCPMediaSense
データの種類 : REG_DWORD -Boolean
値のデータ範囲 : 0、1 (False、True)、デフォルト値 : 0 (False)
Windows で TCP/IP のメディア検出機能を無効にする方法
http://support.microsoft.com/kb/239924/ja
13
13
TCP/IP オフロードと RSS
TCP/IPオフロードやRSSが有効になっていると、LBが正常に機能しない場合があるため、無効化する必要があります
TCP/IPオフロードはパケットのチェックサムの計算などをOSではなくネットワーク・アダプターで行う機能です
製品によって異なる名称で呼ばれますのでご注意下さい
RSSは複数CPUでパケットの処理を分散して行う機能です
対応したネットワーク・アダプターを使用しているコンピューターにWindows Server 2003 Service Pack 2(SP2)またはWindows Server 2003 Scalable Network Pack(SNP)をインストールすると、これらの機能が使用可能になります
Broadcom社製ネットワーク・アダプターを使用している場合Ethernet@Wirespeed機能も同様に問題を引き起こす可能性があります
この機能が使用可能なアダプターを使用している場合、無効に設定して下さい
14
14
TCP/IP オフロードと RSS の無効化
以下のいずれかの方法で無効化します1. ネットワーク・アダプター・ドライバーのReceive Side Scalingおよび
TCPオフロードを手動で無効にする
2. レジストリでRSSおよびTCPオフロードを手動で無効にする
3. SNPをオフにするWindowsの修正プログラムをインストールする
TCPセグメンテーションのオフロード受信IPチェックサムのオフロード受信TCPチェックサムのオフロード送信IPチェックサムのオフロード送信TCPチェックサムのオフロード
など
例)Intel
IPv4 Checksum OffloadIPv4 Large Send OffloadReceive Side Scalingなど
例)Broadcom
Windows Server 2003 ベースおよび Small Business Server 2003 ベースの既定の SNP 機能をオフにする更新プログラム
http://support.microsoft.com/kb/948496/ja
15
15
TCP/IP フィルタリング
LBは割り振り先サーバーのヘルスチェックにpingも使用しています。このため、ICMPプロトコルが許可されている必要があります。IP プロトコルの Protocol 1(icmp) が許可されていることを確認してください
16
16
アダプタとバインド
割り振り先サーバーでMicrosoft Loopback Adapterをインストールした場合、ネットワーク・アダプターの優先順位を確認してください
MAC転送の割り振り先となるWindowsサーバーでは、ループバック・アダプターをインストールしますが、このアダプターの優先順位が通常のネットワーク・アダプターよりも高い優先順位になっていると、ルーティングに問題をもたらします
ループバック・アダプターに対応する接続の優先順位を一番下にしてください
ループバックに対応するアダプタの優先順位を一番下にする
17
17
Load Balancer の問題判別に必要な情報
18
18
Load Balancer の問題判別に必要な情報
1. 現行構成ファイルdscontrol file save <ファイル名>
以下の箇所に指定したファイル名で保管される<EDGE_ROOT>/ulb/servers/configurations/dispatcher
2. スクリプトファイル以下のディレクトリにあるserverDownなどのスクリプトファイル
<EDGE_ROOT>/ulb/servers/bin
3. Load Balancerの詳細バージョン以下の方法で確認
[AIX] lslpp –l | grep ibmulb
[Linux] rpm -qa | grep ibmulb
[Windows] dscontrol executor report
4. Javaの詳細バージョンjava -version
19
19
Load Balancer の問題判別に必要な情報
5. LBと割り振り先サーバーのネットワークインターフェース設定情報
[Unix] ifconfig -a [Windows] ipconfig –all
6. LBと割り振り先サーバーのルーティング・テーブル[Unix] netstat –rn [Windows] route print
7. LBと割り振り先サーバーの接続テーブル[Unix] netstat –an [Windows] netstat –an
bronze:[/]# ifconfig -aen0: flags=4e080863,80<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,PSEG,CHAIN>
inet 9.188.198.215 netmask 0xffffff00 broadcast 9.188.198.255inet 9.188.198.214 netmask 0xffffff00 broadcast 9.188.198.255
lo0: flags=e08084b<UP,BROADCAST,LOOPBACK,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT>inet 127.0.0.1 netmask 0xff000000 broadcast 127.255.255.255inet6 ::1/0tcp_sendspace 131072 tcp_recvspace 131072 rfc1323 1
20
20
Load Balancer の問題判別に必要な情報
8. 各種ログログ・レベルを5に設定します
ログ・サイズも適切に設定します
server.logdscontrol set loglevel 5
dscontrol set logsize unlimited
manager.logdscontrol manager loglevel 5
dscontrol manager logsize unlimited
reach.logdscontrol manager reach set loglevel 5
dscontrol manager reach set logsize unlimited
アドバイザー・ログdscontrol advisor loglevel <アドバイザー名> <ポート> 5
dscontrol advisor logsize <アドバイザー名> <ポート> unlimited
ログの出力先<EDGE_ROOT>/ulb/servers/logs/dispatcher
21
21
Load Balancer の問題判別に必要な情報
9. ネットワーク・トレース最終的にログなどから問題が切り分けることができない場合は、ネットワーク・トレースを採取
[AIX] iptrace -a -b <出力ファイル名>
[Linux] tcpdump -w <出力ファイル名>
[Windows] Wiresharkなどパケット・トレース・ツールを使用
IPトレースの使用法については以下を参照http://publib.boulder.ibm.com/infocenter/pseries/index.jsp?topic=/com.ibm.aix.doc/cmds/aixcmds3/iptrace.htm
22
22
(参考)Wireshark
様々なOSで使用可能なネットワークモニタリング・ツールhttp://www.wireshark.org/からダウンロード可能