• EOS Network Telemetryの概要〜LANZの出力

 
 
Print Friendly, PDF & Email

より粒度の細かいスイッチの状態監視や適切なトラフィックエンジニアリング実現のためにテレメトリデータの活用が注目されています。

EOSは、スイッチ単体、ネットワークワイドでテレメトリデータを収集するためにさまざまな機能を提供してきました。今回は、LANZの動作について紹介したEOS Network Telemetryの概要〜LANZの動作モード  で解説しなかったLANZ確認コマンドを実行した際の出力について補足していきます。

LANZの出力

早速、LANZの出力を確認しましょう。show queue-monitor lengthコマンドでLANZの動作状況を確認できます。コマンドを実行し、何かしら出力があれば、スイッチは輻輳状態にあると考えられます。”Time”, “Intf(TC)”を確認すれば、スイッチのどのポート、どのtraffic-class(TC)が輻輳状態にあるかがわかります。

#show queue-monitor length

Report generated at 2019-06-29 12:48:41
E-End, U-Update, S-Start, TC-Traffic Class
Segment size for congestion records is 256 bytes
* Max queue length during period of congestion
Type  Time                     Intf       Congestion  Queue       Time of Max
                               (TC)       duration    length      Queue length
                                          (usecs)     (segments)  relative to
                                                                  congestion
                                                                  start
                                                                  (usecs)
--------------------------------------------------------------------------------
E   24days,2:37:32.52084 ago  Et21/2(1) 280752       16416*      72916
E   24days,2:37:32.52097 ago  Et21/4(1) 283024       16258*      75150
E   24days,2:37:32.52110 ago  Et21/3(1) 282131       16302*      0
E   24days,2:37:32.52127 ago  Et21/1(1) 282337       16360*      0
U   24days,2:37:32.72867 ago  Et21/2(1) N/A          16416       N/A
U   24days,2:37:32.72884 ago  Et21/4(1) N/A          16258       N/A
U   24days,2:37:32.72900 ago  Et21/3(1) N/A          16178       N/A
U   24days,2:37:32.72924 ago  Et21/1(1) N/A          16240       N/A
E   24days,2:37:32.73130 ago  Cpu(24)   80901        64*         0
S   24days,2:37:32.80159 ago  Et21/2(1) N/A          16390       N/A
S   24days,2:37:32.80323 ago  Et21/3(1) N/A          16302       N/A
S   24days,2:37:32.80361 ago  Et21/1(1) N/A          16360       N/A
S   24days,2:37:32.80399 ago  Et21/4(1) N/A          16154       N/A
S   24days,2:37:32.81220 ago  Cpu(24)   N/A          64          N/A

LANZのメトリックス

それでは、前回の記事で触れなかったshow queue-monitor length の“Congestion duration”, “Queue length”,  “Time of max q length relative to congestion start”の出力についても確認しましょう。

Congestion duration:  輻輳が発生したQueueが、どのくらいの時間、輻輳状態にあったのかを示しています。輻輳状態が継続する間、Congestion durationは、輻輳状態が継続する時間を示しています。出力左手の”Type”のflagに着目すると、”S” flagから、”E” flagが出力されるまでの時間が輻輳状態にあったと考えられます。たとえば、5ミリ秒の間、輻輳状態が継続すると、”E” flagが出力されるとともに、Congestion durationには、”5000″が記録されることになります。
Time of max q length relative to congestion start: 輻輳状態が継続する間にQueueが、最大バッファ使用量に達したときのタイムスタンプを表示します。つまり、開始時間と終了時間の間でバッファ使用量が最大になった時間を示します。最も輻輳が激しかった時間を確認できます。
Queue length:  輻輳状態をレポートしたタイミングにおける、当該ポートとトラフィック・クラス(Intf/TC)のQueue lengthを表示します。

出力例 (1)

それでは、上記を参考にしながら、先ほどの出力を確認してみます。

E   24days,2:37:32.52127 ago Et21/1(1)  282337     16360*     0
U   24days,2:37:32.72924 ago Et21/1(1)  N/A        16240      N/A
S   24days,2:37:32.80361 ago Et21/1(1)  N/A        16360      N/A

Etherent 21/1 のtraffic-class 1で2:37:32.80361から、輻輳状態が検出されました。輻輳状態は、2:37:32.52127に輻輳状態をレポートする閾値を下回りました。輻輳状態が検出され、レポートされたタイミングなので、2:37:32.80361の“Congestion duration”の出力は、”N/A”となります。2:37:32.72924の“Congestion duration”の出力も”N/A”となります。輻輳状態が終了する2:37:32.52127の“Congestion duration”の出力は、輻輳状態検出から終了までの282337となります。 輻輳状態終了時が、バッファ使用量が最大になった時間であるため0となり、“Queue length”に”*”が記録されます。合わせて実際にEthernet 21/1の状態も確認しておきます。


#show inter counters queue detail | nz
Port          TxQ  Fwd pkts      Fwd bytes            Drop pkts   Drop bytes
------------- ---  ----------    -------------------- ----------  --------------------
Ethernet19/1  (1)  0             0                    1           196
Ethernet21/1  (1)  33266891669   16874083759076       9891386097  5024824014348
Ethernet21/1  (6)  69262         5740216              0           0

出力例 (2)

E   24days,2:37:32.52097 ago Et21/4(1)  283024      16258     75150
U   24days,2:37:32.72884 ago Et21/4(1)  N/A         16258     N/A
S   24days,2:37:32.80399 ago Et21/4(1)  N/A         16154     N/A

Ethenet 21/4 のtraffic-class 1では、輻輳状態が終了したタイミングで、輻輳状態終了時が、バッファ使用量が最大になった時間が記録されていますので、バッファ使用量が最大になったのは、輻輳状態の間であったことが確認できます。

出力例 (3)

E     24days,2:37:32.73130 ago  Cpu(24)    80901        64*       0
S     24days,2:37:32.81220 ago  Cpu(24)    N/A          64        N/A

#show cpu counters queue | nz
DevId  Queue  Fwd pkts   Fwd bytes            Drop pkts     Drop bytes
-----  -----  ---------- -------------------- ----------    --------------------
0      Q24    8819       2460982              9971          3562988

CPU向けのトラフィックを処理するQueueもLANZの監視対象になります。ここでは、CPU向けのQueueのtraffic-class 24が輻輳状態にあることを通知しています。show cpu counters queueの出力からもスイッチが処理するパケットがCPUに向かい、ドロップしていることがわかります。

ここでは、スイッチでミラーリングによって、CPU保護を目的に適用されるコントロールプレーン・ポリシングによってCPU向けのミラーリングトラフィックがポリシングされた結果、Queueが輻輳状態となったと判断できます。

Follow

Get every new post on this blog delivered to your Inbox.

Join other followers: