• EOS Network Telemetryの概要〜CloudVisionを活用した新しい監視

 
 
Print Friendly, PDF & Email

粒度の細かいスイッチの状態監視や適切なトラフィックエンジニアリング実現のためにテレメトリデータの活用が注目されてきました。2018年は、テレメトリデータの活用を視野にした評価が本格化してきた印象です。2019年には、Network Telemetryを活用した監視の導入がすすむことが期待されます。今回は、CloudVisionによるNetwork Telemetryデータの可視化とネットワーク監視について紹介します。

従来のネットワーク監視

これまで多くのネットワークでは、SNMPを利用した障害監視や性能監視が行われてきました。SNMPは、回線速度やコンピュータ性能といった環境を考慮し、ポーリングによって障害監視や性能監視を実現してきました。技術革新により、回線速度やコンピュータ性能が大きく進歩したことにより、ネットワークのアーキテクチャも大きく変革しました。この変化に対応するためネットワーク監視にも変化が求められています。この変化のひとつが、これまで紹介してきたNetwork Telemetryの考え方です。アリスタネットワークスは、より多くのお客さまにNetwork Telemetryを活用した監視をメリットを享受いただくためにCloudVision (CVP)の機能強化を進めています。

CVPによるネットワーク監視の特徴

CloudVisionによるネットワーク監視は、クラウドネットワーキング のアーキテクチャを監視するため、特徴のある機能を実装しています。その代表例が、オープンAPIによるストリーミング、検索によるストリーミングデータへのアクセス、スナップショットによる比較、チャットツールへの通知といった機能になります。

オープンAPI

EOSデバイスは、従来からeAPIやgRPCを介してテレメトリデータを外部にテレメトリデータを提供してきました。さらにベンダー・ニュートラルなネットワーク管理の実現のため、オープンAPI(OpenConfig)のサポート、OpenConfigの実装を強化しています。

ストリーミングデータへのアクセス

アリスタネットワークスは、さまざまな外部システムへのストリーミングが可能になっています。ストリーミングされたデータは、その頻度からデータ量が膨大です。したがって、データへのアクセス方法にも工夫が必要になります。最新のCloudVision2018.2.1では、検索とタイムスライダによって効果的にデータアクセスすることが可能になっています。

  • 検索
    クラウドネットワーキングの特徴のひとつは、スケールアウト型のアーキテクチャです。プラットフォームの追加により、ワークロードの要件に合わせた拡張が可能になります。ネットワークの拡張は、監視対象が増加し、ネットワークの変化を把握することが難しくなることが課題です。そこで、CloudVisionではは、検索を利用してこの課題にアプローチしています。
    以下のムービーでは、Event Viewでキーワード(discard)による検索を実行、ネットワーク上に該当する異常があるか確認します。リストされるdiscardイベントに関連するメトリックスが相関付されて表示されます。discardは生じているもののルーティングアップデートには影響がないことが確認できます。
  • タイムスライダ
    ストリーミングされた膨大なデータを相関させ、迅速にアクセスすることは簡単ではありません。CloudVisionは、ヒューリスティックな解析エンジンを利用してEOSプラットフォームからストリーミングされるデータを相関関係づけしてEvent Viewerに出力します。さらに時間をキーにすることで「そのとき、発生したイベント」「そのイベントの継続性」を簡単に確認することが可能です。以下のムービーでは、12月30日15:00ごろを例にしたデータアクセスを紹介します。あるプラットフォーム(ホスト名:chralie)でoutput errorを検出し、そのイベントの継続性と関連情報(throughput, transceiver DOMなど)を簡単に確認できます。

スナップショットによる比較

スケーラブルなクラウドネットワーキングにおいて、ネットワークの状態を把握するには、前後の状態を比較することも効率的です。CloudVisionでは、スナップショットを活用することでネットワークの状態変化を把握することが可能です。スナップショットの定義にはコマンドラインを利用します。任意のコマンドラインと実行時間をスナップショット取得対象に対して設定します。

  • スナップショット
    以下の例では、スナップショットにLLDP状態を把握するコマンド(show lldp neighbor)を設定し隣接状態の変化を把握しています。定期的なネットワーク状態の監視、サービス追加に伴う、ネットワーク作業前後の確認といったシーンで効率的に監視することが可能になります。

 

チャットツールと通知

これまでのネットワークでは、デバイスが出力するイベントやアラームをメールなどに出力することで、外部にネットワークの変化を通知していました。最近では、コミュニケーションツールとしてチャットツールの活用が広まってきました。ネットワークの構築や運用の場面でもチャットツールの活用は定着しつつあるようです。CloudVisionもこのような構築・運用の変化に対応するため、チャットツールにイベントを転送することが可能になっています。チャットツールを利用したイベント通知については、別の機会に紹介します。

 

Network Telemetryの活用は、これまでのネットワーク監視が抱える課題を解決します。CloudVisionの導入により、ターンキーでNetwork Telemetryをベースにしたネットワーク監視をスタートすることが可能になります。さらに、CloudVisionは、スケーラブルなクラウドネットワーキングのアーキテクチャを効率的に監視する機能を実装しています。今回は、その代表的な機能、検索、比較、タイムスライダを紹介しました。

 

 

Follow

Get every new post on this blog delivered to your Inbox.

Join other followers: