なぜパフォーマンス監視が必要なのでしょうか? Node.js のパフォーマンス監視について話しましょう

著者：Eve Cole 更新時間：2022-08-18 08:58:05

なぜパフォーマンス監視が必要なのでしょうか?この記事では、Node.js のパフォーマンス監視について説明します。お役に立てれば幸いです。

パフォーマンス監視が必要な理由

Node は、サーバー側の Javascript のランタイムとして、JavaScript のアプリケーションシナリオを大幅に強化します。

しかし、Node.js ランタイム自体はブラックボックスであり、ランタイムの状態を認識することができず、オンライン上での問題を再現することは困難です。

したがって、パフォーマンスの監視は、Node.js アプリケーションの「通常の動作」の基礎となります。さまざまな実行時インジケーターをいつでも監視できるだけでなく、異常なシナリオの問題のトラブルシューティングにも役立ちます。

コンポーネントの

パフォーマンス監視は、パフォーマンスインジケータの収集と表示の 2 つの部分に分けることができます

。
- プロセスレベルのデータ: CPU、メモリ、ヒープ、GC、およびその他の
- システムレベルのデータ: ディスク占有率、I/O 負荷、TCP/UDP 接続ステータス、など
- アプリケーション層データ:
QPS、低速 HTTP、ビジネス処理リンクログなどの
パフォーマンスデータのキャプチャと分析
- ヒープスナップショット: ヒープメモリのスナップショット
- Cpuprofile: CPU スナップショット
- コアダンプ:

アプリケーションクラッシュスナップショットソリューションの比較

上の図から、現在主流の 3 つの Node.js パフォーマンス監視ソリューションの長所と短所がわかります。以下に、これら 3 つのソリューションの構成を簡単に紹介します。

Prometheus
- prom-client は、prometheus の nodejs 実装です。
- ため
- に使用される視覚化プラットフォームです。prometheus へのアクセスは
- 、閉ループ
AliNode を形成するための問題のトラブルシューティングにのみ必要です。
- Alinode は、公式の Nodejs と互換性のある拡張ランタイムであり、いくつかの追加機能を提供します:
  - v8 のランタイムメモリステータス監視
  - libuv のランタイムステータス監視
  - オンライン障害診断機能: ヒープスナップショット、CPU プロファイル、GC トレースなど。agenthub
- は、パフォーマンスインジケーターを収集するために使用される常駐プロセスです。
  - 統合された Agentx + commdx の便利なツールは
  、
- 監視、表示、スナップショット、分析までの閉ループを形成しますが、
Easy-Monitor
- xprofiler が担当するランタイムの
- リアルタイムの実行時ステータスのサンプリングと出力パフォーマンスログ (つまり、パフォーマンスデータの取得)
- xtransit は、パフォーマンスログの収集と送信を担当します。
- AliNode との最大の違いはNode.js Addon

パフォーマンスインジケーター

CPU を

実装するために Node.js アドオンを使用することです。

現在のプロセスの CPU 時間消費データはprocess.cpuUsage()戻り値の単位はマイクロ秒です。

user: プロセス実行時にプロセス自体が消費した CPU 時間
system: プロセスが消費した CPU 時間。プロセス実行時のシステム

メモリ

現在のプロセスのメモリ割り当てデータはprocess.memoryUsage()を通じて取得できます。戻り値の単位はバイトです。

rss: 常駐メモリ、ノードプロセスによって割り当てられた合計メモリサイズ
heapTotal: v8 によって適用されたヒープメモリサイズ。
heapused: v8 によって使用されるヒープ Memory
sizeexternal: v8 によって管理される C++ によって占有されるメモリサイズ
arrayBuffers: ArrayBuffer に割り当てられたメモリサイズ

上の図からわかるように、 rssはコードセグメント ( Code Segment )、スタックメモリ ( Stack )、およびヒープメモリ ( Heap ) が含まれています。

コード
セグメント:
コードスタック: ローカル変数と管理関数呼び出しが格納されます。
オブジェクト、クロージャを格納します。または、他のすべての

ヒープは、

v8.getHeapStatistics()およびv8.getHeapSpaceStatistics()次の図は、v8 のヒープメモリ構成の分布を示しています。

ヒープメモリ空間はまずスペースに分割され、そのスペースは 1MB のアライメントに従ってページ化されます。

新しいスペース: 新しい世代のスペース。ライフサイクルが比較的短いオブジェクトデータを保存するために使用され、2 つのスペース (スペースタイプはsemi space ) に分割されます。 from space to space
- プロモーション条件: 新しいスペースで 2 回の GC が実行された後も存続します。
古いスペース: New Spaceによってプロモートされたオブジェクトを格納するために使用される古い世代スペース
コードスペース: v8 JIT によってコンパイルされた実行可能コードを格納します。
マップスペース: Object が指す隠しクラスのポインターオブジェクトを格納します。ランタイムに応じて、オブジェクトレイアウト構造は、オブジェクトメンバーに迅速にアクセスするために使用されます。
ラージオブジェクトスペース: ページに割り当てられない 1MB を超えるオブジェクトを格納するために使用さ

れ

ます

。 GC: 旧世代でのオブジェクトのリサイクルにMark-Sweep-Compactアルゴリズムを使用します。
: 新世代Scavenge

Scavenge

でオブジェクトのリサイクルに Scavenge アルゴリズムが使用されます。

前提: New space 、 fromとto

トリガーのタイミング: New spaceがいっぱいになったとき。

手順:

from spaceで、幅優先の走査を実行し
、生き残った (到達可能な) オブジェクトが
- 1 回生き残ったことを確認します。スカベンジを経験し、 Old spaceと
- 他のコピーをto space
to spaceが終了すると、 from spaceスペースが空になり、
from spaceからto spaceの交換が行われ、次のラウンドScavengeが開始されます。

頻繁なリサイクルやメモリ不足に適しています。大きなオブジェクトの場合、一般的なスペースフォータイム戦略には、

Mark-Sweet-Compact の 2 倍のスペースを浪費するという欠点があります。

3 つのステップ: マーキング、クリア、整理

トリガータイミング: Old spaceがいっぱいになったとき

ステップ:

マーキング (3 色マーキング方法)。
- 黒: リサイクル不可能なオブジェクトと生成されたすべての参照を表します
- 。
- リサイクル
- 不可能なオブジェクトを表し、それらによって生成された参照はまだスキャンされていません。V8
- ルートオブジェクトによって直接参照されるオブジェクトをmarking queue (明示的スタック) に入れ、これらのオブジェクトをグレーとしてマークします。
- これらのオブジェクトから深度を開始します。オブジェクトがアクセスされるたびに、オブジェクトをmarking queueからpopて黒にマークし
- 、オブジェクトによって参照されるすべての白いオブジェクトをmarking queueにpush
- 。スタック上のすべてのオブジェクトはドロップされるまでポップされます。旧世代のオブジェクトは黒 (リサイクル不可) と白 (リサイクル可能) の 2 種類のみです。
- PS: オブジェクトが大きすぎて使用できない場合。スペースが限られているスタックにプッシュされた場合、v8 はオブジェクトを灰色のままにしてスキップし、スタック全体をオーバーフロー (オーバーフロー) としてマークし、スタックがクリアされるのを待って、マークを再度走査します。これには追加のスキャンが必要になります。ヒープの
白いオブジェクトをクリアする
スイープは
- メモリ
- 空間を不連続にします
。コンパクト
- スイープはメモリ空間を不連続にします。新しいオブジェクトが GC に入り
- 、黒い (生存) オブジェクトが 1 つに移動するの
- これによりOld space
- メモリの断片化の問題は解決できますが、一時停止時間が長くなり (実行速度が遅くなり)
- 、新しい学生にとって十分なスペースが確保されません。プロモートされたオブジェクトを割り当てる場合にのみ使用されます

。

Stop-The-World

v8 が最初にガベージコレクションを実行するときは、プログラムを再実行する前にプログラムを停止し、ヒープ全体をスキャンし、メモリを再利用する必要があります。この動作は完全停止 ( Stop-The-World ) と呼ばれます

が、新しい世代のアクティブなオブジェクトは小さく、頻繁にリサイクルされますが、完全な停止はほとんど影響を与えません。マーキング、クリーニング、仕分けなどによる一時停止も発生します。さらに深刻になります。

最適化戦略の

増分リサイクル (増分マーキング): マーキングフェーズでは、ヒープが特定のサイズに達すると、一定量のメモリが割り当てられるたびに増分 GC が開始され、実行中のプログラムが一時停止され、数ミリ秒間マーキングが行われます。数十ミリ秒まで待ってからプログラムを再開します。

この概念は、実際には React フレームワークのファイバーアーキテクチャに似ています。ブラウザーの空き時間中のみファイバーツリーを通過して、対応するタスクを実行します。それ以外の場合、実行は遅延し、メインスレッドのタスクへの影響は最小限に抑えられます。、アプリケーションの遅延を回避し、アプリケーションのパフォーマンスを向上させます。

同時スイープ: 実行中のプログラムのメインスレッドとの競合を気にすることなく、他のスレッドが同時にスイープを実行できるようにします。
並列スイープ: 複数のスイープスレッドを同時に動作させ、スイープのスループットを向上させ、GC 周期全体を短縮します。

v8 には新世代と旧世代のスペースにデフォルト制限があるため、

新しい

New spaceデフォルト制限は 64 ビットシステムの場合は 32M、
Old spaceデフォルト制限は 64 ビットシステムの場合は 1400M です
32 ビットシステムの場合は 700M

したがって、 node新世代と旧世代のスペースの上限を調整するために 2 つのパラメーターが提供されます

--max-semi-space-size : New Spaceのスペース
--max-old-space-size
--max-old-space-size : Old Spaceの最大値を設定します space

View GC ログ

nodeは、GC ログを表示する 3 つの方法もあります:

--trace_gc : ログの 1 行に、各 GC の時間、タイプ、ヒープサイズの変更と原因が簡単に説明されます
--trace_gc_verbose : 各 GC 後の各 V8 ヒープを表示します。スペースの詳細なステータス
--trace_gc_nvp : GC タイプ、一時停止時間、メモリ変更などを含む、各 GC の詳細なキーと値のペア情報。GC

ログは比較的原始的であり、必要な情報を必要とします

。

二次処理には、AliNode チームが開発した v8-gc を使用できます。Heapsnapshot

は

、

実行中のプログラムのヒープメモリのスナップショットを取得し、メモリ消費を分析し、

Heapsnapshot ファイルの

生成方法を

変更

できます.heapsnapshot次の方法で生成されます:

heapdump を使用する

v8 のヒーププロファイルの使用

Nodejs の組み込み v8 モジュールによって提供される
API
- v8.getHeapSnapshot()
を使用します。
- v8.writeHeapSnapshot(fileName)
v8-profiler-next の使用

分析メソッド

によって生成された .heapsnapshot ファイルは

、Chrome devtools ツールバーのメモリにアップロード.heapsnapshot 、結果は次のように表示されます。

デフォルトのビューはSummaryビューです。ここでは、右端の 2 つの列に注意する必要があります: Shallow Size Retained Size

Shallow Size v8 ヒープメモリに割り当てられたオブジェクト自体のサイズを示します
Retained Sizeオブジェクトのすべての参照オブジェクトのShallow Size

Retained Size大きいことが判明した場合、オブジェクト内でメモリリークが発生している可能性があるため、

Comparisonビューを使用して比較

することができます。

2 つの異なる期間のヒープスナップショットを分析する場合、 Delta列を使用して、メモリ変更が最も大きいオブジェクトを除外できます。

Cpuprofile は

、プログラムを実行しているCPU のスナップショットサンプリングを実行します。これは、CPU 時間と割合を分析するために使用できます。

.cpuprofileファイルを生成するには、いくつかの方法があります。

v8

-profiler (ノードによって公式に提供されるツールですが、現在は使用できません)。
v8-profiler-next (中国のメンテナンスバージョン、最新のノード v18 をサポート、継続メンテナンス中
)

これは 5 分間の CPU プロファイルサンプルコレクションです

。

分析メソッド

Javascript Profiler生成された.cpuprofileファイルは、

Chrome devtools ツールバーの Javascript Profiler に表示できます (デフォルトのタブではなく、ファイルのアップロードを選択した後、ツールバーの右側にある [詳細] で開く必要があります)。の場合、表示結果は次のようになります。

デフォルトのビューはHeavyビューです。ここではSelf TimeとTotal Time

Total Time実行時間を表します
Self Time他の呼び出しを除く)。
合計時間と自己時間に大きな差異があることが判明した場合、その関数は

CPU に多くの時間を費やす計算を行っている可能性があります。

アプリケーションが予期せずクラッシュして終了した場合は、

Self Time Total Timeシューティングを行うこともできます

。

システムはそれを自動的に記録します。プロセスはその時点でメモリ割り当て情報、プログラムカウンター、スタックポインター、およびその他の重要な情報をクラッシュし

、.core ファイルを

生成

.core 3 つの方法:

ulimit -c unlimitedカーネル制限を開きます。
node --abort-on-uncaught-exceptionの起動時にこのパラメータを追加すると、アプリケーションでキャッチされない例外が発生したときにコアファイルを生成できます。
gcore <pid>

.coreファイルを取得した後、解析と解析

を

行います。

診断は、mdb、gdb、lldb などのツールを通じて行うことができます。プロセスクラッシュの実際の原因

llnode `which node` -c /path/to/core/dump

ケース分析の

観察

監視すると、ヒープメモリが増加し続けていることがわかります。そのため、トラブルシューティング

と分析にはヒープスナップショットが必要です。

heapsnapshot分析すると、比較的大きなメモリを常に保持しているnewThingオブジェクトが存在することがわかります

。

コードからは、未使用のメソッドは呼び出されませんが、newThing オブジェクトが theThing から参照されているため、replaceThing 関数の実行コンテキストに常に存在し、解放されていないことがわかります。これは

newThing theThing unused

概要

です。

クロージャによって引き起こされるreplaceThingのケースには、

グローバル変数、
クロージャ、
タイマー、
イベントリスニング
キャッシュ

などの状況が含まれます

。

したがって、上記の状況では、メモリ内のオブジェクトが自動的にリサイクルされるかどうかを慎重に検討する必要があります。自動的にリサイクルされない場合は、オブジェクトを手動でnullに設定する、タイマーを削除する、イベントリスナーをバインド解除するなど、手動でリサイクルする必要があります。

この記事

では

、Node.js パフォーマンス監視システム全体について詳しく説明しました。

まず、パフォーマンス監視によって解決される問題、そのコンポーネント、および主流のソリューションの長所と短所の比較を紹介します。

次に、パフォーマンスインジケーターとスナップショットツールの 2 つの主要な部分を詳細に紹介します。

パフォーマンスインジケーターは主に CPU、メモリ、ヒープ領域、GC インジケーターに焦点を当てます。同時に、v8 の GC 戦略と GC 最適化計画も紹介します。
、
主にヒープスナップショット、CPU スナップショット、クラッシュ時のコアダンプが含まれます。

最後に、観察、分析、トラブルシューティングから単純なメモリリークのケースを再現し、一般的なメモリリークの状況と解決策をまとめます。

この記事が、皆さんが Node.js パフォーマンス監視システム全体を理解するのに役立つことを願っています。

なぜパフォーマンス監視が必要なのでしょうか? Node.js のパフォーマンス監視について話しましょう

パフォーマンス監視が必要な理由

コンポーネントの

アプリケーション クラッシュ スナップショット ソリューションの比較

パフォーマンス インジケーター

CPU を

メモリ

ヒープは、

れ

Scavenge

Mark-Sweet-Compact の 2 倍のスペースを浪費するという欠点があります。

Stop-The-World

最適化戦略の

新しい

View GC ログ

は

、

生成方法を

分析メソッド

Cpuprofile は

v8

分析メソッド

。

生成

を

ケース分析の

観察

と分析にはヒープ スナップショットが必要です。

。

概要

では

アプリケーションクラッシュスナップショットソリューションの比較

パフォーマンスインジケーター

と分析にはヒープスナップショットが必要です。