デバイスとタスクを作成する方法

MetricsView Linux 監視サービスは、Linux コンピュータまたはサーバーの監視をサポートし、ユーザーがパフォーマンス カウンタ を収集 するデータのしきい値を設定し、これらのしきい値を超えた場合にアラートを設定できるようにします。

デバイスの作成、Linuxエージェントのインストール、カスタムコレクタタスクの追加または編集が行われると、次の設定を調整するように求められます。

コレクター

MetricsView コレクタは、ターゲット コンピュータから収集されたパフォーマンス カウンタからのデータの収集をサポートします。

タスクから開始するには、タスクの監視ターゲットとして使用するコレクター エージェントを指定する必要があります。

  • コレクターエージェントが既に設定されている場合は、[既存のコレクターを使用] または [新規のインストール]リストでコレクターエージェントの名前を選択します。
  • 一覧にコレクターがない場合は、 [新規インストール] をクリックして新しいコレクターを設定します

Linux カウンタパスソースシステムのカウンタの相対パスを反映: [local or remote machine] [category] | [instance] [counter type] カウンタパスは、ホスト名/カテゴリ/インスタンス/カウンタドロップダウンリストで選択した値に基づいて自動的に生成されます。

Linux カウンタパス: . .\cpu\0\cpu がアイドル状態です

ホスト名

MetricsView Linux エージェント (コレクション) がインストールされているターゲット コンピュータの IP または名前を指定します。

カウンター カテゴリ

最初のレベルのグループ化条件 (CPU など) を選択します。

カウンタ名

2 番目のレベルのグループ化条件 (CPU #2负载など) を選択します。

カウンター インスタンス

3 番目のレベルのグループ化条件 (CPU コア番号など) を選択します。

この記事の最後にあるカウンタの説明を参照してください。

エラーしきい値

  • 集計: 受信したすべてのデータは、調整されたデバイスの頻度に応じて定期的に集計されます。
    • 最大値 – 配列内の最大値を取得します。
    • 平均 – 値はすべての中間値の平均として計算されます。
    • 最小値 – 配列から最小値を取得します。
  • 最小しきい値:しきい値を超えると、アラートが発生します。
  • 最大しきい値:しきい値を超えると、アラートが発生します。
  • 使用できない場合は、無視してください:[エージェント] < – > [サーバー] 対話エージェントで、エージェントがチェックする新しいカウンタがあるかどうかを毎回尋ねます。 新しいカウンタを収集する命令がある場合、エージェントは新しいカウンタの収集を開始します。 NO を選択するとカウンタ ポーリングの各失敗がエラーとしてレポートに反映され、YES を選択すると失敗は無視されます。

タスク UID

UID は、各タスクに対して生成される一意の ID です。 この ID は、API内のタスクとのインターフェイスに使用されます。

カウンタの説明

CPU

CPU プラグインは、CPU がさまざまな状態 (特にユーザー コードの実行、システム コードの実行、IO 操作の待機、アイドル状態) に費やす時間を収集します。 https://collectd.org/wiki/index.php/Plugin:CPU

CPU 割り込み:: プロセッサがサービス割り込みに費やした時間を反映します

cpu-wait :: 特定の CPU に対して、CPU がアイドル状態 (つまり、タスクが実行されていない) と、その CPU 上のタスク (I/O 要求の生成時に) 要求される少なくとも 1 つの未処理のディスク I/O 操作の時間です。

cpu システム:: CPU がカーネル空間 (https://en.wikipedia.org/wiki/Kernel_space) でコードの実行にビジー状態である時間です。

cpu-softirq :: ソフトベースをよりよく理解するために、マシュー・ウィルコックスの記事を見てお勧めします: “私は後でそれを行います:ソフトirqs、タスクグループ、下部半分、タスクキュー、ワークキューとタイマー

cpu-steal :: (システム全体のみ) は、仮想化ハードウェア上で、オペレーティング システムが実行したいがハイパーバイザーが実行を許可しない時間です。 これは、物理ハードウェアが複数のゲスト オペレーティング システムを実行し、ハイパーバイザーが CPU タイムスロットを別のタイムスロットに割り当てることを選択した場合に発生することがあります。

cpu-nice :: “良い” CPU の割合は、ユーザー レベルのプロセスが消費する CPU 時間の割合であり、正確な値を持ちます。 詳細については、「 コンソールでのユーザーの表示」を参照してください

 

cpu-user :: CPU がユーザー空間でコードの実行にビジー状態である時間 (https://en.wikipedia.org/wiki/User_space)。

interface

if_errors-rx ::インターフェイスに記録された読み取りエラー率
if_octets-rx ::インターフェイスから読み取られるオクテットレート
if_octets-tx ::インターフェイスへの書き込みオクテット レート
if_packets-tx ::インターフェイスに書き込まれるパケット レート
if_errors-tx ::インターフェイスに記録される書き込みエラーの比率
if_packets-rx ::インターフェイスから読み取られたパケット レート

df (space usage)

df_complexなし ::ディスクで使用可能なバイト
df_complex予約済み ::ルート用に予約されたバイト数 (linux ファイルシステムは、通常、ディスクの合計のごく一部を保持します)

root ユーザーは、非 root ユーザー・フィルからシステムを保護します
ファイルシステム)

df_complexは 、::ディスクで使用されるバイトを使用します

disk (Disk I/O)

disk_time書き込み ::ディスクの書き込みにかかった時間 (ミリ秒単位)
disk_ops読み取り ::ディスクによって実行された読み取り操作の合計数です
disk_ops書き込み ::ディスクによって実行された書き込み操作の合計数です
disk_octets書き込み ::ディスクに書き込まれるオクテットの比率
disk_time読み取り ::ディスクの読み取りにかかった時間 (ミリ秒単位)
disk_merged書き込み ::カーネルがマージする書き込み操作の数です (カーネルがマージされるため)

隣接)

disk_merged読み取り ::カーネルがマージする読み取り操作の数です (

隣接)

disk_octets読み取り ::ディスクから読み取られたオクテットの比率

memory

メモリ バッファリング ::“バッファリング” メモリは、Linux がネットワークとディスク接続をバッファリングするために使用するメモリの量です。

メモリキャッシュ ::ほとんどの Linux ディストリビューションは、使用可能なメモリを使用してディスク上のファイルへのアクセスをキャッシュし、ディスクアクセスを高速化します。 システムが使用可能なメモリが不足すると、このデータが RAM から自動的にフラッシュされ、プログラムやその他の基本データ用の領域が確保されます。
メモリ使用量 ::システムが使用するメモリの合計量
メモリなし ::システムで使用可能なメモリの合計量