PagerDuty Incident Response Documentation

Incident Response at PagerDuty

このドキュメントは、PagerDutyにおけるインシデント対応プロセスが載っています。 重大インシデントや、新しくオンコールを始める社員の準備に利用している、PagerDutyの内部ドキュメントの一部を切り出したものです。 このドキュメントではインシデントに備えることだけではなく、インシデント発生中、また収束後の対応についても説明します。 オンコールを担当する人や、インシデント対応プロセスに関与する人(またきちんとしたインシデント対応プロセスを制定したい人)が読むことを想定しています。 このドキュメントが何なのか、なぜ存在するかは、「このドキュメントについて」を参照してください。

どこから手を付けるべきか?

もしあなたがインシデント対応が初めてで、組織的な手順がない場合は、まず「はじめに」で何ができるかを確認してください。 そして詳細な手順を、Training Courseから確認することをお勧めします。

オンコールを始める#

まだあなたがオンコールを体験していないのなら、それが何なのかが疑問に思うかも知れません。 このページでは、オンコールに期待されていることと、いくつかの実例を紹介します。

インシデント発生前#

インシデントが発生する前に読むべきものです。 実際にインシデントが発生してから読むものではないでしょう。

インシデント発生中#

重大インシデント発生中の、情報と手順を紹介します。

インシデント収束後#

フォローアッププロセスでは、再発防止に何ができるかなどを確認し、日々改善をします。

トレーニング#

それではインシデント対応について学びたいですか? あなたは正しい場所にたどり着きました。

トレーニングガイド#

トレーニングコース#

追加資料#

インシデント対応に関する、外部の資料とリソースです。

  • 読み物 - インシデント対応に関連する、お勧めの読み物
  • ChatOps - ドキュメントで参照しているチャットBotのコマンドについて
  • アンチパターン - 試してみてダメだったものや、その失敗からの学び