このドキュメントについて

PagerDuty

このサイトはPagerDutyのインシデント対応プロセスの一部をドキュメント化しました。 これはPagerDutyの全ての重大インシデントで使用している、全ての新入オンコールエンジニアが利用している、社内ドキュメントの縮小版です。 インシデントへの対策だけではなく、インシデント発生中やインシデント収束後についても述べています。

重大インシデントを取り扱うプロセスについて議論している企業は少ししかありません。 私たちのドキュメントコミュニティに公開して、独自のプロセスを策定したい人にとって役立つことを期待します。 また他の人に改善を提案できる機会を提供し、それがみんなの助けになることでしょう。

これは何ですか?#

どうやって効果的にオンコールに対応し、発生するかもしれない重大インシデントの効率的な対応の仕方を紹介します。 苦労して学んだ教訓を、すばやく習得できるトレーニング資料と共に提供します。

これは誰のためですか?#

これはオンコール参加者と、運用上のインシデント対応プロセスに関わっている人たちのためです。 またインシデント対応プロセスを制定したい人も対象とします。

なぜ必要ですか?#

インシデント対応は絶対に必要ないと願いたいですが、必要になったときは、スムーズかつシームレスに済ませたいです。 通常、社内でのインシデントの対応方法は、時間とともに蓄積されて、インシデントとともに改善されています。 PagerDutyの重大インシデント向けのアプリケーションなどのツールは問題の迅速な収束に役立ちますが、実行するプロセスもまた重要です。 このドキュメントにより、私たちが数年にもわたり築き上げてきたものを最初から学ぶことができます。 可能な限り最短の復旧時間を実現できる、重大インシデントの扱い方を先取りできます。

何がカバーされていますか?#

オンコールの始め方、深刻度の定義、インシデントの通話中のエチケットポストモーテムの方法、ポストモーテムのテンプレートなどが含まれます。

なにがカバーされていないですか?#

これは社内ドキュメントの複製ですが、一部の状態が削除されています。 電話番号、(まだ)オープンソース化されていない内部ツールとシステムの名前、ダッシュボードの画像などです。 基本的にはPagerDuty固有の情報や、秘密情報が含まれているものは共有していません。

License#

このドキュメントおよびその邦訳版はApache License 2.0の元で提供されます。 商用利用および個人利用で、このドキュメントの利用、編集ができます。 ただし元の著作権情報と、元のLICENSEファイルを含める必要があります。

PagerDutyの顧客であろうとなかろうと、このドキュメントを自社の内部で使用できるようにします。 PagerDutyのGitHubアカウントで、全てのドキュメントのソースコードを閲覧できます。 レポジトリをフォークして、独自のドキュメントのベースとして自由に利用できます。