誰がオンコールになるか

誰がオンコールになるか

組織構造には色々ありますが、インシデント対応に関するビジネス上の様々な機能に関する一般的なガイドラインがあります。

一般的には、全ての部門には1次対応の連絡先や、オンコールローテーション、明確なエスカレーションパスがあります。 組織は常に依存関係を最小にして対応チームに権限を委譲すべきですが、新しい状況では誰を手助けすべきかわからないこともあります。 あらゆるビジネス部門から対応者を決める明確なシステムにより、不測の事態が発生したときに手動手順や曖昧な連絡先に時間を浪費しなくなります。

エンジニア#

エンジニアは典型的な1次対応者で、インシデント対応における内容領域専門家(Subject-matter expert)です。

どのエンジニアチームがどの応答に関与するかは、企業の運用モデルにより異なります。 場合によってはオペレーションチーム、SREチームなどに、新しい問題に対して最初のトリアージや評価をする責務があります。 PagerDutyでは影響するサービスのオンコールエンジニアに、最初のトリアージと評価をする責務があります。

カスタマーサポート / カスタマーサクセス#

サポートは、インシデント対応における顧客の声です。 カスタマーサポートチームのメンバーはデフォルトで顧客連絡(Customer Liaison)となり、Twitter、内部Slackチャネル、必要に応じて他のチャネルなどを通じて、インシデントの状態について顧客とステークホルダーにお知らせします。 また社内のステークホルダーに、内部連絡として最新の情報をお知らせします。

マーケティング#

マーケティングまたは広報は、広報のインシデントに関する1次対応者です。

さらに会社のブランドまたはイメージが危機に晒されるような深刻なインシデントでは、マーケティングや広報は、メールやブログなどを通じて顧客とのコミュニケーションチャネルにもなります。

プロダクトマネージャーとデザイナー#

製品の機能が複数のサービスまたは製品に影響を与える場合、プロダクトマネージャーとデザイナーは、対応チームが意思決定する手助けをします。 たとえば、対応チームが最初にどのサービスを復帰させるか決めるとき、プロダクトマネージャーはどのサービスが顧客に影響があるか手助けできます。

製品はポストモーテムにも関与し、 フォローアップアクションをスケジュールしたり、問題に関する製品の変更をアドバイスします。

経営陣#

重大インシデント発生中に経営陣に更新情報を伝えることで、組織のリーダーが必要な背景情報を確認でき、経営陣が現場に飛び込んでくることを防ぎます。 インシデントコマンダーは最終的な権限を持ちますが、大規模インシデントが会社の最高レベルのアクションを必要とすることがあります。 たとえばシニア経営陣が、影響をうける顧客またはパートナーに連絡をとり、問題に取り組んでいるということを知らせたい場合があります。

セールス#

通常、セールスはインシデント対応中のステークホルダーとなります。 デモや顧客との商談に影響する場合はそれを知らせ、アカウント所有者は潜在的な影響を理解する必要があります。

人事#

通常、人事はインシデントで影響する従業員の安全または健康に関与します。 さらにセキュリティインシデントの場合、セキュリティチームは内部犯行と影響する従業員の保護の両方のために、人事と連携する必要があります。

経理#

多くの場合、経理はインシデント対応中のステークホルダーとなり、影響のある支払い、会計、あるいは月末、四半期ごとの活動に影響があるプラットフォームへの影響を常に考える必要があります。

しかし、インシデント対応でサードパーティのアカウント管理や関連するアクションが必要になるコンポーネントがある可能性があるので、経理は明確なオンコールのローテーションやエスカレーションパスを持つべきです。

組織全体を考えてください

他の部門がインシデント対応における、対応者やステークホルダーとなるかもしれません。 業務の異なる分野を意識し、その状況で誰が関与するか考えるのは大事です。 そしてオンコールをうける誰もが、インシデント対応のトレーニングや責務を理解していることも重要です。