如何创建灾难恢复的事后总结报告
也许和业务连续性或灾难恢复演习同样重要的是记录演习中发生的各种活动的文档,这被称作事后总结报告(after-action report或AAR)。
灾难恢复演习是为了验证业务连续性/灾难恢复计划中所制定的各种开发及其执行过程。如果演习圆满完成,事后总结报告将记录下这一事实。如果演习没有按计划完成,事后总结报告需要记录下哪些任务正确完成,哪些没有,哪些应急方案或替代方案被设计出来,谁参与了这些过程,以及演习过程中的经验教训。
事后总结报告概要
下表描述了事后总结报告的组成部分,每部分包括哪些内容,以及每部分对整个业务连续性/灾难恢复处理流程及相关计划的价值或意义。
演习活动 |
内容 |
价值和意义 |
目的和范围 |
描述演习的原因以及内容 |
确定演习的基准 |
演习目标 |
确定演习的预期,比如验证某一具体恢复过程工作正常 |
确定演习的结束条件 |
演习类型 |
明确演习过程,比如是桌面演练,结构化演练,还是系统测试 |
标识演习的严谨性,可以从概要评审到一步一步的详细分析。 |
演习方法 |
介绍演习如何进行,比如举行演习的地点,演习的具体操作,以及演习结束的满足条件 |
提供对演戏的详细说明。从审计角度来看这一点尤其重要。 |
参与人员 |
列出演习的参与人员以及各自的角色 |
明确谁参与演习 |
应用场景 |
确定大概在什么情况下必需启动演习,比如,因电力故障而需启动紧急供电系统。 |
提供进行演习的环境,以确保该应用场景是现实的和可接受管理的。 |
演习发现 |
根据时间,活动,是谁执行,执行结果,做了哪些备用安排,以及演习参与者如何进行等,确定演习中发生的所有事实。 |
按顺序列出演习中发生的事实。从审计角度讲这也是非常重要的。 |
下一步计划 |
列出演习结果/结论确定以后需要完成的任务,比如,重写演习流程,改变参与者职责,或进行后续演练。 |
证明演习是最终达到最佳的业务连续性/灾难恢复计划及其相关程序的整个过程的一部分。 |
使用上表作为构建您的事后总结报告的框架。为您开始书写报告中的各个不同部分创建章节并预留占位符。当您准备灾难恢复演习时,事后总结报告也应当准备好并投入使用。
记录演习
在演习中,必须有专人从事“记录员”功能,这一点非常关键。此人还可作为计时员以确保演习沿着特定的时间窗口进行,准时或接近预期目标时间完成。记录演习是整个演习过程中的一个重要部分,因为它为提高业务连续性/灾难恢复计划提供了证据,并为今后的演习提供改善方法。
准备事后总结报告
如果你的演习包括演习后的立即讨论,这通常被称为“烫洗”,这是做笔记的重要机会,而笔记将有助于形成事后总结报告。如果您是演习协调员者和记录员,请务必在讨论过程中花点时间来记录会上所说,尤其是做了什么,没做什么以及经验教训。
演习之后请尽快准备事后总结报告,这时细节依然记忆犹新。如果可能的话,将事后总结报告初稿分发给演习戏参与者,征求意见和新的输入。一旦你获得了所有的评审意见,就可以准备发行最终报告了。
将事后总结报告分发给演习操作涉及到的相关部门的部门主管,内部审计部门,风险管控部门,IT部门(如果IT系统和资产在演习中有涉及),和公司的高级管理者。
事后总结报告的一个重要组成部分是下一步计划,其中可能包括建议:1)改进业务连续性/灾难恢复计划,2)修改某一操作流程以提高其恢复能力,3)指出位置不当的恢复步骤,4)指出对系统或技术所做的改变以提高其恢复能力,或5)确定对演习过程的改变。
事后总结报告中的数据是改善你的整体业务连续性/灾难恢复能力的工具。事后总结报告是对灾难恢复演习的理想补充。它还提供了一个重要的审计工具,记录了演习中发生的各种活动,做了什么,没做什么,以及如何能够提高业务连续性/灾难恢复过程。
etsme是采用云计算原生技术打造的个人私有云/小型私有云产品,即刻入手etsme,探索更多贴心功能,掌控自己的数字世界。