信息安全 - 在事件/爆发期间我应该如何管理人员/技术人员？ - 吾爱随笔录

假设发生了需要立即响应的事件，例如通过电子邮件爆发的病毒、Cryptolocker 主动加密文件或 DOS 攻击。

我应该如何以一种不仅在我们的客户（SLA 等）方面受到重视，而且受到各级管理层和我的同行的积极评价的方式来处理这个问题？

我想有以下几个阶段：

有时，一个事件需要我们回溯并重新识别问题，（例如，它不是 Web 服务器问题，而是 DOS 攻击），并且通常一个好心的技术人员会处理重叠的任务，可能无济于事，或者更糟的是，它们可能会阻碍其他问题。（例如，在与生产相同的 LUN 上进行 SAN 还原，从而扼杀性能）

问题

由于解决问题通常有很多活动部分，我可以查看哪些流程来获得指导，以使遏制和补救流程更加结构化？

我能想到的一些事情包括：

应该有某种已经编写的指导来解决这个问题，例如在某种“运行手册”中，但我不确定它会被称为什么。搜索词将不胜感激

ITIL v3 定义的 ICM 活动

识别 - 检测或报告事件注册 - 事件在 ICM 系统中注册

分类 - 事件按上面定义的优先级、SLA 等属性分类

优先级 - 对事件进行优先级排序，以更好地利用资源和支持人员的时间

诊断 - 揭示事件的全部症状

升级 - 支持人员是否需要其他组织单位的支持

调查和诊断 - 如果无法找到过去的现有解决方案，则调查事件并找到根本原因

解决和恢复 - 一旦找到解决方案，事件就解决了

事件关闭 - ICM 系统中事件的注册表项通过提供事件的最终状态来关闭[5]

事件经理职责

（至少）在基本层面上了解任何事件/故障，以便使用适当的能力（资源）

推动恢复团队收集足够的信息以开始分析保持对事件的总体概述（通过变通方法将注意力集中在恢复上）

了解多个领域（RAN、核心网络、VAS、BSS/OSS）的功能

为开始立即紧急的意外恢复工作的团队获得有关优先事项的指导