在事件/爆发期间我应该如何管理人员/技术人员?

信息安全 事件响应 风险管理 人事管理
2021-08-22 06:49:54

假设发生了需要立即响应的事件,例如通过电子邮件爆发的病毒、Cryptolocker 主动加密文件或 DOS 攻击。

我应该如何以一种不仅在我们的客户(SLA 等)方面受到重视,而且受到各级管理层和我的同行的积极评价的方式来处理这个问题?

我想有以下几个阶段:

  • 鉴别
  • 遏制
  • 整治

有时,一个事件需要我们回溯并重新识别问题,(例如,它不是 Web 服务器问题,而是 DOS 攻击),并且通常一个好心的技术人员会处理重叠的任务,可能无济于事,或者更糟的是,它们可能会阻碍其他问题。(例如,在与生产相同的 LUN 上进行 SAN 还原,从而扼杀性能)

问题

由于解决问题通常有很多活动部分,我可以查看哪些流程来获得指导,以使遏制和补救流程更加结构化?

我能想到的一些事情包括:

  • 识别受影响的用户、业务利益相关者
  • 确定正在研究解决方案的人员和供应商
  • 在从事解决方案的人员和供应商之间交流任务和所有任务的状态
  • 分享受众适当的状态(帮助台、管理、执行)

应该有某种已经编写的指导来解决这个问题,例如在某种“运行手册”中,但我不确定它会被称为什么。搜索词将不胜感激

1个回答

规划您的业务连续性。您应该为关键任务和非关键任务服务确定合适的人员,哪些系统包含最重要的信息,谁可以决定何时使系统脱机以及在什么阈值下脱机。

(维基百科)[ http://en.wikipedia.org/wiki/Incident_management]的良好概述

ITIL 对此有大量信息:

ITIL v3 定义的 ICM 活动

  • 识别 - 检测或报告事件 注册 - 事件在 ICM 系统中注册
  • 分类 - 事件按上面定义的优先级、SLA 等属性分类
  • 优先级 - 对事件进行优先级排序,以更好地利用资源和支持人员的时间
  • 诊断 - 揭示事件的全部症状
  • 升级 - 支持人员是否需要其他组织单位的支持
  • 调查和诊断 - 如果无法找到过去的现有解决方案,则调查事件并找到根本原因
  • 解决和恢复 - 一旦找到解决方案,事件就解决了
  • 事件关闭 - ICM 系统中事件的注册表项通过提供事件的最终状态来关闭[5]

事件经理职责

  • (至少)在基本层面上了解任何事件/故障,以便使用适当的能力(资源)
  • 推动恢复团队收集足够的信息以开始分析 保持对事件的总体概述(通过变通方法将注意力集中在恢复上)
  • 了解多个领域(RAN、核心网络、VAS、BSS/OSS)的功能
  • 为开始立即紧急的意外恢复工作的团队获得有关优先事项的指导