处理云上的敏感数据

信息安全 隐私 数据库 服务器 敏感数据暴露
2021-08-17 06:28:40

在我目前为一个非政府组织开展的项目中,我必须建立一个系统,允许组织成员对高度敏感的数据进行基本分析。

数据(报告或提交的表格)目前通过KoBo(一种现场收集数据的工具)存储在安全的难民署服务器上。为了执行分析,目前,我有一个 Google Apps 脚本,它可以获取相关数据,将其从幕后的敏感位中剥离出来,然后将其粘贴到 Google 表格电子表格中。这种方法的问题在于,显然,fetch 必须解析整个数据,因此 Google 可以访问它。

我想到了这个解决方案:


备选方案 1

协议

  • 在我的电脑上手动下载 UNHCR 的数据
  • 通过 Excel 上的脚本删除敏感位
  • 将数据粘贴到 Google 表格电子表格中
  • 从计算机中删除数据

限制

  • 没有实时获取数据,但有人每天这样做一次确实解决了隐私问题

但是,我还有两个想要实现的功能。数据收集者发送报告后,可能需要联系其中一些人进行后续跟进或发送更深入的表格,我希望通过脚本来完成。此外,UNHCR 服务器对与报告一起发送的媒体有一定的大小限制,因此我想创建一些数据库,其中超过此大小限制的媒体将根据相关报告进行索引并存储。


备选方案 2

协议

  • 与位于具有严格数据隐私法的欧盟国家/地区的提供商一起设置私人服务器
  • 让服务器从 UNHCR 获取数据
  • 向数据收集者发送电子邮件,例如询问他们是否有任何想要附加到报告中的大型媒体以及这样做的说明(这些电子邮件不必加密或任何东西)
  • 将报告(去除敏感位)存储在未加密的 CSV 中
  • 让我的 Google Apps 脚本获取 CSV 并将其按原样粘贴到电子表格中
  • 如果我有以前的报告的大型媒体,我会在我的计算机上制作报告媒体文件,加密该批次,然后将它们上传到服务器,在那里它们将存储在数据库中

限制

  • 寻找符合条件的供应商
  • 这种替代方案带来的费用和复杂性是可以接受的

我意识到另一种选择是使用备选方案 1,手动向数据收集器发送电子邮件,并将加密的报告媒体文件存储在云中的任何位置(因为它们是加密的),但我希望整个过程能够自动化并且尽可能集中,所以:我如何使替代方案 2 起作用?我在哪里可以找到好的云托管服务提供商?

1个回答

这些替代方案中的哪一个更好,都取决于您的威胁模型。如果你不知道这是什么,请研究一下,或者找人帮你。(或者开始在这里提问!)

我这样说是因为我不明白您为什么如此担心谷歌(可能)访问这些敏感数据,而您只是假设通过在具有严格数据隐私法的某个地方设置服务器一切都会好起来。如果 Google 是一个已识别的威胁(通过您的模型),您为什么首先通过 Google 表格分享您的(编辑的)结果,并且(尝试)使用一些 Google Apps 脚本来实现这一目标?您不能只使用其他(本地)工具来混淆或剥离敏感数据吗?

让我感到困惑的是,如果这些数据对您的组织如此敏感,为什么允许您以相对不安全的方式完全访问它,或者将其下载到您自己的计算机或其他服务器(世界其他地方) ,你可能无法在身体上守卫它)?

从您的故事看来,UNHCR 允许您访问该服务器的数据,因此您的组织很可能已接受与联合国就使用和处理该数据达成的协议。与您组织的法律顾问交谈,看看什么是可能的,什么是不可能的。