传输 EHR 数据的最佳文件格式

数据挖掘 数据 数据格式
2022-03-16 16:56:41

我正在进行一项临床试验,我们有几个网站向我们发送 EHR 数据。这些站点目前正在以 excel 文件的形式发送数据。我感觉有人在打开文件,因为其中 3 个文件正好有 64,999 行,而 excel 2007 的行数为 65,000。

我在 python 中工作,但我试图阻止本地站点的人在 excel 中打开文件。

发送给我的文件的最佳格式是什么,以使它们无法在 excel 中打开和切断?不幸的是,csv 也可以在 excel 中打开。

1个回答

如果您使用的是 python,我建议使用Numpynpy格式。NPY 文件是安装了 NumPy 库的 Python 软件包创建的 NumPy 数组文件。它包含一个以 NumPy ( NPY ) 文件格式保存的数组。NPY 文件存储在任何计算机上重建阵列所需的所有信息,其中包括 dtype 和 shape 信息。

您还可以考虑使用Python 支持的hdfhdf5格式。分层数据格式 ( HDF ) 是一种用于存储大量数值数据的开源文件格式。它通常用于研究应用程序(气象学、天文学、基因组学等),以在不使用数据库的情况下分发和访问非常大的数据集。可以使用 HDF5 数据格式对大型数据集进行快速序列化。