完整的自学新手在这里。
问题
是否有任何流行的标准或常用的格式来表示/保存/共享/序列化网络?
背景
我使用自己的 python 代码构建了一个简单但非常大(5.5m 节点,16.7m 边)的网络矩阵。但是,如果我想将此矩阵与其他数据科学工具一起使用,我应该使用什么格式?
目前我把它放在一个巨大的 csv 文件中,标题和“1”代表边缘。我认为这被称为二进制矩阵。
目标
我想利用使用二进制文件或格式化的平面文件所带来的任何好处,以帮助我学习其他工具。
完整的自学新手在这里。
是否有任何流行的标准或常用的格式来表示/保存/共享/序列化网络?
我使用自己的 python 代码构建了一个简单但非常大(5.5m 节点,16.7m 边)的网络矩阵。但是,如果我想将此矩阵与其他数据科学工具一起使用,我应该使用什么格式?
目前我把它放在一个巨大的 csv 文件中,标题和“1”代表边缘。我认为这被称为二进制矩阵。
我想利用使用二进制文件或格式化的平面文件所带来的任何好处,以帮助我学习其他工具。
没有单一的普遍接受的标准,但是,许多包将边缘列表用于稀疏(非)有向(非)加权图。关于存储和共享,由于二进制兼容性问题,我通常看到压缩文本文件(ASCII 格式)而不是二进制文件。
也许你应该看看这个草稿:Unraveling Graph-Exchange File Formats。