创建神经网络模型和使用 github 时在哪里存储数据集?

数据挖掘 机器学习 神经网络 数据科学模型
2022-02-27 10:04:47

有人建议我将 GitHub 用于我的所有编码项目,因为它是向雇主展示你一直在从事的工作以及分享你创建的任何可能对其他人有用的任何东西的好方法。所以我正在存储我在 GitHub 存储库中工作的神经网络模型的代码,但我不确定何时下载数据集以运行测试,我应该在哪里下载它?在 git 存储库内部还是外部?

抱歉,如果这是一个愚蠢的问题,但对此很陌生。我可以想象任何一个答案的论据。主要是尺寸太大或结果很容易重现。

2个回答

如果数据集不是太大,您可以在 GitHub 上添加数据集。通常项目数据集并不大,但我不能确定,因为您没有提到任何近似大小。但如果它很大,您可以将自述文件或.py文件中的数据源作为外部超链接引用。

例如,将数据集保存在Google Drive上并通过生成可共享的 URL打开可查看选项。现在可以在您的自述文件中引用生成的链接,例如:请参考此外部链接以访问数据集或者,您也可以直接.py从生成的链接中读取文件中的数据,并且任何项目审阅者都会注意到该外部链接被用于读取数据集。

希望能解答您的疑问!

  1. 在存储库中上传数据集
  2. 在驱动器上上传并附加链接,将共享设置更改为对所有人可见
  3. 有的话直接提供源链接