随着数据集和参数数量越来越大,由于磁盘大小和计算能力有限,在本地运行验证变得越来越困难。因此,人们可能会使用旧笔记本电脑或云中的服务器。特别是,我有兴趣了解有关第二个选项的更多信息。
对于设置,听起来我需要一个存储系统和一个计算系统。这是 S3 和 EC2 吗?Redshift 和 Amazon ML?来自其他供应商的组合?目前,我作为 Kaggle 的业余参与者询问,但我也很想知道专业人士使用什么。
在机器本身上,有没有办法与 GUI 交互而不是命令行来设置它?在开始之前我是否必须安装 Anaconda 或其他 Python 发行版?是否有特定的文件结构可供使用?需要注意的主要陷阱是什么?
最终,我正在寻找实用的建议来设置所有内容。如果您能够只提供文档链接,那也将非常有帮助。谢谢!