我有一个将模型分数输出到 s3 的管道。我需要按model_type和date对数据进行分区。这是从以下分区数据的最有效方法:
- s3://bucket/data/model_type=foo/dt=YYYY-MM-DD/a.csv
- s3://bucket/data/dt=YYYY-MM-DD/model_type=foo/a.csv
我有一个将模型分数输出到 s3 的管道。我需要按model_type和date对数据进行分区。这是从以下分区数据的最有效方法:
在对数据进行分区时,我们需要了解太多的分区不是一个好的做法,仅分区的模型类型可能会导致太少。因此,在您决定最佳分区之前,请考虑以下几点: