假设我有一个包含有关足球运动员的数据点的数据集。
这些数据是关于足球运动员过去 2 年每月的表现和信息(例如进球、助攻、伤病、年龄、体重等)。
我的目标是了解一名足球运动员在特定月份的表现和状态与他下个月的表现和状态之间的关系。
在第一阶段,我只想运行一些相关性来检测其中一些关系。
在这种情况下,对每个球员过去 2 年的数据进行单独的相关性分析,然后对球员之间的相关性结果进行平均,还是直接对所有球员的任何一个月的数据进行相关性分析,是否有意义?
假设我有一个包含有关足球运动员的数据点的数据集。
这些数据是关于足球运动员过去 2 年每月的表现和信息(例如进球、助攻、伤病、年龄、体重等)。
我的目标是了解一名足球运动员在特定月份的表现和状态与他下个月的表现和状态之间的关系。
在第一阶段,我只想运行一些相关性来检测其中一些关系。
在这种情况下,对每个球员过去 2 年的数据进行单独的相关性分析,然后对球员之间的相关性结果进行平均,还是直接对所有球员的任何一个月的数据进行相关性分析,是否有意义?