数据挖掘 - 因果推理VS主动学习？ - 吾爱随笔录

想象一下，我们有一些随时间变化的特性列表。列表的每一行对应一个样本（空间变化）。我想知道机器学习是否能够确定每个样本对另一个样本的影响。例如，样本“S”的目标值取决于样本“S-4”、“S-3”、“S-2”、“S-1”、“S+1”、“S”的特征+2"、"S+3"。我已经看到了诸如主动学习和因果推理之类的东西，但仍然不确定它们是否对我的目标有用。为了详细说明，假设我们有下面的图片：

红线是一年的结果，蓝线是明年的结果。我们有适量的这些结果，所以以这种方式我们没有问题。对于红圈所示的目标和其他样本，我们有不同的特征。但是我正在寻找一种算法来告诉我第 1 组是否正在影响我在红圈点或第 2 组中的目标。为此，最好使用Causal inferenceor Active Learning？

from causalml.inference.meta import XGBTRegressor y, X, treatment = load_data() xg = XGBTRegressor(random_state=42) te, lb, ub = xg.estimate_ate(X, treatment, y) print('Average Treatment Effect (XGBoost): {:.2f} ({:.2f}, {:.2f})'.format(te[0], lb[0], ub[0]))