我有两个不同的问题。一种是逻辑回归,另一种是时间序列预测。但两者都存在数据不足的问题
a) 对于逻辑回归,我有一个包含 10 个观察值的小数据集,其中包含年龄、Marital_Status、收入、性别和 car_purchase_status 等变量(带有是/否值的结果标志)。现在我有一个新的第 11 位客户,其中包含年龄、性别、Marital_Status 和收入等变量。现在我想知道这第 11 位顾客是否会买车。我应该花费资源来影响他买车吗?我是否将资源用于正确的客户?例如:无论如何我可以发现第 11 位客户有 70% 或 80% 的机会购买汽车。所以花一些营销力度比如打电话可以帮助我们说服他买车(100%)。所以,我怎样才能做到这一点?请问有什么建议吗?我应该直接放弃这个问题无法用如此低的数据解决,还是有任何简单的统计技术可以帮助我获得关于第 11 位客户的一些见解?
b)对于时间序列,我只有 10 个观察值,每个观察值间隔 20 天。例如:我有他们在第 1 天、第 21 天、第 41 天、第 61 天、第 81 天......第 201 天产生的收入。现在有了给定的 10 个观察值,我想预测第 500 天、第 321 天、第 621 天等产生的收入。那么,是否可以用这么短的序列运行时间序列预测?你们能指导我吗?在这里,我也应该因为数据点少而放弃,还是有什么方法可以用来根据短输入时间序列预测未来的时间戳点?
你们能帮我列出可以帮助我做到这一点的步骤/主题吗?