建模社交媒体帖子调度优化

数据挖掘 机器学习 神经网络 回归
2022-03-01 06:42:26

问题:

我想通过优化发布时间来最大化社交媒体帖子的性能。

当前型号:

X: publishing_datetime, post_attribute_1, ..., post_attribute_n
y: performance

所需型号:

X: post_attribute_1, ..., post_attribute_n
y: publishing_datetime

所需的模型应该预测最佳的 publishing_datetime 以最大限度地提高性能。一旦数据可以像这样建模,问题就可以用回归神经网络解决。

我试过的:

过滤性能高于平均水平的帖子,并使用它们的属性和 publishing_datetime 来形成我想要的模型。

这并不理想,因为大量数据未被使用,并且性能影响特别大的帖子与性能仅略高于平均水平的帖子一样大。

关于如何实现这种模型转换的任何建议?

非常欢迎所有想法和替代方法。提前致谢!

2个回答

您可能会将目标与功能可解释性混淆。

您可能希望目标是性能和日期时间作为可解释的功能。

如果 datetime 以纪元时间编码,它可能会变得稀疏有用。您可能想要构建许多日期时间功能,示例包括:一天中的时间、一周中的一天、一个月中的一天和一年中的一天。结果将是一个可以预测不同时间如何影响性能的模型。

一种方法是将问题构建为分类问题,将一周分为 30m 个槽。

您需要仔细定义成功的标签 - 在规范化渠道活动并寻找高 z 分数之后。

这样您仍然可以使用您想要的功能。

为了进一步改进模型,您希望使用季节性数据和假期。(您可以从先知那里获得这些功能