比较历史发布日期之间的 youtube 观看次数

数据挖掘 统计数据 公制
2022-03-09 23:05:28

我编写了一个脚本,用于youtube-dl收集 youtube 频道上所有列出的视频的所有观看次数和评分:https ://gist.github.com/philshem/ca0b8f964458c63ee4f0e68c0f700f39#file-get_stats-sh

比较评级相对简单,因为它们已经被平均了。但是我想比较观看次数,这对我来说并不清楚,因为观看次数与视频的发布时间有关。

我正在寻找一个指标,以某种方式将视频的年龄与观看次数标准化。我可以做一些简单的事情,例如view_count * days_since_release,但我不希望这具有统计意义。

是否有用于比较历史累积数据的示例指标?

观看次数 x 评分

https://twitter.com/philshem/status/1295725069268910081

1个回答

一个简单的选择是使用每天的平均观看次数,这样该值就会被标准化,并且与视频的新近程度无关。当然平均是简单的,因为视图不遵循线性趋势。

更高级的选择是对视图随时间的演变进行建模(例如假设正态分布),然后估计每个特定视频的参数并比较预测的总视图数。由于难以从不完全分布中估计参数,这将更加复杂。