这可能是一个普遍的问题,但我认为这可能是集思广益的最佳场所。如果我有一个视频网站,它只想将视频点播保留一定天数,然后再将其删除以最大限度地提高运营成本,那么我一般会考虑或使用哪种数据措施/方法来决定时间段?
就像一个典型的网站一样,可以跟踪视频的观看次数、关注者等,权衡可能是观看次数/运营成本
这可能是一个普遍的问题,但我认为这可能是集思广益的最佳场所。如果我有一个视频网站,它只想将视频点播保留一定天数,然后再将其删除以最大限度地提高运营成本,那么我一般会考虑或使用哪种数据措施/方法来决定时间段?
就像一个典型的网站一样,可以跟踪视频的观看次数、关注者等,权衡可能是观看次数/运营成本
集群在这里可能是一个理想的选择。从问题来看,数据似乎很可能是连续格式。本质上,聚类是一种寻找相似对象组的方法。对象之间的相似性由所使用的距离度量的类型确定。在此背景下,您可以从查找人们最喜欢或最不喜欢的视频开始。诸如互信息增益之类的测量可能会有所帮助。