我的研究问题是检查在线社区中其他成员“获得关注”对网站“持续参与”的影响。
我决定通过计算用户提交之间的平均时间差来衡量每个用户的“持续参与”。我通过以下方式计算它:
我通过计算每个用户针对他/她发布的所有提交收到的评论总数来衡量“关注度”。我还想考虑总票数和总观看次数。我不确定将这些作为自变量添加到模型中是否是个好主意?
我的问题是关于因变量:
因为有些人连续两天只参加了两次,平均投稿天数是1。有些人参加了100次,他们的平均投稿天数也是1。但是很明显,第二组参加了100次有持续参与不是第一组。
所以我也需要考虑模型中提交的数量!不知道有没有办法考虑呢?我该如何处理这个问题?
我应该对用户进行分组并分别为他们进行数据分析吗?例如在一个小组中参与少于 10 次的用户!有 10-20 人参与另一个组等的用户。
如果有人可以帮助我,我将不胜感激!我的论文即将到期,我需要一些初步结果。