我对 StackExchange 提供的开放数据很感兴趣,并且一直在data.stackexchange.com页面上运行一些非常有趣的查询(使用 Stackoverflow 数据集)。
特别是,我想深入探讨2015 年 Stackoverflow 开发者调查摘要页面中的这一主张:
换句话说:Stackoverflow 的“价值”是什么?不是就其自身的经济成功或资金数额而言,而是它如何影响其用户,例如加速活跃用户的加薪。
我理想的解决方案是将其用户的活动与一些经济自变量(例如工资)相关联。尽管 Stackoverflow 服务器上存在活动数据,但此薪水数据不可用(可下载的 StackOverflow 开发人员调查数据集是匿名的)。
还有哪些其他代理/数据集可用于进行此类研究?我会使用 github 提交,但它更注重生产力,并且已经有一篇关于这个主题的好论文。