我有一个用户下载了哪些应用程序的数据集,我尝试使用机器学习算法根据他们下载的应用程序来估计这些用户的性别。但是,我应该关注应用程序的哪些功能?据我所知,应用类别起着重要作用。Google Play 和 Apple App Store 是否根据用户下载的应用程序来估计用户的性别?
如何根据用户下载的应用程序来估计用户的性别?
数据挖掘
机器学习
数据挖掘
大数据
2022-02-15 17:55:50
2个回答
如果您有关于每个类别已完成多少下载的数据,您可以使用该数据执行逻辑回归,其中您的目标变量将是男性/女性的 0/1 分类。这将形成您的基准测试结果,然后您可以改进结果。特别是寻找特征选择,因为可能有与目标无关的应用类别。您还应该尝试使用目标对变量进行双变量分析,以查看与目标是否存在良好的相关性。完成一些数据探索后,尝试使用一些高级技术。用于分类的 KNN、随机森林和神经网络可能会产生良好的效果。购物车在这里也可以很好地工作。
关于功能,除了应用程序类别,我会尝试:
- 应用程序大小(以 MB 为单位)(即下载的应用程序大小的平均值、不同大小的总和等)这很重要,因为游戏往往很大,而生产力应用程序往往占用空间较小。
- 应用下载次数(同样,平均和/或用户已下载的所有应用的下载计数总和)。
- 下载的应用程序计数
- 不同类别的数量(给出主题用户检查的类别的方差估计)
其它你可能感兴趣的问题