自我项目的算法建议

数据挖掘 机器学习 分类 聚类 预测建模 算法
2022-02-17 03:56:56

所以,我正在做一个关于数据分析的小型自我项目。我正在通过网络抓取从 Play 商店网站收集 android 应用程序数据。我基本上是在尽可能地收集与特定应用程序相关的所有可能信息,例如它的类型/流派和子流派、评级、大小、下载次数、是否付费/未付费以及有关应用程序的其他可能信息。

我想知道在完成数据提取和清理工作后,我可以将哪些与数据分析相关的算法应用于我的Play Store 应用程序数据来分析它并找到其中的模式,预测数据之间的链接并执行其他的预测和数据分析呢?

我遇到的一些是:- TFID、聚类、决策树、序列分析,也许还有回归。

因此,请查看上述内容并提出任何新算法,这可能对我的项目有用。上述广义算法下的一些具体算法(如果有,可能对本项目有用)请提出建议。有关它们的详细信息将非常有帮助。

谢谢!

1个回答

我会像往常一样从 EDA 开始。情节的东西。对于分类数据,你有什么计数?对于定量数据,执行通常的汇总和相关性。由于您还没有想到任何问题,因此我将继续使用无监督学习算法来建议数据中的模式。在这里,聚类绝对是一个不错的选择(可能先于特征缩放)。无监督学习算法可以引入监督算法,以及所有相关的统计测试。

在不了解您的数据的情况下,您根本无法选择算法。