我想通过查看账户交易来估计一个家庭中有多少人。了解家庭中是否有孩子也会很有趣。
我认为一个可行的方法是根据国家统计数据将生活费用与普通人的生活费用进行比较。此外,我还可以执行文本分析来检索有关人们购买了哪些产品的信息(以了解他们是否花钱购买儿童产品)。
作为模型,我也许可以使用随机森林进行分类(但如果我错了,请纠正我)。
有没有更好的方法来解决这个问题?
我想通过查看账户交易来估计一个家庭中有多少人。了解家庭中是否有孩子也会很有趣。
我认为一个可行的方法是根据国家统计数据将生活费用与普通人的生活费用进行比较。此外,我还可以执行文本分析来检索有关人们购买了哪些产品的信息(以了解他们是否花钱购买儿童产品)。
作为模型,我也许可以使用随机森林进行分类(但如果我错了,请纠正我)。
有没有更好的方法来解决这个问题?
我认为回归在这里比分类更有意义。您正在尝试预测一个数字。特别是我会推荐泊松回归,因为您正在对计数数据进行建模。软件可用于各种语言。