从数据生成规则以进行分类

数据挖掘 机器学习 数据挖掘 数据集
2022-03-11 19:04:14

我有一组未标记的数字数据,我想从中生成规则以进行分类。我可以使用哪种技术?

1个回答

如果数据未标记,您要么

  • 手动标记数据(如果您没有太多样本)
  • 手动标记部分数据,在其上训练分类模型(并验证您的模型!)并使用模型标记未标记部分,以加快标记过程
  • 使用预训练的分类/分割模型(如果您的数据是图像)
  • 使用无监督学习算法在数据中查找模式,然后手动检查获得的组以找到可识别的模式并相应地标记组。您应该使用的算法取决于您拥有的功能类型。使用数值特征,您可以使用基于距离的聚类技术,如 k-means,或降维技术,如自组织映射或 t-SNE

基本上,这取决于您拥有什么样的数据以及有多少样本。我相信需要更多关于您的数据的信息才能提供更具体的答案。