我有 250 张图像,从中提取特征并将它们放入 Excel 文件中,如何使用 weka 程序使前 200 张图像用于训练,其余 50 张图像用于测试。
我是否将 200 张图像的数据放在单独的文件中,将 50 张图像的数据放在另一个文件中?还是我将 250 幅图像的数据放在同一个文件中?请帮我。
我有 250 张图像,从中提取特征并将它们放入 Excel 文件中,如何使用 weka 程序使前 200 张图像用于训练,其余 50 张图像用于测试。
我是否将 200 张图像的数据放在单独的文件中,将 50 张图像的数据放在另一个文件中?还是我将 250 幅图像的数据放在同一个文件中?请帮我。
Weka 使用arff 文件类型。
上一个链接中修改的示例 arff 文件内容:
% 1. Title: Iris Plants Database
% 2. Creator: R.A. Fisher, Donor: Michael Marshall (MARSHALL%PLU@io.arc.nasa.gov)
@RELATION iris
@ATTRIBUTE petallength NUMERIC
@ATTRIBUTE petalwidth NUMERIC
@ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-virginica}
@DATA
1.4,0.2,Iris-setosa
1.4,0.2,Iris-virginica
1.3,0.2,Iris-setosa
1.5,0.2,Iris-versicolor
1.4,0.2,Iris-setosa
1.7,0.4,Iris-setosa
上面的例子可以分成几个部分:
创建 arff 文件后,您在使用 Weka 资源管理器时有几个选项:
如果这是出于教育目的,手动分区数据集可能是最简单的方法,以便您知道哪些图像在训练中,哪些图像在测试中。如果这是为了研究,当然首选k-fold CV。
如果您使用的是 Weka Java 库而不是桌面应用程序,有大量在线资源可以解释库架构:Waikato Github io 站点
您的问题的答案是使用 Weka 的“Explorer”模式,然后为测试集选择 20% 大小的“training/test split”。