我正在为学生数据构建评分算法,
说属性是:
name, location, age, class, school_name, skill1, skill2, skill3
基于这些数据,我需要创建一个学生分数。
我需要为年龄、班级、学校名称技能分配权重年龄,并为学生提供分数。
假设我有 2 个评分模型,例如:
score_1 = x1*location_weight + x2*age_weight + x2*class_weight + x3*school_name_weight + x4*skill1_weight + x5*skill2_weight + x6*skill3_weight
score_2 = y1*location_weight + y2*age_weight + y2*class_weight + y3*school_name_weight + y4*skill1_weight + y5*skill2_weight + y6*skill3_weight
现在我如何比较这些模型并评估它们?
问题是我没有测试或验证集来证明或比较每个模型的准确性,那么在这种情况下,比较和验证不同模型的最佳方法是什么?还有什么是从头开始构建验证集的最佳方法?
