这是特征与我的目标变量的相关性。我已经完成了所有的功能工程,但我还剩下这些功能。
关于为模型训练保留哪些列以及要删除哪些列的任何输入。是否有任何标准可以删除我不需要的功能。似乎信用记录是唯一具有高度相关性的特征。
Loan_ID 0.011610
Gender 0.017987
Married 0.091478
Education -0.085884
Self_Employed -0.003700
ApplicantIncome -0.004710
CoapplicantIncome -0.059187
LoanAmount -0.037318
Loan_Amount_Term -0.022549
Credit_History 0.561678
Total_Income -0.031271
Total_Income_Log 0.007240
LoanAmt_Log -0.037536
CH__0 -0.540556
CH__1 0.432616
EMI -0.011552
EMI_Log -0.028496
Dependents_1 -0.038740
Dependents_2 0.062384
Dependents_3 -0.026123
Property_Area_1 0.136540
Property_Area_2 -0.043621
Loan_Status 1.000000
Name: Loan_Status, dtype: float64