我正在构建一个决策树,并希望(例如)将 0 类中的元素与 1 类和 2 类中的元素分开,例如:
df = pd.DataFrame(np.random.randn(500,2),columns=list('AB'))
cdf = pd.DataFrame(columns=['C'])
cdf = pd.concat([cdf,pd.DataFrame(np.random.randint(0,3, size=500), columns=['C'])])
#df=pd.concat([df,cdf], axis=1)
(X_train, X_test, y_train, y_test) = train_test_split(df,cdf,test_size=0.30)
y_train=y_train.astype('int')
classifier = DecisionTreeClassifier(criterion='entropy',max_depth = 2)
classifier.fit(X_train, y_train)
y_pred = classifier.predict(X_test)
C
表示元素的类,A
并且B
是定义元素的两个变量,我怎样才能构建一个树,而不是将结果划分为C=0
,C=1
或者C=2
将它们划分为C=0
和C!=0
?