Python 和 scikit-learn 的第一步

数据挖掘 Python scikit-学习 决策树 错误处理
2021-10-08 22:45:49

我相信我有一个简单的问题。我有统计学背景,我倾向于使用 Stata 和 R。我对学习 Python 很感兴趣。我用了一段时间,最近接触到了scikit-learn

我试图重现一个简单的例子。

from sklearn import tree
features = [[140, 1],[130, 1], [150, 0], [170, 0]]
labels = [0 , 0 , 1 , 1]
clf = tree.DecisionTreeClassifier()
clf = clf.fit(features, labels)
print clf.predict([[150, 0]])

如您所见,这个小脚本试图通过决策树来预测具有属性的对象[150, 0]是否可能是类型10.

我运行脚本并收到以下错误:

File "clf_decision_tree.py", line 6
    print clf.predict([[150, 0]])
            ^
SyntaxError: invalid syntax

我真的不明白出了什么问题...你能帮帮我吗?最佳/R

PS:我不确定 Cross Validated 或 Stackoverflow 是否是更好的提问场所。让我知道。谢谢。

2个回答

在 python 3 中,print函数必须有括号,所以print(clf.predict([[150, 0]]))可以工作

from sklearn import tree

features = [[2200,1], [1500,1], [1800,1], [900,2], [1000,2]]

labels = ['SUV', 'SUV', 'SUV', 'hatchback', 'hatchback']

clf = tree.DecisionTreeClassifier()

clf = clf.fit(features, labels)

print(clf.predict([[1350, 1]]))