我希望这个问题最适合这个网站......
在 Python 中,通常使用大写字母作为第一个字符来定义类名,例如
class Vehicle:
...
然而,在机器学习领域,训练和测试数据通常被定义为X
and Y
-not x
and y
。例如,我现在正在阅读有关 Keras 的本教程,但它使用X
andY
作为其变量:
from sklearn import datasets
mnist = datasets.load_digits()
X = mnist.data
Y = mnist.target
为什么这些被定义为大写字母?机器学习领域是否有任何约定(至少在 Python 中)最好使用大写字母来定义这些变量?
或者也许人们在机器学习中区分大写和小写变量?
事实上,相同的教程稍后会区分这些变量,如下所示:
from sklearn.cross_validation import train_test_split
train_X, test_X, train_y, test_y = train_test_split(X, Y, train_size=0.7, random_state=0)