数据挖掘 - 来自熊猫数据框的 Numpy 数组 - 吾爱随笔录

来自熊猫数据框的 Numpy 数组

数据挖掘 Python 数据集熊猫麻木的数据框

2022-02-25 00:37:11

我是使用 python 进行数据科学的新手。选择 aa 列有
什么区别：df['name'].values并且它们返回不同类型的 numpy 向量。为什么？df.iloc[:,1].valuesdf.iloc[:,1:2].values

1个回答

不完全确定您所说的“numpy向量”是什么意思，但我假设问题是为什么这些方法中的每一个都基本上（几乎但不完全）返回相同的输出......

参考：熊猫文档。

df['name'].values是“对应于 colname 的系列”。换句话说，您只是调用该列中的数据并通过调用将.values.

.iloc是“用于按位置选择的纯整数位置索引”。与上面相同，但您正在调用列的索引位置 where df.iloc[:, 1]is df.iloc[all rows, col 2]。在 DataFrame 中调用多个连续列然后写出每个单独的列名称可能是一种更简单的方法。

df.iloc[:,1:2].values<-- 创建一个数组数组，其中主数组是您调用的列 (col2)，每行值都包含在一个子数组中。这是 - 我认为 - 因为您正在对列索引位置 1 和 2 之间的数据帧进行切片（而不是像上面那样调用 loc 1 ）。这意味着每行都被单独调用，以便为列索引位置 1 和 2 之间存在的每一行（即“父”数组）创建一个新数组。

其它你可能感兴趣的问题

上一篇one-hot编码后的接收值错误决策树分类器下一篇如何将多个特征放入 RNN 输入向量中