我是使用 python 进行数据科学的新手。选择 aa 列有
什么区别:df['name'].values并且它们返回不同类型的 numpy 向量。为什么?df.iloc[:,1].valuesdf.iloc[:,1:2].values
来自熊猫数据框的 Numpy 数组
数据挖掘
Python
数据集
熊猫
麻木的
数据框
2022-02-25 00:37:11
1个回答
不完全确定您所说的“numpy向量”是什么意思,但我假设问题是为什么这些方法中的每一个都基本上(几乎但不完全)返回相同的输出......
参考:熊猫文档。
df['name'].values是“对应于 colname 的系列”。换句话说,您只是调用该列中的数据并通过调用将.values.
.iloc是“用于按位置选择的纯整数位置索引”。与上面相同,但您正在调用列的索引位置 where df.iloc[:, 1]is df.iloc[all rows, col 2]。在 DataFrame 中调用多个连续列然后写出每个单独的列名称可能是一种更简单的方法。
df.iloc[:,1:2].values<-- 创建一个数组数组,其中主数组是您调用的列 (col2),每行值都包含在一个子数组中。这是 - 我认为 - 因为您正在对列索引位置 1 和 2 之间的数据帧进行切片(而不是像上面那样调用 loc 1 )。这意味着每行都被单独调用,以便为列索引位置 1 和 2 之间存在的每一行(即“父”数组)创建一个新数组。
其它你可能感兴趣的问题