很抱歉这个奇怪的问题 - 我什至不知道这是否有意义,但是我在大学的 Python 课程介绍中想到了这一点,并且从那以后一直想知道它。
所以我有一些使用 Python 进行数据科学的经验,但从未参加过结构化课程。我在上介绍课,第一天我们被要求计算某个名字出现在列表中的次数。显然,我想出的答案是将一个变量初始化为零,然后遍历列表并在列表中的第 i 个名称等于目标名称时为其自身添加一个。
然而,在 Andrew Ng 的深度学习课程中,尽可能将我们的计算向量化。这让我想知道如何将这项任务矢量化。
在理想情况下,我想出的是创建一个向量,其中每个目标名称都替换为 1,其他名称替换为 0。然后我可以只取向量的总和,我就会得到我的回答。这个问题是我知道如何创建所述向量的唯一方法是遍历原始列表,从而破坏了以这种方式解决问题的目的。
无论如何,虽然我知道创建这个向量并不完全是一种热编码,但有没有办法对这个过程进行向量化?一种热编码是迭代完成的。如果没有,是否还有其他示例可以将基本迭代任务转换为能够并行处理的任务?
抱歉,如果这是一个愚蠢的问题或没有任何意义 - 只是作为基础 Python 的菜鸟我很好奇。