符号链接或用空格重命名文件?

数据挖掘 数据清理
2022-03-09 04:57:43

前提:我经常从同事那里得到需要处理的文件。通常,这些文件的名称中有空格。在命令行或脚本中处理这些文件可能很乏味。

可能的解决方案:使用该rename程序(在 nix 系统上),我可以轻松地重命名这些文件,例如:

$ rename --sanitize --lower-case *

我最近发现rename实际上可以只创建指向原始文件的链接,而原始文件名保持不变:

$ rename --sanitize --lower-case --symlink *

问题:这两种方法的(潜在)优点/缺点是什么?

例如,似乎创建一堆符号链接会使我的文件系统变得“混乱”,但重命名文件的缺点是试图匹配我与同事使用的文件(无论我是重新分发我的代码或只是传达“我在 [file_x.csv] 上进行了 [分析]”)。

附加信息:

一般来说,我是唯一一个积极处理这些文件的人,但重要的是要归档我的工作,以便其他人可以参考它或以他们选择的任何方式重新分析数据。我在学术环境中工作,所以原则上,原始数据和我的方法应该无限期地存档。

1个回答

我理解你的痛苦!

你能不能简单地使用工具来读取文件名并根据需要过滤它们,从而让你的开发语言为你做所有的转义等等?

例如,在 Python 中,这意味着使用类似:os.walk()os.listdir().