我很想知道其他人倾向于将什么视为模型特征或变量的合适命名约定,特别是当它们与它们在软件应用程序中的使用和引用有关时。
例如,给定两个输入:年龄和收入,我们可以围绕它们各自原始值的各种转换和离散化构建特征,并以多种方式捕捉它们的相互作用。
意识到我们想让这些名称简洁而具有描述性,以下看起来是否合理?它们是否过于冗长?
- gt_100k_收入
- is_missing_income
- lg10_income
- ge_20_lt_25_age
- zscale_age
- ratio_ln_income_ln_age
- ...
是否值得尝试(显式或隐式)表示特征值的返回类型?如何命名从 5 个或更多其他功能派生的功能?