NLP 中的定义集合是什么

数据挖掘 词嵌入 偏见
2022-02-14 19:46:30

我正在阅读论文男人对计算机程序员就像女人对家庭主妇一样?Debiasing Word Embeddings这里是pdf

在第 6 页,我们读到:

Step 1: Identify gender subspace. Inputs: word sets W , defining sets D_1 , ..., D_m. 

但是,他们在此声明之前和之后的论文中没有提到这些定义集是什么?谁能给我这些集合的定义或描述?

谢谢你。

1个回答

如果您在第 6 节的第一行阅读以下句子:

为通用起见,去偏算法是根据词组而不是对来定义的,以便我们可以考虑其他偏见,例如种族或宗教偏见。

D1,D2,,Dm是通常在去偏算法中考虑的词集,而不是考虑一对词,例如Computer ProgrammerHouseworker用于去偏性别manwoman因此,其中之一Ds 可以是{'Computer Programmer', 'Houseworker'},这里,作为一个例子。