所以,Tay 种族主义的高音机器人……可以防止这种情况发生的一件事是有一个不响应的口号列表,其逻辑类似于foreach (word in msg) {if (banned_words.has(word)) disregard()}
.
即使那不会,我的意思很明显:我正在构建一个必须对孩子友好的聊天机器人。为了我和任何发现这个问题的人,是否有一个资源包含一个 .csv 或 .txt 的此类单词,人们可能想要处理这些单词?我记得曾经使用过一个网站屏蔽生产力扩展程序,该扩展程序可以看到其禁用词列表;不仅仅是带有性意味的词语,还有种族诽谤。