我开始使用 Spacy,我只是在试验给定的例子。奇怪的是,当我使用他们的实验控制台在他们的容器上运行它们时,它给我的结果与我在本地运行它们时不同。
例如,当我从他们的控制台运行以下示例时,
import spacy
nlp = spacy.load('en_core_web_md') # make sure to use larger model!
tokens = nlp(u'dog cat banana')
for token1 in tokens:
for token2 in tokens:
print(token1.text, token2.text, token1.similarity(token2))
它给了我:
dog dog 1.0
dog cat 0.80168545
dog banana 0.24327646
cat dog 0.80168545
cat cat 1.0
cat banana 0.2815437
banana dog 0.24327646
banana cat 0.2815437
banana banana 1.0
但是当我在本地运行完全相同的东西时,它给了我:
dog dog 1.0
dog cat 0.0
dog banana 0.0
cat dog 0.0
cat cat 1.0
cat banana -0.044681177
banana dog -7.828739e+17
banana cat -8.242222e+17
banana banana 1.0
对我来说,前者是有道理的,而不是我的本地结果。对于其他示例,问题也仍然存在。我感到很困惑!当地发生了什么?
- 斯派西:'2.0.12'
- Python 3.6.5 Anaconda, Inc.
- Mac OSx 10.13.5
我不确定它是否相关,但我在 Jupyter 中运行它时遇到了这个错误,所以我在启动 Jupyter 之前,按照 git 中的建议在终端中导出了以下内容:
export LC_ALL=en_US.UTF-8
export LANG=en_US.UTF-8