数据挖掘 - 如何使用（阅读）谷歌预训练的 word2vec 模型文件？ - 吾爱随笔录

我正在尝试在 keras 中应用 open() 函数来使用 Google news-vectors-negative300.bin 这是一个通过 word2vec （例如 GloVe）进行预训练的文件，但是在下载 GloVe 后，它包含 4 个带有 txt 前缀的文件，而不是 Google 新闻- vectors-negative300.bin 文件夹包含一个带有二进制前缀的文件，即“data”，大小为 3.4 GB。我通过 keras 在 ubuntu 17.10 上使用 python 3.5 在 spyder 上使用 tensorflow 后端编写命令，在执行命令后它给了我这个错误：

File "/home/mary/anaconda3/envs/virenv/lib/python3.5/codecs.py", line 321, in decode
  (result, consumed) = self._buffer_decode(data, self.errors, final)

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x94 in position 19: invalid start byte.

编写的代码如下：f = open('data').

我申请时已经成功实现了相同的代码 f = open('glove.6B.100d.txt')。

主要问题是什么？