我们正在使用 Google BERT 进行问答。我们使用 SQUAD QnA 发布训练数据集( https://github.com/google-research/bert、https://rajpurkar.github.io/SQuAD-explorer/dataset/train-v1.1.json)对BERT 进行了微调)
它生成了新的检查点,BERT 为我们在文本文档中提出的大多数问题提供了很好的答案。但是,有些问题的答案是错误的,因此我们正在尝试进一步微调我们的问题和文本文档上的已知答案。我们根据最后生成的检查点进一步训练并得到新的检查点。
当我们问同样的问题时,有了新的检查点,答案没有得到纠正!以前 BERT 以 99% 的置信度给出错误答案,现在也以 95% 的置信度给出相同的错误答案。
有人可以建议,如果他们有相同或相似的经验,请建议。
以下是 BERT github 问题中的问题,并且在很长一段时间内都没有得到解答:
- 提供自定义培训后,BERT 准确性降低。答案也不正确:https ://github.com/google-research/bert/issues/492
- 无法通过自定义训练增量训练 BERT:https ://github.com/google-research/bert/issues/482
- 少量培训没有影响: https ://github.com/google-research/bert/issues/481
- 自定义域培训:https ://github.com/google-research/bert/issues/498