我有一个项目列表(大小~50K)和几个文档(每个文档的平均页面~10)。我正在尝试查找每个文档中列出的所有项目,如下所示:
for document in documents_folder:
document_text = extract_content(document)
for item in item_list:
if item is found in document_text:
save(doument,item)
每个文档执行大约需要 5 秒。
如何优化?这是最好的方法吗?有一个更好的方法吗 ?
任何建议表示赞赏