我有一个数据框,它有两列,“标题”和“描述”。标题栏有一堆与临床实验室测试相关的标题。不幸的是,大多数标题都是相同测试的重复,但由于标题的微小变化,标题显示为唯一。
values = [('Complete blood picture', 'AB'), ('Complete BLOOD test', 'AB'), ('blood glucose', 'AB'), ('COMplete blood Profile', 'AB')]
labels = ['title', 'description']
import pandas as pd
labtest = pd.DataFrame.from_records(values, columns = labels) # Create data frame
这就是数据框的样子。[实际数据集有很多这样的标题,这只是为了这个问题的目的]
Title Description
Complete blood test AB
COMPLETE Blood test\ AB
Blood glucose AB
Complete blood picture AB
这就是我希望数据框的样子:
Title Description
Blood test AB
Blood test AB
Blood test AB
Blood test AB
我想在每个标题中搜索“血液”这个词,如果它是真的,那么用“血液测试”更改整个标题。有没有办法做到这一点?