我对计算创造力一无所知。但是,我从事知识工程。这属于通常称为语义网络技术的知识表示和推理领域。最近谷歌已经普及了“知识图谱”这个名称,现在很多人倾向于谈论知识图谱而不是语义网,尽管严格来说,知识图谱只是语义网技术的一小部分。
这是一个庞大的研究领域,广泛应用于生物信息学、医疗保健、物业管理和许多其他领域,以实现语义搜索。我本人从事生物信息学工作,我们使用 265 个本体,涵盖近 700 万个概念,用于在大约 300 PB 的数据中进行语义搜索。事实上,知识图至少部分用于支持谷歌搜索和谷歌信息框提供的信息。因此,很多人已经在不知不觉中使用知识工程的成果。
那么什么是本体?本体定义概念和概念之间的关系。这在计算机科学中已经做了很长时间了,那么是什么让本体和语义网如此特别呢?
- 每个概念和关系都分配有全局唯一标识符,例如 URI、IRI、PURL
- 本体以机器可读的语法定义,例如 XML、JSON-LD
- 语义网定义了一个能够描述任意数据的通用数据模型,称为 RDF 三元组。特别是,这有助于人们在定义模式之前定义他们的数据(就像关系数据库一样)。
- RDF 三元组
<s, p, o>
表示主语 ( s
) 和宾语 ( o
) 通过谓词 ( p
) 相关联。
- SPARQL 是一种用于查询 RDF 三元组的查询语言
- 本体配备了基于数理逻辑的形式语义,这使得人工智能推理程序能够从显性知识中推断出隐性知识。例如 RDFS 和 OWL。
- JSON-LD、RDF、SPARQL、RDFS 和 OWL 是 W3C 标准。
这是一本可以为您提供对该领域各个方面以及如何在实践中使用的相当温和的介绍的书:知识图谱食谱。