知识图谱是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。它于 2012 年 5 月 17 日由 Google 正式提出,初衷是提高搜索引擎的能力,增强用户的搜索质量和体验,实现从网页链接到概念链接的转变,支持按主题检索和语义检索。
知识图谱的关键技术包括:
1. 知识抽取:
实体抽取:通过命名实体识别从数据源中自动识别命名实体。
关系抽取:从数据源中提取实体之间的关联关系,形成网状知识结构。
属性抽取:从数据源中采集特定实体的属性信息。
2. 知识表示:包括属性图和三元组。
3. 知识融合:
实体对齐:消除异构数据中的实体冲突、指向不明等不一致性问题。
知识加工:对知识统一管理,形成大规模的知识体系。
本体构建:以形式化方式明确定义概念之间的联系。
质量评估:计算知识的置信度,提高知识质量。
知识更新:不断迭代更新,扩展现有知识,增加新知识。
4. 知识推理:在已有的知识库基础上挖掘隐含的知识。
在国家人工智能产业综合标准化体系建设指南中,知识图谱标准规范了知识图谱的描述、构建、运维、共享、管理和应用,包括知识表示与建模、知识获取与存储、知识融合与可视化、知识计算与管理、知识图谱质量评价与互联互通、知识图谱交付与应用、知识图谱系统架构与性能要求等标准。
2025-04-17