预答辩公告
论文题目 |
分布式知识图谱数据的查询与检索技术研究 |
答辩人 |
王青 |
指导教师 |
秦拯 |
答辩委员会 主席 |
陈浩 |
学科专业 |
软件工程 |
学院 |
信息科学与工程学院 |
答辩地点 |
624 |
答辩时间 |
2021年4月1日 晚19:00 |
学位论文简介
围绕单机环境下知识图谱数据查询与检索性能不足的问题,采取分布式架构是当前主流的解决方案,但是由于技术发展的限制,分布式架构下的知识图谱数据查询和检索仍然有很多方面仍需提高与完善。因此,本文围绕分布式知识图谱数据的查询与检索性能提升与优化这一主题,建立了有助于提升查询与检索性能的模型和方法。取得了以下主要创新性研究成果:
针对多个“自治”的单机知识图谱数据管理系统组成的联邦型分布式计算环境下关键词检索难题,提出在离线阶段生成整合单机知识图谱数据管理系统的类信息来构建模式图的方法,利用单机知识图谱数据管理系统提供的全文搜索接口将关键词映射到模式图上的类,并通过遍历模式图生成结构化查询。
针对强耦合多个单机知识图谱数据管理系统的集中式分布式计算环境,本文提出了在选择分布式执行计划前先收集变量的候选项的一种新的优化方法,并设计了一个基于总运行时间的模型来评估优化的收益用以评估其性能。
针对单源距离查询在分布式环境下性能不佳的问题,本文提出一种基于地标的分布式图处理框架,用于计算大型图中的单源距离查询。该计算框架首先基于一种称为集合介数的度量选择一系列合适的地标,该度量通过评估地标集合所覆盖的最短路径的数量来提供地标选择标准。
主要学术成果
Qing Wang, Peng Peng, Tianyao Tong, Zhen Tian, Zheng Qin. Keyword Search over Federated RDF Systems. In: International Conference on Database Systems for Advanced Applications.(DASFAA),2020,613-622.(CCF-B)
Qing Wang, Shengyi Ji, Peng Peng, Mingdao Li, Ping Huang, Zheng Qin. Optimizing Distance Computation in Distributed Graph Systems. IEEE ACCESS,2020,10:191673-191682.(SCI:3.745)