专利内容由知识产权出版社提供
专利名称:基于多源异构数据的垂直领域知识图谱构建方法及
系统
专利类型:发明专利
发明人:李岱峰,李栩婷,林凯欣,古风云,李鑫,廖健斌,江涛申请号:CN2021118118.1申请日:20211229公开号:CN114254128A公开日:20220329
摘要:本发明公开了一种基于多源异构数据的垂直领域知识图谱构建方法及系统,方法包括S1:获取构建垂直领域知识图谱需要的数据并进行预处理;S2:构建知识抽取任务模型;S3:利用强化学习对所述知识抽取任务模型进行训练,得到训练好的知识抽取任务模型;S4:利用训练好的知识抽取任务模型对步骤S1获取的数据进行知识抽取,得到三元组;S5:将所述三元组导入知识图谱中,得到最终的知识图谱。本发明解决了垂直领域多源数据处理困难、低效的问题,提出一个可用于实现多种抽取任务的统一分层框架,将普遍的知识抽取任务建模为多个标注子任务,并基于框架进行知识抽取,从而实现灵活的、可拓展的垂直领域知识图谱构建框架。
申请人:中山大学
地址:510275 广东省广州市海珠区新港西路135号
国籍:CN
代理机构:广州粤高专利商标代理有限公司
代理人:禹小明
更多信息请下载全文后查看