西北大学赵万青获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北大学申请的专利一种面向文物的跨模态知识图谱自动构建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115129811B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210698952.X,技术领域涉及:G06F16/334;该发明授权一种面向文物的跨模态知识图谱自动构建方法是由赵万青;刘博伟;彭进业;汪霖;王珺;范建平;张晓丹;杨文静;胡琦瑶设计研发完成,并于2022-06-20向国家知识产权局提交的专利申请。
本一种面向文物的跨模态知识图谱自动构建方法在说明书摘要公布了:本发明公开了一种面向文物的跨模态知识图谱自动构建方法,包括:1对文物数字资源的非结构化数据进行信息抽取,提取文物文本实体;2构建文物文本知识图谱本体并填充数据后提取文物实体的结构化向量表示;3获取文物图像特征向量表示;4构建跨模态关系,将文物文本实体、文物实体的结构化向量表示以及文物图像特征向量表示映射到公共空间,得到统一的跨模态表示,构建出跨模态的文物遗产知识图谱。本发明通过结合跨模态关系关联和知识图谱技术,联合特征学习和跨模态关系建模,利用不同模态内容的相关性获得补充的知识,从而优化三元组,实时针对文物遗产数据的结构化保存和管理。
本发明授权一种面向文物的跨模态知识图谱自动构建方法在权利要求书中公布了:1.一种面向文物的跨模态知识图谱自动构建方法,其特征在于,包括如下步骤: 步骤1,提取文物文本实体: 对文物数字资源进行细粒度划分得到文物实体的类别和文物实体的属性,并标注后得到文物的文本信息数据集,将文物的文本信息数据集输入至命名实体识别模型,得到文物文本实体; 步骤2,构建文物文本知识图谱本体并填充数据后提取文物实体的结构化向量表示: 根据步骤1得到的文物实体的类别和文物实体的属性,以及实体之间的关联关系,构建出文物文本知识图谱本体,并用步骤1得到的文物文本实体填充文物文本知识图谱本体得到文物文本知识图谱,从文物文本知识图谱中提取文物实体的结构化向量表示; 步骤3,文物图像特征向量表示: 获取文物的图像数据集,利用深度神经网络提取每张文物图像中的特征,构建图像特征向量表示,将这些图像特征向量表示投影到文物实体的结构化信息空间,得到与步骤2的文物实体的结构化向量表示相同维度的文物图像特征向量表示,使用基于注意力机制的方法为文物文本实体构建聚合的文物图像特征向量表示; 步骤4,构建跨模态关系: 将步骤1中文物文本实体、步骤2的文物实体的结构化向量表示以及步骤3得到的文物图像特征向量表示映射到公共空间,得到统一的跨模态表示; 所述步骤1中,命名实体识别模型包括:依次连接的BERT预训练模型、BiLSTM模型和CRF层; 将文物的文本信息数据集输入至命名实体识别模型,得到文物文本实体包括以下步骤:文本信息数据集输入至BERT预训练模型以将文物的文本信息的每个字符都使用向量来表示,并根据每个字符在文本中周围的字符学习来得到该字符在向量空间的位置,输出词向量;然后将词向量输入BiLSTM模型,通过文本介绍的上下文信息,自动提取上下文特征然后输出词向量对应标签的可能性得分矩阵,最后CRF层对BiLSTM输出的可能性得分矩阵进行标注,得到文物文本实体; 所述步骤4包括: 步骤4.1,将步骤1中文物文本实体与步骤3得到的文物图像特征向量表示结合得到知识图谱实体的文本特征向量和图像特征向量拼接的双模态表示; 步骤4.2,对于文物文本实体、文物实体的结构化向量表示以及文物图像特征向量表示及其组合都定义打分函数:采用步骤4.1中的双模态表示扩充打分函数,得到跨模态总体打分函数; 步骤4.3,采用损失函数优化步骤4.2得到的跨模态总体打分函数,以最小化全局损失,得到统一的跨模态表示,实现文物实体多模态信息的融合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北大学,其通讯地址为:710069 陕西省西安市太白北路229号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励