大连民族大学贺建军获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉大连民族大学申请的专利一种基于文本恢复重建的古籍文档图像校正方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121213433B 。
龙图腾网通过国家知识产权局官网在2026-04-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511749147.5,技术领域涉及:G06T5/80;该发明授权一种基于文本恢复重建的古籍文档图像校正方法是由贺建军;向俊武;崔新树;周瑜;郑蕊蕊;刘文鹏设计研发完成,并于2025-11-26向国家知识产权局提交的专利申请。
本一种基于文本恢复重建的古籍文档图像校正方法在说明书摘要公布了:本发明公开了一种基于文本恢复重建的古籍文档图像校正方法,涉及计算机技术领域,包括:基于概率扩散模型、残差块和时间嵌入技术构建文本恢复模型;构建损失函数,引入频域分解的训练策略,与损失函数共同对文本恢复模型进行训练得到训练后的文本恢复模型;将古籍文档图像输入至上述模型得到初步恢复的古籍文档图像;基于Enet网络和Tnet网络构建文档图像校正模型,采用监督训练和弱监督训练对Enet网络进行训练,采用自监督训练对Tnet网络进行训练,得到训练后的文档图像校正模型;将初步恢复的古籍文档图像输入至训练后的文档图像校正模型,得到校正后的古籍文档图像;本发明能够清晰重建古籍图像的文本,学习重建的文本形变特征,有效提升校正的性能。
本发明授权一种基于文本恢复重建的古籍文档图像校正方法在权利要求书中公布了:1.一种基于文本恢复重建的古籍文档图像校正方法,其特征在于,包括: S1:获取古籍文档图像数据集以形成训练集; S2:构建第一残差块和第二残差块,引入两个概率扩散模型,基于概率扩散模型、第一残差块、第二残差块和时间嵌入技术构建文本恢复模型,所述文本恢复模型包括粗粒度预测器和去噪器,将训练集中的古籍文档图像输入至文本恢复模型;构建粗粒度预测器和去噪器的损失函数,引入频域分解的训练策略构建损失函数,与粗粒度预测器和去噪器的损失函数共同对文本恢复模型进行训练,得到训练后的文本恢复模型; 其中,使用第一残差块替换第一概率扩散模型中的所有卷积层,得到粗粒度预测器; 使用第二残差块替换第二概率扩散模型中的所有卷积层,并在每个第二残差块中引入时序嵌入机制,得到去噪器; 在每个第二残差块中引入时序嵌入机制,包括: 将去噪器去噪过程中设定的时间步长的高维向量通过双层感知机进行编码,生成调制参数,使用所述调制参数对每个第二残差块中经第一卷积层处理并归一化后的特征图的通道进行缩放和偏移; 引入频域分解的训练策略,即设计低频滤波器和高频滤波器将原始的真实清晰图像分离为低频和高频信息,如公式3所示, 3 其中,低频信息用于重建图像的整体结构,高频信息用于重建文本笔画的特征,和分别表示低通和高通线性滤波器核,符号代表卷积运算,通过设计互补的滤波器对,满足,为狄拉克函数,将输入图像分离为低频基础特征和高频细节特征; 构建低频基础特征的损失函数,如公式4所示, 4 其中,表示数学期望; 构建高频细节特征的损失函数,如公式5所示, 5 其中,为噪声状态; 构建总损失函数,如公式6所示, 6 其中,为频率权重,为任务权重;为粗粒度预测器的损失函数,为去噪器的损失函数; S3:将古籍文档图像输入至训练后的文本恢复模型进行去噪,得到初步恢复的古籍文档图像; S4:引入Enet网络和Tnet网络,基于Enet网络和Tnet网络构建文档图像校正模型,将初步恢复的古籍文档图像输入至文档图像校正模型,采用监督训练和弱监督训练对Enet网络进行训练,采用自监督训练对Tnet网络进行训练,得到训练后的文档图像校正模型; S5:将初步恢复的古籍文档图像输入至训练后的文档图像校正模型,通过Enet网络学习古籍文档图像的几何结构特征,通过Tnet网络学习古籍文档图像的局部文本形变特征,得到校正后的古籍文档图像。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连民族大学,其通讯地址为:116000 辽宁省大连市经济技术开发区辽河西路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励