山东科技大学文龙日获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东科技大学申请的专利一种非结构文本的识别方法、系统、设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120163157B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510645040.X,技术领域涉及:G06F40/295;该发明授权一种非结构文本的识别方法、系统、设备和存储介质是由文龙日;宋贤;许潇予设计研发完成,并于2025-05-20向国家知识产权局提交的专利申请。
本一种非结构文本的识别方法、系统、设备和存储介质在说明书摘要公布了:本发明涉及电数字数据处理中非结构文本处理技术领域,具体为一种非结构文本的识别方法、系统、设备和存储介质;为解决现有技术中非结构文本识别精度低的问题,本发明首先通过将非结构文本的上下文语义特征进行全连接处理,得到上下文语义全连接特征;然后,获取上下文语义全连接特征的位置编码并与特征进行叠加,经不同尺度卷积和非线性处理后进行拼接得到多尺度融合特征;最后,多尺度融合特征经特征流动平衡的动态注意力处理,得到多头注意力融合特征,将多头注意力融合特征的正弦和余弦编码堆叠到最后一个维度后进行位置编码增强处理,得到待识别特征,经识别处理,得到非结构文本识别结果,提高了非结构文本识别的准确度。
本发明授权一种非结构文本的识别方法、系统、设备和存储介质在权利要求书中公布了:1.一种非结构文本的识别方法,其特征在于,包括如下操作: S1、提取非结构文本的上下文语义特征,经全连接处理,得到上下文语义全连接特征; S2、获取上下文语义全连接特征的位置编码,与上下文语义全连接特征经叠加处理,得到上下文语义位置编码特征;上下文语义位置编码特征分别经不同尺度的卷积和非线性处理后,进行通道维度的拼接,得到多尺度融合特征; S3、多尺度融合特征经基于特征流动平衡的多头注意力处理,得到多头注意力特征;基于特征流动平衡的当前头注意力处理的操作为:多尺度融合特征的查询特征矩阵和键特征矩阵相乘后,进行矩阵缩放和掩码处理,得到当前头初始注意力分数;当前头初始注意力分数与贝叶斯因子相加,得到当前头贝叶斯注意力分数;当前头贝叶斯注意力分数经softmax函数处理后与多尺度融合特征的值特征矩阵相乘,得到当前头注意力特征;得到每个头注意力特征后,基于相邻头注意力特征之间的相似度,获取相邻头注意力特征之间的平衡因子;基于前一个头注意力特征和当前头注意力特征之间的平衡因子,对后一个头注意力特征进行特征更新,得到若干个更新头注意力特征;若干个更新头注意力特征,与第一个头注意力特征和第二个头注意力特征经加权求和,得到多头注意力特征; 多头注意力特征经线性处理,得到多头注意力线性特征;多头注意力线性特征的全局特征与多头注意力线性特征经门控融合机制处理和层归一化处理,得到多头注意力融合特征;将多头注意力融合特征的正弦编码和余弦编码堆叠到最后一个维度后,进行位置编码增强处理,得到待识别特征;待识别特征经识别处理,得到非结构文本识别结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东科技大学,其通讯地址为:266590 山东省青岛市黄岛区前湾港路579号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。