Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京星汉博纳医药技术有限公司王聪豪获国家专利权

北京星汉博纳医药技术有限公司王聪豪获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京星汉博纳医药技术有限公司申请的专利一种凭证图像处理方法、装置及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120976950B

龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511422784.1,技术领域涉及:G06V30/412;该发明授权一种凭证图像处理方法、装置及设备是由王聪豪;乔健设计研发完成,并于2025-09-30向国家知识产权局提交的专利申请。

一种凭证图像处理方法、装置及设备在说明书摘要公布了:本发明实施例提供一种凭证图像处理方法、装置及设备,所述方法包括:获取待处理凭证图像,所述待处理凭证图像包括:含目标信息的目标区域;对所述待处理凭证图像进行矫正预处理,得到预处理凭证图像;对所述预处理凭证图像进行目标区域定位处理,得到多个目标区域;对所述多个目标区域中的目标信息进行提取,得到多个目标信息;对所述多个目标信息进行核验,得到核验结果,并输出。本发明实施例能够适应多种凭证类型,大幅缩短新增凭证类型的适配时间,显著提升处理灵活性和效率。

本发明授权一种凭证图像处理方法、装置及设备在权利要求书中公布了:1.一种凭证图像处理方法,其特征在于,包括: 获取待处理凭证图像,所述待处理凭证图像包括:含目标信息的目标区域;所述目标区域为承载核心业务信息的区域,所述核心业务信息包括:付款方收款方客户名称ID、交易金额、交易流水号、交易时间和银行支付平台标识logo; 对所述待处理凭证图像进行矫正预处理,得到预处理凭证图像; 对所述预处理凭证图像进行目标区域定位处理,得到多个目标区域; 对所述多个目标区域中的目标信息进行提取,得到多个目标信息; 对所述多个目标信息进行核验,得到核验结果,并输出; 其中,对所述预处理凭证图像进行目标区域定位处理,得到多个目标区域,包括: 对所述预处理凭证图像进行文本区域分割,得到多个分割区域; 对所述多个分割区域进行定位处理,得到多个目标区域; 其中,对所述预处理凭证图像进行文本区域分割,得到多个分割区域,包括: 将所述预处理凭证图像输入预设网络模型的下采样处理层进行下采样处理,得到第一目标特征凭证图像;将预处理凭证图像像素裁剪为输入块,输入包含4个卷积块的下采样层,每个卷积块含卷积+ReLU+池化操作,提取图像低级特征,得到第一目标特征凭证图像; 将所述目标特征凭证图像输入所述预设网络模型的上采样处理,得到第二目标特征凭证图像;将第一目标特征凭证图像输入包含4个上采样块的上采样层,每个上采样块含反卷积+特征拼接+卷积操作,恢复图像尺寸,得到第二目标特征凭证图像; 根据第二目标特征凭证图像以及所述预设网络模型的激活函数输出分割概率图;根据激活函数,对第二目标特征凭证图像进行处理,输出每个像素属于文本区域的概率,作为分割概率图; 其中,Sx,y为第二目标特征凭证图像在x,y处的特征值,Px,y为每个像素属于文本区域的概率,Px,y∈[0,1]; 模型训练采用损失函数进行优化; 其中,LOSS为损失函数,A为预测掩码,B为真实掩码,解决样本不平衡问题; 根据预设阈值和分割概率图对所述预处理凭证图像进行分割,得到多个分割区域;设定预设阈值为0.5,当Px,y≥0.5时,判定该像素属于文本区域;否则为背景区域,得到多个分割区域; 其中,对所述多个分割区域进行定位处理,得到多个目标区域,包括: 获取所述多个分割区域的每个分割区域的边界框的坐标;对每个分割区域,采用轮廓检测提取其最小外接矩形,记录边界框的左上角坐标xmin,ymin与右下角坐标xmax,ymax,每个分割区域的边界框坐标为[xmin,ymin,xmax,ymax]; 根据所述每个分割区域的边界框的坐标,确定多个目标区域;根据业务规则对分割区域进行筛选,筛选后的分割区域作为目标区域; 对所述多个目标区域中的目标信息进行提取,得到多个目标信息,包括: 对所述多个目标区域中的文本信息进行识别,得到文本识别结果;采用CNN+BiLSTM+CTC模型识别目标区域的文本,得到文本识别结果; CNN特征提取:将目标区域的图像输入ResNet50模型,保留conv5_x层的输出,通过1×1卷积将通道数降为256,得到文本的视觉特征序列X=[x1,x2,...,xT],T为特征序列长度; BiLSTM序列建模:将X输入2层双向LSTM,学习特征序列的上下文依赖关系,输出编码序列Y=[y1,y2,...,yT]; CTC解码:采用束搜索解决特征序列长度T与文本序列长度L不匹配问题,输出概率最高的文本序列S=[s1,s2,..,sL]; 根据所述文本识别结果与预设数据库中的目标信息表中的字段进行模糊匹配,得到多个目标信息;设识别结果为Srec,数据库中的客户名称为Sdb; 精确匹配:若Srec=Sdb,则置信度=98%,直接匹配成功; 模糊匹配:若Srec≠Sdb,对Srec和Sdb进行分词,得到词集C和D,根据,确定词集C和D的相似度,当JC,D≥0.8时,判定匹配成功; 其中,当JC,D为词集C和D的相似度; 编辑距离排序:根据LDSrec,Sdb=min{操作次数},计算Srec与Sdb的最小编辑次数; 其中,LDSrec,Sdb为Srec与Sdb的最小编辑次数,编辑包括:插入删除替换操作; 当LDSrec,Sdb≤3时,取前5候选作为匹配结果;对于辅助字段采用正则匹配; 对所述多个目标区域中的目标信息进行提取,得到多个目标信息,包括: 对所述多个目标信息进行哈希值生成与置信度评估;根据E=0.299r+0.587g+0.114b,将目标区域RGB图像转灰度; 其中,E为灰度值,r、g、b为RGB通道值; 对灰度图像进行16×16块MD5预处理;通过SHA-256生成64位哈希值; 根据CF1=PM1×KT1,确定核心字段置信度; 其中,CF1为核心字段置信度,PM1为识别模型概率值,KT1为字段完整性系数; 根据CF2=PM2×KT2,确定辅助字段置信度; 其中,CF2为辅助字段置信度,PM2为正则匹配得分,KT2为位置匹配得分; 其中,对所述多个目标信息进行核验,得到核验结果,包括: 获取所述多个目标信息的哈希值和置信度; 根据所述目标信息的哈希值和置信度以及核验优先级,对所述多个目标信息进行核验,得到核验结果;规则采用XML和MySQL双存储方式,XML定义核验逻辑,MySQL存储规则元数据,解析器将XML格式转换为DRL格式后,按优先级从1到5的顺序执行核验; 其中,优先级1为类型核验,提取凭证中银行或支付平台Logo的特征点,与预设特征库比对,匹配度不低于0.75时判定Logo有效;同时确定凭证中的固定文本的TF-IDF值,TF-IDF值不低于0.8时判定文本有效,Logo与文本均有效则凭证类型合格,否则不合格; 优先级2为重复核验,通过查询集群中存储的哈希值,若目标信息的哈希值已存在则判定为重复;同时查询MySQL中流水号与客户ID的联合索引,若该组合已存在也判定为重复,任一条件满足即拦截重复凭证; 优先级3为客户匹配,将订单系统中的客户ID与从目标信息中提取的客户ID进行精确比对,两者一致则客户匹配合格,否则不合格; 优先级4为金额匹配,对目标信息中的金额进行标准化处理,去除非数字字符后转换为十进制类型,再与订单金额进行比对,两者绝对误差不超过0.01元时金额匹配合格,否则不合格; 优先级5为异常拦截,若优先级2判定凭证重复,且优先级3判定客户ID不匹配、优先级4判定金额不匹配,将凭证的标识信息、错误代码、错误信息写入日志库; 最终根据核验结果和置信度分级处理:若优先级1到4均合格且置信度不低于95%,则自动通过核验;若优先级1到4均合格但置信度在80%到94%之间,标记为待确认状态;若任一优先级1到4核验不合格,或置信度低于80%,则判定为核验失败,并输出具体失败原因。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京星汉博纳医药技术有限公司,其通讯地址为:101318 北京市顺义区安祥街10号院2号楼3层301;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。