成都飞机工业(集团)有限责任公司林海峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉成都飞机工业(集团)有限责任公司申请的专利一种基于语法树的文本分级脱敏方法、系统及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118332586B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410323919.8,技术领域涉及:G06F21/62;该发明授权一种基于语法树的文本分级脱敏方法、系统及存储介质是由林海峰;边朕仡;罗佳丽;孙健庭;王尚超;张历记;崔志卓设计研发完成,并于2024-03-21向国家知识产权局提交的专利申请。
本一种基于语法树的文本分级脱敏方法、系统及存储介质在说明书摘要公布了:本发明公开了一种基于语法树的文本分级脱敏方法、系统及存储介质,根据待匹配的文本敏感词之间的语义相关性构建语法树T;基于字符串匹配的分词方法对词库中待匹配的文本进行中文分词;结合语法树的特性对分词词组进行敏感词匹配,当匹配到节点A时,将A加入Map中存储,并优先匹配A的子节点所代表关键词;最后,将匹配得到的敏感词进行分级脱敏。本发明使用基于字符串匹配的分词方法对文本进行分词处理,使待匹配文字的尝试匹配位置得到优化;其次,使用语法树的方式优先匹配与已匹配到的关键词语义相关性较强的关键词,减少了组匹配中尝试匹配次数与回溯次数,有效提高了组匹配的匹配效率。本发明对敏感词采取分级脱敏的方式可以区分敏感词的敏感、机密程度,有针对性的同时避免了计算力的浪费。
本发明授权一种基于语法树的文本分级脱敏方法、系统及存储介质在权利要求书中公布了:1.一种基于语法树的文本分级脱敏方法,其特征在于,包括以下步骤: 步骤S1:创建词库,将待匹配文本的敏感词和与待匹配文本类型相关的专业术语加入词库中; 步骤S2:根据待匹配文本的敏感词之间的语义相关性构建语法树;具体包括步骤S21至步骤S24: 步骤S21:分词:将待匹配文本中的句子分解为单词或子词的序列; 步骤S22:词性标注:为每个单词确定词性,以便于理解单词在句子中的语法角色; 步骤S23:依存关系分析:通过确定单词之间的依存关系,构建一个有向图=表示句子中单词之间的语法结构; 其中,表示节点集合,即句子中的词汇;=,…,,为分词后的单词或子词数量;表示词汇与词汇之间的依存关系;={i,j∣1≤i,j≥M,Ri,j为依存关系标签}; 步骤S24:构建语法树:根据有向图构建语法树 步骤S3:基于字符串匹配的分词方法对词库中待匹配的文本进行中文分词; 步骤S4:结合语法树的特性对分词得到的分词词组进行敏感词匹配,当匹配到节点A时,将A加入Map中存储,防止匹配过程成环,并优先匹配A的子节点所代表的敏感词,提高组匹配效率; 步骤S5:将匹配得到的敏感词进行分级脱敏;具体包括步骤S51至步骤S54: 步骤S51:将匹配到的敏感词根据分级标准分成一级敏感词、二级敏感词和三级敏感词; 步骤S52:针对一级敏感词,采取加密算法进行加密,然后将数字密钥取平均值对密钥加密; 步骤S53:针对二级敏感词,计算出替换的位数,再将二级敏感词进行随机值替换或数值替换;具体包括步骤SB1至步骤SB4: 步骤SB1:将匹配到的二级敏感词转换为由二级敏感词加二级敏感词在文本中位置组成的第二字符串M2, 步骤SB2:定义函数Fx为: Fx+1=Fx*A+Cmodm 其中,A和C分别为常数, mod为取余操作, m为与第二字符串M2绝对差最小的质数; 步骤SB3:接着定义函数Gx为: Gx=Fxmodb+1 其中,b为M2的位数; 步骤SB4:通过函数Gx随机出多个小于第二字符串M2位数的值,将这些值对应第二字符串M2位数上的值定义为将要进行随机替换的第一数字组X,接着对第一数字组X中的每个数字通过函数Gx进行计算,得到用于替换的第二数字组Y,然后,再将第二数字组Y还原到原来的第二字符串M2相应的位置上,而没有被随机到的M2-X,则根据事先建立的数据库采取数值替换; 步骤S54:针对三级敏感词,依次进行随机位移和取整操作。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都飞机工业(集团)有限责任公司,其通讯地址为:610092 四川省成都市青羊区黄田坝纬一路88号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励