海南大学郭祯获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉海南大学申请的专利一种构建隐私数据感知模型的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119293846B 。
龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411356057.5,技术领域涉及:G06F21/62;该发明授权一种构建隐私数据感知模型的方法是由郭祯;范晨阳;孟繁厚设计研发完成,并于2024-09-27向国家知识产权局提交的专利申请。
本一种构建隐私数据感知模型的方法在说明书摘要公布了:本发明公开了一种构建隐私数据感知模型的方法,使用简化的RoformerBERT模型,结合注意力机制和RoPE编码实现社交网络隐私信息的自动感知,并精准定位隐私信息的位置,并利用BI‑LSTM模型对本文信息进行多次编码,分层提取上下文特征后,使用EGP算法对隐私实体进行判别,有效提高参数利用率和模型的识别准确率,对于自己构建的微博隐私数据集和面对真实社交网络中的隐私数据,FDPER模型能够对用户的隐私泄露信息进行精准识别和定位,并将这些隐私数据反馈给用户,在具体识别隐私实体数据对比分析中也通过复现率证实了隐私识别的有效性、准确性。
本发明授权一种构建隐私数据感知模型的方法在权利要求书中公布了:1.一种构建隐私数据感知模型的方法,其特征在于,包括以下步骤: 步骤1:首先对数据集进行预处理操作,通过分词操作将文本分割成单词或子单词,然后读取Vocab.txt文件,根据单词和对应的索引将文本中的单词转换为相应的向量表示,将词嵌入向量和位置嵌入向量通过RoPE重编码嵌入融合,得到符合RoformerBERT预训练模型输入文本数据的特征表达式,利用RoPE算法进行重新编码的目的是将绝对位置编码转换成相对位置编码,从而增加数据的输入量; 步骤2:利用RoformerBERT模型对转换后的编码向量进行特征提取处理,得到文本数据的特征表达式,通过RoformerBERT模型学习之后,一个的向量会转化成一个矩阵,可以更好地表示文本中的隐藏特征;其中代表的是每个输入标记的向量维度; 步骤3:将RoformerBERT模型处理后的数据输入到BI-LSTM模型中进行序列处理,从而捕捉数据的长期依赖关系和双向信息,提高了模型在处理序列数据时的性能,BI-LSTM模型由两个独立的LSTM组成,输入序列分别以正序和逆序输入到两个LSTM模型进行特征提取,将两个输出向量拼接得到具有序列特征表达的最终数据; 步骤4:将步骤3中获得的数据传递到EGP算法中进行计算,GP层将输入张量划分为个矩阵输出,其中为实体类型数量,通过对每个矩阵进行计算,最终确定输出的隐私实体类别; 所述EGP算法,其核心思想是针对每种实体类型共享得分计算,将NER任务分解为提取和分类两个子任务,在提取步骤中,将文本片段提取为实体,而在分类步骤中识别每个实体的具体类型,这种分解方法可将提取过程等同于仅包含一个实体类型的NER任务,可以用评分矩阵完成它,分类步骤可以理解为,其中表示对实体类型的标识,为整体的隐藏状态维度,新的评分函数如公式6所示: ; 提取任务的参数由所有实体类型共享,当增加新的实体类型时,分类任务的参数增加,其中;为了进一步减少参数,使用替换来代表Token,最终的评分函数为公式7所示: ; 其中;直观上看,每个新实体类型增加的参数数量是,为词嵌入的维度,其中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人海南大学,其通讯地址为:570100 海南省海口市人民大道58号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励