Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 杭州市滨江区浙工大人工智能创新研究院傅晨波获国家专利权

杭州市滨江区浙工大人工智能创新研究院傅晨波获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉杭州市滨江区浙工大人工智能创新研究院申请的专利基于大模型和微调的虚假信息及评论的自动检测与控制方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120372064B

龙图腾网通过国家知识产权局官网在2025-10-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510858647.6,技术领域涉及:G06F16/906;该发明授权基于大模型和微调的虚假信息及评论的自动检测与控制方法及系统是由傅晨波;熊非凡;朱泓畅;俞山青;闵勇;钟高伟;李明姝设计研发完成,并于2025-06-25向国家知识产权局提交的专利申请。

基于大模型和微调的虚假信息及评论的自动检测与控制方法及系统在说明书摘要公布了:本发明公开了一种基于大模型和微调的虚假信息及评论的自动检测与控制方法及系统,通过多模态特征融合与低秩适配微调技术提升虚假信息检测准确性,结合文本上下文特征、图像语义信息及外部知识库,有效识别隐含逻辑矛盾或事实冲突的复杂虚假信息;采用低秩矩阵微调方法优化大语言模型参数,在保留通用能力的同时增强对中文虚假信息的判别能力。本发明通过自动化处理机制实现全流程快速响应,显著降低人工审核成本,模块化设计支持灵活扩展至不同社交媒体平台。动态标注风险等级,并针对无公开接口的平台通过模拟用户行为实现本地屏蔽与传播遏制。整体方案在检测精度、处理效率及系统扩展性上实现技术突破,为大规模用户生成内容管理提供支撑。

本发明授权基于大模型和微调的虚假信息及评论的自动检测与控制方法及系统在权利要求书中公布了:1.一种基于大模型和微调的虚假信息及评论的自动检测与控制方法,其特征在于,包括以下步骤: 获取网络平台中的信息数据,所述信息数据包括文本、图像及元数据; 对所述信息数据进行预处理,所述预处理包括文本清洗、提取文本内容与图像内嵌文本,并转换为结构化数据存储至数据库; 将预处理后的数据输入经微调的大语言模型,通过融合文本特征与图像特征,计算所述信息数据的虚假概率; 其中,所述大语言模型的微调过程包括: 将微调低秩矩阵A、B和C、D举矩阵的秩设置为16,通过在Transformer模型的Query和Value模块中插入低秩矩阵: 其中Q、V即原始模型中的冻结矩阵,即这些矩阵的参数不会更新,保持原始模型的权重,,、和、是新的LoRA插入的低秩适配矩阵,用于以增量形式优化原始的查询矩阵和数值矩阵; 使用带标签的测试集和生成的标签数据对模型进行验证,评估模型的性能; 将经过监督学习训练和微调的模型部署到实际系统中,利用用户反馈不断优化和调整模型; 所述文本特征与图像特征的融合过程包括: S3.1:采用现有模型的文本编码器对需要判别信息的文本特征进行提取,得到信息的文本上下文特征; S3.2:对于信息的图像特征,进行以下两种转换:一是利用现有模型生成信息图像的标题,获取全局语义信息;二是利用工具检测信息图像的嵌入式文本;最后进行拼接,得到图像上下文特征; S3.3:利用现有方法从图像上下文特征与文本上下文特征中提取实体,得到对应的实体集,分别在互联网搜索引擎中搜索对应的实体描述,最后将实体与描述文本进行拼接组成一个完整的句子,得到大语言模型的输入文本; 进一步的,采用BERT模型的文本编码器对需要判别信息的文本特征进行提取,得到信息的文本上下文特征;利用TagMe工具提取对应的实体描述,进行拼接计算过程可描述为以下内容: 其中,表示输入的信息文本中的实体集合,表示新闻的文本上下文特征,表示与信息文本实体相关的文本背景知识集合,对于信息的图像特征,进行以下两种转换:利用BLIP模型生成信息图像的标题,获取全局语义信息,利用PaddleOCR模型检测信息图像的嵌入式文本,最后用TagMe工具提取对应的实体描述,进行拼接,得到信息图像上下文特征,计算结果为: 其中为利用BLIP提取信息图像的描述标题,为利用PaddleOCR模型检测信息图像的嵌入式文本,为信息图像的文本表达,表示与信息图像实体相关的文本背景知识集合; 计算所述信息数据的虚假概率的过程包括: S3.4:将得到的文本以及指定的prompt输入到经过微调的大语言模型中进行判断,输出信息为真假的概率值; S3.5:利用微调好的大语言模型对数据库中的数据进行分析,获得每条评论的健康得分; S3.6:将获得的真假分值同步更新到数据库对应的信息数据中; S3.7:将结果实时返回给用户,对于需要较长时间处理的信息,采用异步处理机制,立即返回处理状态或初步结果,待处理完成后再通知用户; 进一步的,将上述的S3.3以及S3.4中得到的文本描述以及指定的prompt输入到经过微调的大语言模型中进行判断,输出信息为真假的概率值; 将真假判定的结果,通过springMVC的方式返回给前端用户,同时存入MySQL数据库对应的信息数据中真假概率字段; 根据虚假概率对判定为虚假的信息执行自动化处理操作,包括: 对支持公开API的平台,提交API请求执行举报或屏蔽操作; 对不支持API的平台,通过模拟用户行为执行标记或隐藏操作,包括伪装请求头与切换代理IP。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州市滨江区浙工大人工智能创新研究院,其通讯地址为:310056 浙江省杭州市滨江区长河街道湖西路575号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。