中科极限元(杭州)智能科技股份有限公司温正棋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中科极限元(杭州)智能科技股份有限公司申请的专利一种大模型对抗样本的生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116720572B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310635311.4,技术领域涉及:G06N3/094;该发明授权一种大模型对抗样本的生成方法是由温正棋;王小鹏设计研发完成,并于2023-05-31向国家知识产权局提交的专利申请。
本一种大模型对抗样本的生成方法在说明书摘要公布了:本发明公开了一种大模型对抗样本的生成方法,该大模型对抗样本的生成方法包括以下步骤:采用生成式大模型,将音频信息和文本信息编码为中间特征,解码还原为音频文件;引入循环损失计算,随机替换掉音频部分信息,达到音频各部分信息解耦;利用强化学习,采用马尔科夫决策过程,减少了人工标注的工作量。该大模型对抗样本的生成方法引入循环损失,对中间特征各部分信息解耦,提升模型性能且对各部分可控;通过训练生成式大模型,降低对数据质量的要求;通过强化学习系统,根据输入的文本信息自动的选择恰当的情感信息等,做到了在数据层面无需额外情感标注,且合成后的结果对于情感的选择、强烈程度更加自然平滑。
本发明授权一种大模型对抗样本的生成方法在权利要求书中公布了:1.一种大模型对抗样本的生成方法,其特征在于,包括以下步骤: S1.采用生成式大模型,将音频信息和文本信息编码为中间特征,解码还原为音频文件; S2.引入循环损失计算,随机替换掉音频部分信息,达到音频各部分信息解耦; 所述S2包括以下步骤: S21.当生成式大模型的音频输入被随机替换为与文本信息不对应的内容时,停止循环损失的计算; S22.当生成式大模型的音频输入被随机替换为与文本信息音频内容相关时,引入循环损失计算; 所述S22包括以下步骤: S221.当音频内容,即音频信息1与文本内容相关联时,在训练过程中,随机挑选另一段音频信息,即音频信息2,将音频信息2随机的输入到一种音频编码器中; S222.通过上述音频编码器将音频信息2编码后的结果替换该编码器原来的编码,与其余编码器的编码一起送入到生成式大模型中; S223.解码为音频文件时,将生成的对抗样本文件再次输入到音频编码器中,得到其余编码器关于对抗样本音频的其余编码; S224.将上述其余编码与之前的未输入生成式大模型的编码,即关于音频信息1的其余编码器编码进行损失计算; S3.利用强化学习,采用马尔科夫决策过程,减少了人工标注的工作量; 所述S3包括以下步骤: S31.利用强化学习,构建音频信息关于情感、韵律信息的查找表; S32.采用马尔科夫决策过程,在生成阶段和训练阶段,减少了人工标注工作量; 所述S32包括以下步骤: S321.在生成阶段,马尔科夫模型与文本信息进行交互,马尔科夫模型得到部分文本信息后,从查找表中选择一种模型认为恰当的韵律或者情感信息作为音频域的输入; S322.在训练阶段,生成式大模型获取重建损失计算loss1,获取损失计算loss2,当loss1与loss2相减的差值低于设置阈值,认为动作生成正向反馈,不断地强化学习; 所述S322包括以下步骤: S3221.生成式大模型会先对输入的文本和音频进行一次生成,将得到的对抗样本音频域输入音频进行重建损失计算loss1; S3222.对于马尔科夫模型,从音频信息查找表中选择一种恰当的音频编码作为音频信息的输入,连同其他信息输入给生产式大模型后,将生成的对抗样本与原始音频输入进行损失计算loss2; S3223.预先设置一个设定阈值,将得到的loss1与loss2相减得到差值,差值低于设定阈值时,认为该动作造成了正向反馈; S3224.通过不断的学习,最终使得强化学习系统能根据文本信息选择恰当的关于音频类的信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中科极限元(杭州)智能科技股份有限公司,其通讯地址为:310019 浙江省杭州市上城区九环路9号4号楼11楼1105室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励