中国电子科技集团公司第十研究所王翔获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国电子科技集团公司第十研究所申请的专利基于状态-动作相似性加权奖励机制的快速抗干扰通信方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119946659B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411874880.5,技术领域涉及:H04W24/02;该发明授权基于状态-动作相似性加权奖励机制的快速抗干扰通信方法及系统是由王翔;侯皓洲;班亚龙;丁天语;刘林;马伟元;罗皓设计研发完成,并于2024-12-19向国家知识产权局提交的专利申请。
本基于状态-动作相似性加权奖励机制的快速抗干扰通信方法及系统在说明书摘要公布了:本发明提供一种基于状态‑动作相似性加权奖励机制的快速抗干扰通信方法及系统,所述方法通过优化奖励函数,设计一种能够综合考虑即时奖励与状态‑动作相似性的奖励函数,同时引入状态‑动作对的相似性度量方法,利用历史成功的抗干扰经验构建状态‑动作对样本数据库,确保高价值和相似性高的经验样本能够被优先利用,结合优化的探索‑利用机制,从而使智能体能够更有效地利用历史经验,提升学习效率和决策质量,简化计算复杂度,增强无线通信系统在复杂电磁环境下的抗干扰能力和传输效率。
本发明授权基于状态-动作相似性加权奖励机制的快速抗干扰通信方法及系统在权利要求书中公布了:1.一种基于状态-动作相似性加权奖励机制的快速抗干扰通信方法,应用于无线通信系统,其特征在于,包括以下步骤: 步骤1、将通信抗干扰问题建模为马尔科夫决策过程,其中,基于无线通信系统面临的电磁环境,定义不同时隙的环境状态,包括接收机在每个时隙内观察到的瞬时信号功率,并定义不同时隙无线通信系统选择的传输动作,包括发射机选择的传输信道、发射功率和传输速率; 步骤2、构建深度Q网络并初始化网络参数,其中,所述深度Q网络包括策略Q网络和目标Q网络,所述目标Q网络的结构与策略Q网络相同,用于在训练过程中提供稳定的目标Q值,以计算并更新智能体的动作价值; 步骤3、计算上一时隙t-1的环境状态和传输动作的即时奖励,结合上一时隙t-1的环境状态、传输动作以及当前时隙t的环境状态,得到一组完整状态-动作样本存入数据库中; 步骤4、利用状态-动作对数据库中的历史样本,计算当前状态-动作对的相似性度量值,并通过相似性加权生成加权奖励; 步骤5、将上一时隙t-1的环境状态、传输动作、加权奖励、当前时隙t的环境状态和终止标志构成一组经验样本,存入经验池中,用于后续训练; 步骤6、基于加权奖励调整深度Q网络的损失函数,并通过反向传播算法更新Q网络的权重; 步骤7、利用更新后的策略Q网络选择当前时隙t的传输动作,并反馈到无线通信系统中;若通信未结束,则返回步骤3,继续执行下一时隙t+1的传输动作选择和系统交互,直到通信过程结束。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国电子科技集团公司第十研究所,其通讯地址为:610000 四川省成都市金牛区茶店子东街48号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励