复旦大学;复旦大学义乌研究院洪智铭获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉复旦大学;复旦大学义乌研究院申请的专利一种针对未知开放环境的层级式风控演绎装置系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115841155B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211299277.X,技术领域涉及:G06N5/04;该发明授权一种针对未知开放环境的层级式风控演绎装置系统是由洪智铭;杨涛;吴晓峰;胡波设计研发完成,并于2022-10-24向国家知识产权局提交的专利申请。
本一种针对未知开放环境的层级式风控演绎装置系统在说明书摘要公布了:本发明涉及一种针对未知开放环境的层级式风控演绎装置系统,通过微调推理条件随机场转移状态,对开放式系统中的风险随机概率分布进行近似,最大限度地评估主导优势策略的自适应置信水平。本发明阐明了目标条件政策和预测处理之间的内在关系,迭代计算增量缓冲并以此修改其在开放环境中的应对响应,并使其能够在整个自主学习过程中处理随机性。在开放式环境下,这种分层结构更容易实现,因为该方案的效率更高,消耗的计算量更少。本发明实现了对环境潜在风险的有效抽象,证明了其在机器人任务中的具备风险预估与推理的实际潜力,进一步提高了探索效率并改善了分层架构的有效性与可解释性。
本发明授权一种针对未知开放环境的层级式风控演绎装置系统在权利要求书中公布了:1.一种针对未知开放环境的层级式风控演绎装置系统,采用鼓励式探索与经验策略相结合的思想,对开放式系统中的随机条件概率分布进行近似,迭代计算中间增量缓冲中的主导优势策略的置信度水平以此构造未知风险环境下的层级自适应行为,其特征在于,包括以下步骤: 步骤S1,观测层:导入环境信息的实时采样观测序列; 步骤S2,分析层:构建动作观测的历史经验序列; 步骤S3,判断层:风险事件触发检测与失效判断; 步骤S4,置信层:生成推理模型并更新置信区间; 步骤S5,迭代强化层:在复杂多模态系统中进行实物与仿真交 叉验证,不断回溯并评估所述置信区间,将所述实时采样观测序列反馈至所述步骤S1内进行重复迭代, 所述步骤S3具体包括如下子步骤: 步骤S3-1,开放式系统中,假设每个均遵循伯努利分布,联合动作空间在状态空间下的效用值可近似为执动作作观测历史序列的效用值总和,则最佳响应的提议分布如下: =, 其中,为有限步内获得全局奖励而迭代推导得出的置信度,与状态空间无关; 步骤S3-2,为了解决非平稳场景中的环境偏差与指数状态空间计算的问题,采用鼓励式探索与经验策略相结合的思想,每次迭代的稀疏环境奖励分配一组用于探索交互的权重: , 其中,权重值由实时的机会式环境探索决定,则当前风险条件下的全局奖励则相应地得到如下更新: , 其中,通过采样{可生成策略置信度:, 由于恒成立,使得通过采样样本估计的未知环境变化的损失期望正比于真实的未知风险的梯度; 步骤S3-3,当且仅当历史动作观测序列的优势策略不再适用,应当加大智能体对于外部环境的探索程度, 其中,所述步骤S5具体包括如下子步骤: 步骤S5-1,智能体可采用贝尔曼动态规划方程,进一步促进对未知开放场景的彻底探索,推演出符合当前状态的真实概率分布并以此制定最佳响应; 步骤S5-2,在同等置信条件下,优先考虑具有更高环境奖励的动作,并分配非零似然的玻尔兹曼分布Boltzmanndistribution来更新其联合优势策略; 步骤S5-3,每次的联合优势策略都是通过步长累积效用的概率分布进行迭代更新,最终通过不断与环境交互而收敛为均衡状态。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人复旦大学;复旦大学义乌研究院,其通讯地址为:200433 上海市杨浦区邯郸路220号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励