苏州元脑智能科技有限公司陈奎丞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州元脑智能科技有限公司申请的专利一种推理请求的处理方法及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121349645B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511935641.0,技术领域涉及:G06F9/48;该发明授权一种推理请求的处理方法及电子设备是由陈奎丞;何也;孙畅;吴韶华设计研发完成,并于2025-12-19向国家知识产权局提交的专利申请。
本一种推理请求的处理方法及电子设备在说明书摘要公布了:本申请公开了一种推理请求的处理方法及电子设备,涉及模型推理技术领域,包括基于预训练语言模型初始化或部署后捕获的计算流程生成拓扑执行图,并结合历史序列长度的分布特征,构建包含不同序列长度专属拓扑执行图的图池,图池的构建逻辑能够覆盖实际应用中高频出现的多种序列长度场景;同时,基于预训练语言模型计算流程捕获的执行图构建方式,确保了不同长度拓扑执行图的结构一致性和计算正确性,使得推理框架能够灵活响应不同长度的推理请求;当推理请求的实际序列长度大于预设长度阈值时,将其拆分为多个独立子块,随后针对每个子块,从图池中匹配对应的目标拓扑执行图并启动执行,避免因超长序列超出固定范围而回退至动态核函数的情况。
本发明授权一种推理请求的处理方法及电子设备在权利要求书中公布了:1.一种推理请求的处理方法,其特征在于,包括: 获取推理请求的实际序列长度; 若所述实际序列长度大于预设长度阈值,则将所述推理请求的实际序列划分为多个子块; 针对各个子块,从预先构建的图池中确定与子块长度匹配的目标拓扑执行图;其中,所述图池基于预训练语言模型初始化或部署后捕获计算流程得到的执行图,结合历史序列长度的分布特征构建而成,所述图池包括不同序列长度的拓扑执行图; 启动所述目标拓扑执行图,以得到所述推理请求的推理结果; 所述针对各个子块,从预先构建的图池中确定与子块长度匹配的目标拓扑执行图,包括:针对各个子块,读取全局缓冲区中的历史上下文,确定注意力偏移量;根据子块长度与所述注意力偏移量,从预先构建的图池中确定目标拓扑执行图;其中,多个子块中尾块的长度小于等于所述预设长度阈值,除所述尾块之外的其他子块的长度等于所述预设长度阈值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州元脑智能科技有限公司,其通讯地址为:215000 江苏省苏州市吴中经济开发区综保区经一路1号8幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励