苏州元脑智能科技有限公司程洋洋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州元脑智能科技有限公司申请的专利加速卡部署方法、装置、设备、存储介质和程序产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120407200B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510897024.X,技术领域涉及:G06F9/50;该发明授权加速卡部署方法、装置、设备、存储介质和程序产品是由程洋洋;程世超;杨洋;王兵;张凯设计研发完成,并于2025-06-30向国家知识产权局提交的专利申请。
本加速卡部署方法、装置、设备、存储介质和程序产品在说明书摘要公布了:本申请公开了加速卡部署方法、装置、设备、存储介质和程序产品,涉及人工智能技术领域,本申请的方法中,一方面,基于目标模型运行过程中的存储占用量,确定运行目标模型所需的加速卡数量,这样,可以保证加速卡的存储容量之和与目标模型的存储占用量相匹配。另一方面,依据加速卡数量,构建多个加速卡拓扑架构,并基于各个加速卡拓扑架构运行目标模型时的模型性能指标,选择模型性能指标符合预设条件的第一加速卡拓扑架构作为部署加速卡的架构参考,这样,在加速卡中运行目标模型时,可以保证目标模型的性能满足期望的性能要求。基于以上两个方面,可以解决相关技术中的模型的硬件资源配置与计算需求不匹配的问题。
本发明授权加速卡部署方法、装置、设备、存储介质和程序产品在权利要求书中公布了:1.一种加速卡部署方法,其特征在于,所述方法包括: 获取目标模型运行过程中的存储占用量; 依据所述存储占用量和每个加速卡的存储容量,确定运行所述目标模型时所需的加速卡数量; 依据所述加速卡数量,构建多个加速卡拓扑架构,其中,在不同的加速卡拓扑架构中,加速卡之间的连接方式不同; 确定使用各个加速卡拓扑架构运行所述目标模型时的模型性能指标; 若存在模型性能指标符合预设条件的第一加速卡拓扑架构,则依据所述第一加速卡拓扑架构,确定用于运行所述目标模型的服务器数量,以及在用于运行所述目标模型的服务器中部署加速卡; 其中,所述模型性能指标包括所述目标模型的延迟时长; 所述确定使用各个加速卡拓扑架构运行所述目标模型时的模型性能指标,包括: 针对所述多个加速卡拓扑架构中的任一目标加速卡拓扑架构,获取所述目标加速卡拓扑架构运行所述目标模型时的首次令牌时长和平均令牌时长,所述首次令牌时长表征从所述目标模型接收到待推理序列开始,至所述目标模型输出第一个令牌的耗时,所述平均令牌时长表征在所述目标模型输出第一个令牌之后,所述目标模型输出其它各个令牌的平均耗时; 基于所述首次令牌时长、所述平均令牌时长和所述目标模型需输出的最大令牌数量,确定所述目标加速卡拓扑架构运行所述目标模型时的延迟时长。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州元脑智能科技有限公司,其通讯地址为:215000 江苏省苏州市吴中经济开发区综保区经一路1号8幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。