Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国科学院计算技术研究所王珎获国家专利权

中国科学院计算技术研究所王珎获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国科学院计算技术研究所申请的专利基于数据流架构的Cholesky分解加速计算方法及其系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115391731B

龙图腾网通过国家知识产权局官网在2026-03-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210921474.4,技术领域涉及:G06F17/16;该发明授权基于数据流架构的Cholesky分解加速计算方法及其系统是由王珎;范志华;刘天雨;李文明;叶笑春;范东睿设计研发完成,并于2022-08-02向国家知识产权局提交的专利申请。

基于数据流架构的Cholesky分解加速计算方法及其系统在说明书摘要公布了:本申请公开了一种基于数据流架构的Cholesky分解加速计算方法,所述方法包括:数据准备步骤、矩阵2×2分块计算步骤及矩阵1×1分块计算步骤;将数据流架构中处理单元PE阵列分为多个PE组,将不规则的待计算矩阵按照预定划分规则划分为规则的多个矩阵块,判断规模为N×N的待计算矩阵的N大于预定阈值,则采用基于2×2分块的cholesky拆分算法,循环迭代计算各个PE组中的矩阵块,且通过不同PE组对cholesky分解计算的数据依赖关系,实现PE组间数据传递,待计算矩阵的规模动态调整缩小;判断规模为N×N的所述待计算矩阵的N小于等于预定阈值,采用基于1×1分块的cholesky拆分算法,循环迭代计算,直至计算完成输出计算结果,完成基于数据流架构的Cholesky分解的加速计算。

本发明授权基于数据流架构的Cholesky分解加速计算方法及其系统在权利要求书中公布了:1.一种基于数据流架构的Cholesky分解加速计算方法,其特征在于,所述方法包括: 1主机端通过微控制器对PE组、片上存储、传输模式进行初始化配置; 2各PE组从片上存储中加载所需数据,完成数据准备步骤; 3判断待计算矩阵规模N×N,N是否大于阈值,如果大于阈值,则执行步骤4;否则,执行步骤5; 4执行基于矩阵2×2分块计算步骤,并返回步骤3; 5执行基于矩阵1×1分块计算步骤; 6判断待计算矩阵规模N×N,N是否大于1,如果大于1,则返回步骤5;否则,执行步骤7; 7计算最后一个分块; 8计算完成,将计算结果写回片上存储; 其中,数据准备步骤初始化数据流架构中各个单元,将所述数据流架构中处理单元PE阵列分为多个PE组,将不规则的待计算矩阵按照预定划分规则划分为规则的多个矩阵块,各个所述PE组分别下载对应的所述矩阵块数据,完成Cholesky分解计算数据准备;数据准备步骤包括: PE阵列分组步骤:将所述PE阵列分组为多个PE组,所述PE组包括:G0,0,G0,1,G1,0,G1,1...,G0,y,Gx,0,Gx,y; 矩阵块划分步骤:规模为N×N的所述待计算矩阵A按照2×2分块被划分为:A112×2、A21N-2×2、A122×N-2、A22N-2×N-2,对应Cholesky分解后的矩阵L的各块为:L11、L21、L12和L22其中,L12为L21块的转置; 2×2分块计算步骤包括: 第一步骤:所述G0,0计算所述待计算矩阵的分解后矩阵L11及所述L11的逆L11-1; 第二步骤:所述G0,0向所述G0,y及所述Gx,0传递计算依赖数据,所述G0,y及所述Gx,0计算所述L12及L21; 第三步骤:所述G0,y及Gx,0向Gx,y的分步传递计算依赖数据,完成G0,y、Gx,0和Gx,y的组内计算,并且所述Gx,y向G0,0的迭代数据回传; 第四步骤:Gx,y向G0,y、Gx,0的迭代数据回传;矩阵1×1分块计算步骤包括: 第一步骤:G0,0及Gx,0分别计算对应L11及其逆L11-1 第二步骤:G0,0及Gx,0分别向G0,y及Gx,y传递计算依赖数据,G0,y、Gx,y分别计算对应L21、L12、更新得到待分解矩阵A’,并向G0,0及Gx,0回传迭代所需数据;其中,对于1×1分块,规模为N×N的所述待计算矩阵A被划分为:A111×1、A21N-1×1、A121×N-1、A22N-1×N-1;其中,对应Cholesky分解后的矩阵L的各块为:L11、L21、L12和L22,L12为L21块的转置。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院计算技术研究所,其通讯地址为:100080 北京市海淀区中关村科学院南路6号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。