浙江大学朱哲人获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利一种跨语言开发的多源异构代码转换方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121143797B 。
龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511683146.5,技术领域涉及:G06F8/40;该发明授权一种跨语言开发的多源异构代码转换方法和装置是由朱哲人;钱金传;江肖禹;宋执环设计研发完成,并于2025-11-17向国家知识产权局提交的专利申请。
本一种跨语言开发的多源异构代码转换方法和装置在说明书摘要公布了:本发明公开一种跨语言开发的多源异构代码转换方法,通过将每个代码样本和代码样本分离的单元代码块均构建成{‘代码’xcc,‘代码类型’ycc,‘代码描述’xdd}格式,构建代码样本集;然后利用代码样本集依次对模型进行挖掘代码内部特征的首次训练、提升代码语义一致性的二次训练和面向混合代码一致性的三次训练;再分别将通过首次训练后和三次训练后的模型得到的嵌入映射函数作为嵌入模型,利用两个嵌入模型实现嵌入表示映射后,得到嵌入表示向量;实际使用时,通过将初始提示词输入两个嵌入模型,得到检索增强信息;最后将初始提示词和检索增强信息拼接后,输入大语言模型,得到代码转换结果。本发明能够提升代码转换的准确性。
本发明授权一种跨语言开发的多源异构代码转换方法和装置在权利要求书中公布了:1.一种跨语言开发的多源异构代码转换方法,其特征在于,包括: S1:收集多个代码样本,并将每个代码样本对应的代码文件中的各个单元代码块分离;再将每个代码样本和单元代码块均构建成{‘代码’xc,‘代码类型’yc,‘代码描述’xd}的格式,构建代码样本集; S2:将代码样本集输入预训练的Bert语言模型,对模型进行首次训练,挖掘代码内部特征; S3:将代码样本集输入首次训练后的Bert语言模型,对模型进行提升代码语义一致性的二次训练; S4:将代码样本集输入二次训练后的Bert语言模型,进行面向混合代码一致性的Bert语言模型的三次训练;步骤S4中,模型三次训练的损失函数由两部分求和得到,第一部分为加权重构误差,通过如下方式得到: 计算各个代码文件与不同代码类型中邻域样本之间的在嵌入表示上的重构误差,并且计算代码文件的嵌入表示与邻域样本间的点积,作为加权重构误差中的权重; 第二部分为代码类型预测误差与一个可人工调节的系数λ2的乘积; S5:将通过首次训练后的Bert语言模型得到的嵌入映射函数,作为嵌入模型一,记为Embed1;将通过三次训练后的Bert语言模型得到的嵌入映射函数,作为嵌入模型二,记为Embed2; S6:将用于训练的代码文件作为RAG系统的知识库,并分别利用Embed1和Embed2实现嵌入表示映射后,得到嵌入表示向量,作为知识向量库; S7:实际使用时,将需要进行代码转换的智能算法代码按照提示词框架{‘目标语言’:,‘目标任务’:,‘原始代码’:}构建出初始提示词; S8:将初始提示词输入到Embed1中,得到相应的嵌入表示;通过相似度计算从知识向量库选出最相似的多个嵌入表示向量; S9:将初始提示词和S8得到的结果带入Embed2,得到相应的嵌入表示;根据相似度计算选出最相似的数个嵌入表示向量,作为检索增强信息; S10:将初始提示词和检索增强信息拼接得到完整提示词,输入大语言模型,得到代码转换结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励