云南省大数据有限公司王世磊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉云南省大数据有限公司申请的专利一种基于多模态代码生成与渐进式交付方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120447885B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510941709.X,技术领域涉及:G06F8/35;该发明授权一种基于多模态代码生成与渐进式交付方法是由王世磊;余正涛;张珣;张杰;张欣琳;杨金灵设计研发完成,并于2025-07-09向国家知识产权局提交的专利申请。
本一种基于多模态代码生成与渐进式交付方法在说明书摘要公布了:本发明涉及一种基于多模态代码生成与渐进式交付方法,属代码生成技术与自然语言处理领域。本发明基于基础模板构建可视化低代码开发平台,其通过可视化页面设置配置数据;基于配置数据生成数据库模型数据,结合基础模板预生成基础代码;将生成的基础代码输入预训练得到的PLBART模型;通过PLBART模型对语言语法和语义进行推理补全,输出可运行的代码;将可运行的代码推送至代码仓库,对可运行的代码进行自动化构建、测试、打包;使用灰度发布策略,实现灰度发布,实现渐进式交付;本发明通过多种模态数据处理实现系统性代码生成,将灰度发布有机结合,实现渐进式交付,显著提升开发效率、代码质量和系统的可靠性。
本发明授权一种基于多模态代码生成与渐进式交付方法在权利要求书中公布了:1.一种基于多模态代码生成与渐进式交付方法,其特征在于:所述方法包括: S1、全面收集多种编程语言的代码和自然语言文本数据进行预处理,基于Transformer架构进行序列到序列预训练得到PLBART模型; S2、构建代码生成的基础模板,基于基础模板构建可视化低代码开发平台; S3、基于可视化低代码开发平台通过可视化页面设置配置数据; S4、基于配置数据生成数据库模型数据,结合基础模板预生成基础代码; S5、将生成的基础代码输入PLBART模型;通过PLBART模型对语言语法和语义进行推理补全,输出可运行的代码; S6、将可运行的代码推送至代码仓库,使用依赖管理工具对可运行的代码进行自动化构建、测试、打包; S7、使用灰度发布策略,实现灰度发布,实现渐进式交付; 所述S1具体包括: S11、收集大量代码、函数及自然语言描述的混合序列,汇聚不同模态的数据;在汇聚过程中,汇聚不同模态的数据时,根据概率多项分布对实例进行预训练,具体公式为: ;其中,表示第i种语言的上下采样后的文本比例,N是语言总数,是第i种语言的实例总数,是第j种语言的实例总数,α是平滑参数,表示第i种语言占总语言的占比, 表示的α次方,表示第j种语言占总语言的占比, 表示的α次方; S12、在训练过程中,采用序列到序列的Transformer进行实现,通过encoder编码器、decoder解码器以及额外增加的归一化层实现精度稳定训练; 归一化层中对同一个特征同一个样本的不同维度计算均值和标准差,标准差的公式: ; 其中, 为第i种语言所输入的批量数据,为每个特征的方差,为每个特征的均值,m是批量数据的大小,是第i种语言所输入的批量数据的标准差,是用于防止除零操作的常数,表示在第i种语言所输入的批量数据的第i1个数据; S13、在去噪自编码时,通过重建噪声函数,破坏原有输入文本序列,通过随机采样标记替换为掩码标记或从输入文本序列中删除,实现对token进行掩码; S14、编码器输入是一个噪声文本序列,decoder解码器的输入是一个带有一个位置偏置的原始文本;一个语言id标记分别被附加到encoder编码器和decoder解码器的输入中; S15、PLBART模型在N种语言中进行预训练;每种语言有一个无标记实例集,每个实例使用噪声函数进行训练PLBART模型从噪声函数去预测输入的批量数据中的实例,PLBART模型训练为最大化具体公式为: ; 其中,为损失函数,f 为噪声函数,用于学习语言的语法和语义特征,是噪声强度超参数,P 是解码过程中的概率函数,在标准序列到序列解码之后估计的解码流程,θ是神经网络中的训练参数; 通过使用结构感知的预训练来学习程序语法和语义,通过输入是带有bug的代码,输出是无bug的代码,不断优化模型; 所述S7具体包括: S71、以容器集群技术Kubernetes为基础,构建多个pod,一个pod包含一个或多个容器,通过对多个pod设置不同的标签进行区分;Pod是Kubernetes中的基本运作单元; S72、利用Kubernetes负载均衡策略,根据不同的标签分配网络流量; S73、当业务代码发生变化时,利用Kubernetes进行集群整体管理,通过控制不同标签pod,实现节点组件间的通信; S74、通过IP的hash算法实现对不同pod转发,对IP进行hash算法的公式为: ; 其中M和W都是正整数,M设置为2的幂次方,W为计算机字长大小,a是一个接近于W的数,floor表示对表达式进行下取整,表示取余; S75 、在进行灰度发布时,通过替换部分pod,通过对IP进行hash算法后,仅对10%~15%网络流量分配至新的pod,实现对部分用户灰度发布。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人云南省大数据有限公司,其通讯地址为:650213 云南省昆明市官渡区矣六街道商海路云南数字文旅产业园44号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。