阿里巴巴达摩院(杭州)科技有限公司曹荣禹获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉阿里巴巴达摩院(杭州)科技有限公司申请的专利模型训练、自然语言处理方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115905282B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211377112.X,技术领域涉及:G06F16/242;该发明授权模型训练、自然语言处理方法、装置、设备及存储介质是由曹荣禹;高畅;石翔;耿瑞莹;黎槟华;黄非;李永彬设计研发完成,并于2022-11-04向国家知识产权局提交的专利申请。
本模型训练、自然语言处理方法、装置、设备及存储介质在说明书摘要公布了:本公开涉及一种模型训练、自然语言处理方法、装置、设备及存储介质。本公开将自然语言转化成SQL查询语句的过程拆分为多个子任务,通过多个子任务得到的子句对机器学习模型进行训练,使得机器学习模型对各个子任务进行学习。然后将多个子任务分别对应的任务提示词、自然语言语句、以及数据库模式输入机器学习模型,使得机器学习模型输出自然语言语句对应的结构化查询语句。从而根据结构化查询语句和自然语言语句对应的标准结构化查询语句,对机器学习模型进行再次训练,使得机器学习模型对主任务进行学习。通过这种任务拆解和组合学习的方式,使得训练后的机器学习模型可以生成精准的SQL查询语句,并提升了机器学习模型的泛化能力和鲁棒性。
本发明授权模型训练、自然语言处理方法、装置、设备及存储介质在权利要求书中公布了:1.一种模型训练方法,其中,所述方法包括: 获取自然语言语句; 根据预设的多个子任务,生成多个第一序列,每个第一序列包括一个子任务对应的任务提示词、所述自然语言语句、以及所述自然语言语句对应的数据库模式; 将所述多个第一序列输入待训练的机器学习模型,使得所述机器学习模型生成多个第二序列,所述多个第一序列和所述多个第二序列一一对应,所述第二序列包括一个或多个查询关键词、以及所述一个或多个查询关键词分别对应的查询内容,所述查询内容是根据所述自然语言语句和所述数据库模式生成的; 根据所述多个第二序列、以及每个第二序列中的查询关键词对应的标准查询内容,对所述机器学习模型进行训练; 将所述多个子任务分别对应的任务提示词、所述自然语言语句、以及所述数据库模式输入所述机器学习模型,使得所述机器学习模型输出所述自然语言语句对应的结构化查询语句; 根据所述结构化查询语句和所述自然语言语句对应的标准结构化查询语句,对所述机器学习模型进行再次训练。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人阿里巴巴达摩院(杭州)科技有限公司,其通讯地址为:310023 浙江省杭州市余杭区五常街道文一西路969号3幢5层516室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。