Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 国网青海省电力公司信息通信公司;国网青海省电力公司马晓琴获国家专利权

国网青海省电力公司信息通信公司;国网青海省电力公司马晓琴获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉国网青海省电力公司信息通信公司;国网青海省电力公司申请的专利基于数据增强的语言模型构建方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119760144B

龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411608945.1,技术领域涉及:G06F16/36;该发明授权基于数据增强的语言模型构建方法、装置、设备及介质是由马晓琴;严嘉正;薛峪峰;李炳胜;马海瑛;郭志华;马占海;张俊超;韩伟东;展飞;孙妍;雷晓萍;王生虎;张广德;李飞;李晖设计研发完成,并于2024-11-12向国家知识产权局提交的专利申请。

基于数据增强的语言模型构建方法、装置、设备及介质在说明书摘要公布了:本发明涉及数据增强技术领域,揭露一种基于数据增强的语言模型构建方法,包括:将获取的大规模语料数据进行分类,得到文本数据、音频数据和视频数据;对文本数据、音频数据和视频数进行增强,得到增强文本数据、增强音频数据和增强视频数据;提取增强视频数据中每一帧的图像,得到增强图像数据,并分别进行标准化,得到标准文本数据、标准音频数据和标准图像数据;基于数据类别,选择对应的特征转换方法,将数据转换为特征向量,得到文本特征向量、音频特征向量和图像特征向量;通过Transformer模型和各个向量进行模型构建,得到大语言模型。本发明还提出一种基于数据增强的语言模型构建装置、设备及存储介质。本发明可以提高构建的语言模型的性能。

本发明授权基于数据增强的语言模型构建方法、装置、设备及介质在权利要求书中公布了:1.一种基于数据增强的语言模型构建方法,其特征在于,所述方法包括: 获取大规模语料数据,并将所述大规模语料数据进行分类,得到文本语料数据、音频语料数据和视频语料数据; 通过从所述音频语料数据和视频语料数据中提取文本信息,得到补充文本数据,并根据所述补充文本数据和所述文本语料数据得到综合文本数据; 根据增强文本数据构建PLM模型,通过所述PLM模型从预设的文库中获取文本数据,得到补充文本数据,并根据从预设的文库得到的所述补充文本数据和所述综合文本数据,得到扩充文本数据; 抽取所述扩充文本数据、音频语料数据和视频语料数据中的实体关系,根据所述实体关系构建知识图谱,并根据所述知识图谱中的连接关系对所述扩充文本数据、音频语料数据和视频语料数据进行增强,得到增强文本数据、增强音频数据和增强视频数据;其中所述根据所述知识图谱中的连接关系对所述扩充文本数据、音频语料数据和视频语料数据进行增强,得到增强文本数据、增强音频数据和增强视频数据,包括: 通过所述知识图谱中的连接关系为所述扩充文本数据推荐相关的术语或概念,对所述文本数据进行增强,得到所述增强文本数据; 通过在所述音频语料数据的转录文本中添加所述知识图谱中相关的术语或概念,提高所述音频语料数据的信息量,得到增强音频数据; 基于所述知识图谱的为所述视频语料数据添加元数据标签或字母,对所述视频语料数据进行增强,得到增强视频数据; 提取所述增强视频数据中每一帧的图像,得到增强图像数据,并对所述增强文本数据、增强音频数据和增强图像数据分别进行标准化,得到标准文本数据、标准音频数据和标准图像数据; 基于所述标准文本数据、标准音频数据和标准图像数据的数据类别,选择对应的特征转换方法,将所述标准文本数据、标准音频数据和标准图像数据转换为特征向量,得到文本特征向量、音频特征向量和图像特征向量; 通过Transformer模型以及所述文本特征向量、音频特征向量和图像特征向量进行模型构建,得到大语言模型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网青海省电力公司信息通信公司;国网青海省电力公司,其通讯地址为:810000 青海省西宁市盐湖巷5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。