北京神州数码云计算有限公司李盛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京神州数码云计算有限公司申请的专利一种多模态的样本数据的合成与标注一体化方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121071627B 。
龙图腾网通过国家知识产权局官网在2026-02-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511631330.5,技术领域涉及:G06F18/241;该发明授权一种多模态的样本数据的合成与标注一体化方法、装置、设备及存储介质是由李盛;仉佃星;李刚;回武让设计研发完成,并于2025-11-10向国家知识产权局提交的专利申请。
本一种多模态的样本数据的合成与标注一体化方法、装置、设备及存储介质在说明书摘要公布了:本发明公开了一种多模态的样本数据的合成与标注一体化方法、装置、设备及存储介质,涉及信息提取技术领域。该方法先对采集的样本数据集合分组,计算每组第一样本数据的推理置信度平均值、标准差及多模态大模型误检率,据此确定目标分组;再结合目标分组的分组条件与分组噪声生成目标样本特征部分,经模型预测及复核后,将特征部分与第一实际标签部分组合为目标样本数据。同时,依据目标分组需求数量、目标样本生成数量及折算系数确定补采数量并获取补采数据集,合并后提取增量样本的图像与上下文特征并编码融合。最后将融合编码输入模型,根据其是否为采集类型,直接用损失值或修正后的损失值优化模型,有效填补样本薄弱区,提升模型性能。
本发明授权一种多模态的样本数据的合成与标注一体化方法、装置、设备及存储介质在权利要求书中公布了:1.一种多模态的样本数据的合成与标注一体化方法,其特征在于,应用于农业场景,所述方法包括: 对采集的样本数据集合进行分组并计算每组子集中第一样本数据的推理置信度的平均值和标准差以及多模态大模型对所述第一样本数据的误检率; 根据所述误检率,确定目标分组; 根据所述目标分组的分组条件和分组噪声,生成目标样本数据的特征部分; 将所述目标样本数据的特征部分输入到所述多模态大模型,得到所述目标样本数据的第一预测标签部分; 根据针对所述目标样本数据的第一预测标签部分的复核结果,得到所述目标样本数据的第一实际标签部分; 将所述目标样本数据的特征部分与第一实际标签部分组合,得到所述目标样本数据; 根据所述目标分组的补采数量进行补采处理,得到补采数据集; 将所述补采数据集和至少一个所述目标样本数据合并,得到所述目标分组的增量样本数据集; 通过以下公式,将所述增量样本数据的图像编码和上下文编码融合,得到融合编码: 其中,表示第个增量样本数据的融合编码,表示Sigmoid激活函数,表示权重矩阵,表示第个增量样本数据的上下文编码,表示偏置项,表示第个增量样本数据的图像编码,表示逐元素相乘操作; 将所述融合编码输入到所述多模态大模型,得到所述融合编码的第二预测标签部分; 根据所述融合编码的第二实际标签部分与第二预测标签部分,确定损失值; 判断所述融合编码的类型是否为采集类型; 如果所述融合编码的类型是采集类型,则根据所述损失值对所述多模态大模型进行优化;如果所述融合编码的类型不是采集类型,则利用修正系数对所述损失值进行修正,根据修正后的损失值对所述多模态大模型进行优化。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京神州数码云计算有限公司,其通讯地址为:100000 北京市海淀区上地九街9号3层308号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励