当前位置 : 首页 > 专利喜报 > 乐清市电力实业有限公司;国网浙江省电力有限公司乐清市供电公司;温州图盛控股集团有限公司徐钰栋获国家专利权

乐清市电力实业有限公司;国网浙江省电力有限公司乐清市供电公司;温州图盛控股集团有限公司徐钰栋获国家专利权

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

龙图腾网获悉乐清市电力实业有限公司;国网浙江省电力有限公司乐清市供电公司;温州图盛控股集团有限公司申请的专利基于多模态动态提示与时空稀疏化的视频动作定位方法获国家发明授权专利权，本发明授权专利权由国家知识产权局授予，授权公告号为：CN120412070B 。

龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉：该发明授权的专利申请号/专利号为：202510356816.6，技术领域涉及：G06V40/20；该发明授权基于多模态动态提示与时空稀疏化的视频动作定位方法是由徐钰栋;徐珏;王璐;赵海;赵子龙;胡高铭;彭潮海;赵奕帆;吕家辉;郑雷;刘逸欧;邓雅元;刘芳;项鹏建;李海舟设计研发完成，并于2025-03-25向国家知识产权局提交的专利申请。

本基于多模态动态提示与时空稀疏化的视频动作定位方法在说明书摘要公布了：本发明涉及视频理解技术领域，具体公开一种基于多模态动态提示与时空稀疏化的视频动作定位方法，该方法包括：利用预设深度学习模型的多模态动态提示生成器，生成全局特征向量与提示向量，利用预设深度学习模型的空间剪枝模块，得到时空稀疏化的时序聚合特征并压缩得到目标视频特征；利用预设深度学习模型中的自注意力模块与双向LSTM网络，并结合每个样本视频的目标视频特征与动作类别标签数据，对预设深度学习模型进行迭代训练，得到视频动作定位模型，并将待测视频输入至视频动作定位模型，得到动作定位结果。本发明在提升语义表达与模态对齐能力的同时，还能满足视频动作定位的实时性需求，并大幅提高视频动作定位的准确性。

本发明授权基于多模态动态提示与时空稀疏化的视频动作定位方法在权利要求书中公布了：1.一种基于多模态动态提示与时空稀疏化的视频动作定位方法，其特征在于，包括：利用预设深度学习模型中的多模态动态提示生成器，并结合任一样本视频及相应的动作类别标签数据，生成所述任一样本视频的全局特征向量与提示向量，并利用所述预设深度学习模型中的空间剪枝模块，对所述任一样本视频的时空特征向量进行空间剪枝操作，得到时空稀疏化后的所述任一样本视频的时序聚合特征并进行聚合压缩，得到所述任一样本视频的目标视频特征，直至得到每个样本视频的目标视频特征；利用所述预设深度学习模型中的自注意力模块，并结合每个样本视频的目标视频特征和提示向量，得到每个样本视频的时序一致性约束损失与InfoNCE损失，利用所述预设深度学习模型中的双向LSTM网络，并结合每个样本视频的目标视频特征与动作类别标签数据，得到每个样本视频的视频定位损失与动作分类损失；基于每个样本视频的时序一致性约束损失、InfoNCE损失、视频定位损失与动作分类损失，对所述预设深度学习模型进行迭代训练，得到视频动作定位模型，并将待测视频输入至所述视频动作定位模型，得到所述待测视频的动作定位结果；其中，所述动作定位结果包括：动作区间预测值与相对应的预测动作类别；所述多模态动态提示生成器包括：时空特征提取模型、文本编码器、全局平均池化层、特征拼接层和多层感知器；利用预设深度学习模型中的多模态动态提示生成器，并结合任一样本视频及相应的动作类别标签数据，生成所述任一样本视频的全局特征向量与提示向量的步骤，包括：利用所述时空特征提取模型，获取所述任一样本视频的时空特征向量；利用所述文本编码器，获取所述任一样本视频的动作类别标签数据的文本特征向量；利用所述全局平均池化层，对所述任一样本视频的时空特征向量进行全局平均池化，得到所述任一样本视频的全局特征向量；利用所述特征拼接层，将所述任一样本视频的全局特征向量与文本特征向量进行拼接，得到所述任一样本视频的组合向量；利用所述多层感知器，对所述任一样本视频的组合向量进行多层感知处理，得到所述任一样本视频的提示向量；利用所述预设深度学习模型中的空间剪枝模块，对所述任一样本视频的时空特征向量进行空间剪枝操作，得到时空稀疏化后的所述任一样本视频的时序聚合特征的步骤，包括：将所述任一样本视频中的每个样本视频帧分别划分为多个预设片段，并利用所述空间剪枝模块中的预设算法，计算并根据所述任一样本视频中的每个样本视频帧的每个预设片段的重要性分数，筛选得到所述任一样本视频中的每个样本视频帧的多个目标片段；将所述任一样本视频对应的所有目标片段进行时序聚合并进行图卷积操作，得到所述任一样本视频的时序聚合特征；利用所述预设深度学习模型中的自注意力模块，并结合每个样本视频的目标视频特征和提示向量，得到每个样本视频的时序一致性约束损失与InfoNCE损失的步骤，包括：将每个样本视频的目标视频特征和提示向量输入至所述自注意力模块，得到每个样本视频的时间维度自注意力矩阵；基于每个样本视频的目标视频特征和文本特征向量，并结合所述预设深度学习模型的InfoNCE损失函数，得到每个样本视频的InfoNCE损失；基于每个样本视频的时间维度自注意力矩阵，并结合所述预设深度学习模型的时序一致性约束损失函数，得到每个样本视频的时序一致性约束损失。

如需购买、转让、实施、许可或投资类似专利技术，可联系本专利的申请人或专利权人乐清市电力实业有限公司;国网浙江省电力有限公司乐清市供电公司;温州图盛控股集团有限公司，其通讯地址为：325600 浙江省温州市乐清市乐成街道南大街185号(另设分支机构经营场所 : 乐清市城东街道旭阳路6688号总部经济园7幢301、401、501室)；或者联系龙图腾网官方客服，联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

请提出您的宝贵建议，有机会获取IP积分或其他奖励

乐清市电力实业有限公司;国网浙江省电力有限公司乐清市供电公司;温州图盛控股集团有限公司徐钰栋获国家专利权

热门推荐

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务