Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 平安科技(深圳)有限公司张旭龙获国家专利权

平安科技(深圳)有限公司张旭龙获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉平安科技(深圳)有限公司申请的专利基于图像分析的音频信息生成方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119649790B

龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411724922.7,技术领域涉及:G10L13/02;该发明授权基于图像分析的音频信息生成方法、装置、设备及介质是由张旭龙;王健宗;程宁;赵金凤设计研发完成,并于2024-11-27向国家知识产权局提交的专利申请。

基于图像分析的音频信息生成方法、装置、设备及介质在说明书摘要公布了:本发明涉及人工智能技术领域,尤其涉及一种基于图像分析的音频信息生成方法、装置、设备及介质。该方法通过滑窗从待转换图像中滑动提取出N张截取图像,将N张截取图像输入时序卷积网络模型中,输出伪时序特征,将伪时序特征和图像特征输入编码器中,得到压缩特征,对压缩特征进行再卷积,得到再卷积特征,在预设的音频特征集合中搜索与再卷积特征最相似的音频特征,得到目标音频特征,根据目标音频特征,生成参考音频特征,对参考音频特征进行特征重构,得到生成音频信息,通过滑动方式截取待转换图像,使得截取图像包含更丰富的图像信息,提高特征表征能力,将再卷积特征映射为符合音频习惯的目标音频特征,提高图像与生成音频的关联程度。

本发明授权基于图像分析的音频信息生成方法、装置、设备及介质在权利要求书中公布了:1.一种基于图像分析的音频信息生成方法,其特征在于,所述音频信息生成方法包括: 获取待转换图像及其图像特征,通过预设滑窗按照设定步长在所述待转换图像中进行滑动提取,得到N张截取图像,N为大于零的整数; 将所述N张截取图像输入训练好的时序卷积网络模型中进行时序特征提取,输出对应待转换图像的伪时序特征; 将所述伪时序特征和所述图像特征输入训练好的编码器中进行特征压缩,得到压缩特征,使用卷积层对所述压缩特征进行再卷积,得到所述卷积层中至少一个卷积核对应的再卷积特征; 针对任一个再卷积特征,在预设的音频特征集合中搜索与所述再卷积特征最相似的音频特征,得到对应再卷积特征的目标音频特征; 根据所有目标音频特征,生成参考音频特征,对所述参考音频特征进行特征重构,确定特征重构结果为对应待转换图像的生成音频信息。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。