上饶市大万网络科技有限公司郑桂芳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上饶市大万网络科技有限公司申请的专利一种基于人工智能的广播电视节目制作方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119996597B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510214684.3,技术领域涉及:H04N5/278;该发明授权一种基于人工智能的广播电视节目制作方法及系统是由郑桂芳;宋永康;杨李锋;毛朝火;张文刚设计研发完成,并于2025-02-26向国家知识产权局提交的专利申请。
本一种基于人工智能的广播电视节目制作方法及系统在说明书摘要公布了:本发明涉及音频处理技术领域,具体涉及一种基于人工智能的广播电视节目制作方法及系统。该方法获取音频段;基于音频段中每个时刻下的人声对应的声纹嵌入向量,将音频段划分为单声音子段和多声音子段;基于多声音子段中每个人物所对应的单声音子段中每个时刻下的人声在各个频率下对应的强度,获取多声音子段中每个人物人声的增强音频,进而获取每个人物对应的每句话;根据每个人物对应的每句话的结构和讲述情况,获取电视节目的显示字幕。本发明通过对多声音子段中的每个人物的音频进行增强,提高了准确识别每个人物的说话内容,进而准确获取每个人物对应的每句话,然后对每个话进行分析,有效提高字幕显示的准确性和完整性。
本发明授权一种基于人工智能的广播电视节目制作方法及系统在权利要求书中公布了:1.一种基于人工智能的广播电视节目制作方法,其特征在于,该方法包括以下步骤: 获取音频文件中的各个音频段; 基于每个音频段中每个时刻下的人声对应的声纹嵌入向量,将音频段划分为单声音子段和多声音子段; 基于每个多声音子段中每个人物所对应的单声音子段中每个时刻下的人声在各个频率下对应的强度,获取每个多声音子段中每个时刻下的每个人物的人声在各个频率下对应的参考强度,进而获取每个多声音子段中每个人物人声的增强音频; 对每个单声音子段和所述增强音频进行识别,获取每个人物对应的每句话;根据每个人物对应的每句话的结构和讲述情况,获取电视节目的显示字幕; 所述获取电视节目的显示字幕的方法为: 对于音频文件中的任一个人物,根据该人物的每句话与该人物的其他每句话对应的句法树的平衡因子差异和叶子节点数量差异,获取该人物的每句话的成分缺少程度; 当所述成分缺少程度大于预设成分缺少程度阈值时,对应句子为该人物的成分缺少句;其中,一句话为一个完整句子; 对于构成句子的任一种成分和任一成分缺少句,根据该成分缺少句缺少该成分的情况、以及该人物所有句子中含有该成分的句子占比情况,获取该成分缺少句缺少该成分的可能程度; 当可能程度大于预设可能程度阈值时,将该成分缺少句前一相邻句子中的该成分对应的内容,作为该成分缺少句的该成分的内容,在字幕中用括号补充显示; 对于任一句话,将该句话对应时长与该句话中所包含字数的比值,作为该句话中任意相邻两个字之间的参考时间间隔; 当该句话中任意相邻两个字之间的时间间隔大于所述参考时间间隔的预设倍数时,将该句话在字幕中分开显示。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上饶市大万网络科技有限公司,其通讯地址为:334000 江西省上饶市高铁经济试验区石狮乡三都村大坪101号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励