东衢智慧交通基础设施科技(江苏)有限公司;北京特希达科技有限公司杨伟杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东衢智慧交通基础设施科技(江苏)有限公司;北京特希达科技有限公司申请的专利基于语音识别与多模态交互的智能图表动态生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120670583B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511183665.5,技术领域涉及:G06F16/34;该发明授权基于语音识别与多模态交互的智能图表动态生成方法是由杨伟杰;金鑫;周政;徐种宇;蒋剑彪设计研发完成,并于2025-08-22向国家知识产权局提交的专利申请。
本基于语音识别与多模态交互的智能图表动态生成方法在说明书摘要公布了:本发明属于语音识别技术领域,本发明公开了基于语音识别与多模态交互的智能图表动态生成方法;包括:采集用户语音数据并去噪,得到精确用户语音数据;进行语义结构切分组合,输出完整用户语义数据;执行语义解析并输出用户查询意图信息;提取查询目标数据子集;基于查询目标数据子集构造字段结构画像并生成目标图表格式,输出目标图表参数;基于实时采集的多模态交互信息对目标图表参数进行结构修正,输出动态修正目标图表;对动态修正目标图表执行趋势演化展示,得到优化目标图表并将动态优化目标图表发送到预设数据大屏;提高了语音识别准确率和鲁棒性,优化了图表的交互功能,满足了用户的交互需求,提升了用户的交互体验。
本发明授权基于语音识别与多模态交互的智能图表动态生成方法在权利要求书中公布了:1.基于语音识别与多模态交互的智能图表动态生成方法,其特征在于,包括: S1.采集用户语音数据并进行语音数据去噪,得到精确用户语音数据; S2.对精确用户语音数据进行语义结构切分组合,包括: 设定动态滑动窗口并利用该窗口遍历精确用户语音数据,将间隔时间大于动态滑动窗口大小的语音间隔进行边界标记;基于标记的语音间隔对精确用户语音数据进行结构划分,输出结构语音段集合;提取每个结构语音段的段前和段后两个相邻结构语音段,并将结构语音段和相邻结构语音段组合为上下文语音段组; 对每个上下文语音段组进行连贯性评估,输出语义连贯性评分;设定连贯性评分阈值,结合语义连贯性评分和连贯性评分阈值筛选可合并语音段组;对可合并语音段组进行语段合并,输出完整用户语义数据;基于合理语音间隔对完整用户语义数据进行结构划分,计算划分后完整用户语义数据的综合连贯性评分,若不符合连贯性评分阈值则对语段合并强度进行调整,反之则不做调整; 所述连贯性评估的方式包括: 对任意一个上下文语音段组进行语音文本识别,输出原始识别文本;采集用户信息,基于用户信息加载本地口音参照数据库,基于本地口音参照数据库对原始识别文本进行标准文本转换,输出标准识别文本;识别标准识别文本中的口语化词语,基于预设专业表达词语字典对口语化词语进行词形修正,输出专业表达模式文本; 识别专业表达模式文本中的次级词语,并对次级词语进行标记;分别统计在专业表达模式文本中目标语音段文本、段前语音段文本和段后语音段文本中次级词语切换次数,输出语义转折程度;若语义转折程度高于预设阈值则判定为断裂结构,输出断裂权重,反之判定为连贯结构并输出连贯权重; 对专业表达模式文本进行语义向量建模,分别得到目标语音段语义向量、段前语义向量和段后语义向量;计算目标语音段语义向量与段前语义向量的语义相似度,输出前向语义连贯性评分,计算目标语音段语义向量与段后语义向量的语义相似度,输出后向语义连贯性评分;基于断裂权重和连贯权重对前向语义连贯性评分和后向语义连贯性评分进行加权融合,输出语义连贯性评分; 所述筛选可合并语音段组的方式包括: 连贯性评分阈值包括合并阈值和独立阈值,当语义连贯性评分高于或等于合并阈值时将对应上下文语音段组判定为可合并语音字段组;当语义连贯性评分低于独立阈值时,将上下文语音段组对应的结构语音段分别判定为单独语义结构,同时不参与合并;当语义连贯性评分高于独立阈值且低于合并阈值时,若语义连贯性评分靠近合并阈值,则对相应上下文语音段组进行语音间隔调整,并重新进行连贯性评估直到语义连贯性评分高于或等于合并阈值;若语义连贯性评分靠近独立阈值则先进行语义间隔调整并进行连贯性评估,若调整后输出的语义连贯性评分与合并阈值的差值大于预设距离阈值,则将上下文语音段对应的结构语音段判定为单独语义结构; S3.对完整用户语义数据执行语义解析,输出用户查询意图信息; S4.基于用户查询意图信息从预设数据库中提取查询目标数据子集; S5.基于查询目标数据子集构造字段结构画像,基于字段结构画像利用预设语言大模型生成目标图表格式,输出目标图表参数; S6.实时采集多模态交互信息,基于多模态交互信息对目标图表参数进行结构修正,输出动态修正目标图表; S7.对动态修正目标图表执行趋势演化展示,得到优化目标图表;将动态优化目标图表发送到预设数据大屏。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东衢智慧交通基础设施科技(江苏)有限公司;北京特希达科技有限公司,其通讯地址为:211112 江苏省南京市江宁区天元东路1009号(江宁高新园);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励