Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请实施例公开了一种交互方法、装置、电子设备和计算机可读存储介质,属于交互技术领域。该方法包括:对目标用户的当前对话信息进行识别,得到多维特征信息,多维特征信息包括用户特征信息;基于多维特征信息,确定当前交互场景;基于当前交互场景和用户特...
  • 本发明公开了一种通信对话处理方法及装置、电子设备和程序产品,属于人工智能领域或其他相关技术领域,其中,该通信对话处理方法包括:将接收到的通信对话语音转换为文本信息,并提取通信对话语音中的语音情感和语音意图;将文本信息、通信对话语音中的语音情...
  • 本发明涉及一种智能玩具的自适应语音对话生成系统及其使用方法,属于智能玩具语音对话技术领域,包括语音采集模块、语音识别模块、用户画像模块、对话管理模块、自然语言生成模块、安全过滤模块、语音合成模块,语音采集模块采集用户语音信号,语音识别模块连...
  • 本申请公开了一种语音交互的识别方法、装置,该语音交互的识别方法包括:在设备被唤醒的情况下,获取设备在本次唤醒后首次接收到的第一交互音频数据。在获取到设备在本次唤醒后非首次接收到的第二交互音频数据的情况下,对比第一交互音频数据和第二交互音频数...
  • 本发明公开离线在线一体化语音处理的网关、系统和语音处理方法,涉及通信技术领域,以解决现有技术中家庭网关在处理用户语音时,响应速度和智能应答无法同时兼顾的问题。网关包括:多协议通信模块、主控模块和离线语音识别模块;多协议通信模块用于连接多个智...
  • 本申请涉及语音交互技术领域,尤其是涉及一种针对慢性疾病患者的语音识别增强方法及系统。该方法包括:获取阿尔茨海默症目标患者的语音信息集,基于语音信息集,分析语音信息在疾病相关语言障碍下的模糊语义与潜在意图,得到意图假设信息集;获取交互流程数据...
  • 本发明提供一种集成实体复制与向量检索的上下文自适应语音识别方法,属于人工智能技术领域。本方法:将输入语音转换为声学特征表示;将外部实体词典转换为向量表示;通过索引技术筛选出候选实体,根据注意力机制计算的匹配度确定从标准词表生成输出或是复制实...
  • 本发明公开了一种基于多模态语义理解的跨语言语音交互方法、系统及存储介质,涉及人工智能与自然语言处理技术领域。所述方法包括:获取源语言语音流并进行并行双流特征提取,通过基于统一音素空间的混合语码识别模型提取文本语义特征,同时提取包含韵律信息的...
  • 本发明实施例公开了一种信息审批方法和装置,本发明实施例在语音审批流程被启动后,利用即时通信工具的语音呼叫功能,与审批终端建立持续的语音连接,通过语音播报待审批信息或其摘要,并自动获取审批终端返回的语音信息,基于对语音信息的意图识别结果,来自...
  • 本发明公开了一种智能会议记录处理方法、系统、设备及介质,所述方法具体包括:基于初级文本和会议音频流,通过提取事件构建因果图谱,根据因果图谱对决策点进行标记,获得逻辑链分析结果;基于初级文本和会议音频流,结合声学特征与文本分析发言者的情绪波动...
  • 本公开涉及一种手术信息记录方法、装置、电子设备、介质和程序产品,涉及医疗技术领域。其中,方法包括:控制拾音模块采集手术室内的声音信号,得到音频信息;对音频信息进行语音识别,得到音频信息对应的语音类型;其中,语音类型包括语音指令;在音频信息的...
  • 本申请涉及到语音识别技术领域,公开了一种命令词的组织方法、装置、设备及介质,其中方法包括:对命令词集合聚类,后缀完全相同的归为一类,其余各自成类,生成聚类结果;基于该结果压缩存储,多命令词类别分配连续整数压缩标识,单命令词类别标记特殊标识,...
  • 本申请公开了一种多模态机器人交互唤醒方法、装置、电子设备、可读存储介质及计算机程序产品。该方法包括:在进行交互唤醒时,采集用户视频流和实时音频数据;对用户视频流进行唇动检测,得到唇动信号;对实时音频数据进行语音识别,得到语音信号;在语音信号...
  • 本发明实施例公开了一种模型训练方法、语音识别方法、设备、介质及程序产品。包括:由声学特征编码器对样本语音信息进行解耦,确定样本语音内容特征和样本语音声学样式特征;通过声学特征判别器对样本语音内容特征进行声学特征判别,确定对抗损失;通过特征融...
  • 本发明涉及到语音识别技术,公开一种语音识别模型的训练方法、装置、设备和介质,旨在提升噪声环境下的语音识别率。方法包括:先训练自动语音识别网络,得到预训练完成的网络;在其输出分类层前引入降噪模块,以预训练完成的自动语音识别网络输出的嵌入特征为...
  • 多阶段知识蒸馏与伪标签动态修正的声学事件检测模型训练及检测方法,属于声学事件检测技术领域。为了解决在声学事件样本数量非常少的声学事件检测中,基于模型的检测存在检测准确率和鲁棒性均比较差的问题。本发明在第一阶段中对教师网络进行监督学习和自监督...
  • 本申请实施例公开面向人机语音对话的语音识别自学习方法、语音识别自学习系统、电子设备和存储介质,其中,方法包括:记录人机对话日志,所述日志至少包含用户标识、输入文本、输入类型及对话任务完成状态;根据所述用户标识对所述日志分类,筛选任务完成状态...
  • 本申请公开了一种实时语音对话方法、装置、设备以及存储介质,涉及语音对话领域,包括:获取纳税用户端输入的初始音频片段,基于初始音频片段确定动态幅度阈值;若初始音频片段中的预设尾部片段的音频幅度不大于动态幅度阈值,则在初始音频片段中,确定音频幅...
  • 本申请公开了一种音频数据的脱敏方法、装置、设备及存储介质,涉及隐私计算技术领域。该方法包括基于自动语音识别引擎,对接收到的待处理音频数据进行文本转换和时间戳划分,得到至少两个待处理文本数据和待处理文本数据的时间戳数据;基于预设滑动窗口,根据...
  • 本发明涉及语音交互技术领域,具体涉及一种基于语义分析的对话式AI低延迟响应控制方法及系统。本发明首先根据CAN总线数据的变化,生成当前时窗的驾驶强度关联因子;进一步监测NLU的输出,并分析声学语调上扬特征,结合驾驶强度关联因子,获取交互抑制...
技术分类