Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于语音控制虚拟场景物体的方法,涉及虚拟仿真、语音识别和人工智能技术领域。该方法包括获取用户语音信号并进行降噪、特征提取和音量标准化处理;计算语音信号的能量并转换为分贝值,确定语音的有效识别范围;利用深度学习模型对语音指令进...
  • 本申请公开了一种拒识策略的确定方法及装置、存储介质及电子装置,涉及智慧家庭技术领域,该拒识策略的确定方法包括:通过特征提取网络提取获取到的语音信息的第一音频特征值和第一文本特征值;通过预置的自适应门控网络确定所述第一音频特征值和所述第一文本...
  • 本申请公开了一种基于大语言模型的天气问答方法、装置、设备及介质,涉及智能家居/智慧家庭技术领域,包括:获取用户端发送的语音指令,所述语音指令用于指示用户与天气相关的信息查询请求;确定所述语音指令对应的类型,所述类型为天气信息查询请求或基于天...
  • 本发明公开了一种车机语音交互控制方法、装置、设备及存储介质。该方法包括:在车机语音助手接收唤醒指令后进入持续监听状态的情况下,获取车内语音信号,通过自然语言处理系统对车内语音信号进行可执行指令解析;在车内语音信号为可执行指令的情况下,对车内...
  • 本发明提供一种基于拟人拟音表达的边缘语音社交系统,旨在实现无需屏幕界面、非账号化操作、具备情绪价值传递能力的异步语音社交方式。该系统通过模块化架构设计,包含语音采集模块、边缘语音识别模块、语义理解模块、角色调度与表达控制模块、播报确认模块及...
  • 本发明公开了一种支持角色声音相互模拟与内容再表达的儿童异步语音社交方法,属于语音交互与儿童社交技术领域。该方法由具备语音采集功能的玩偶等边缘智能体采集儿童语音,经语义识别、语言生成与角色绑定,生成可由多个角色声音播报的表达内容。系统支持儿童...
  • 本申请公开了一种信息处理方法、装置、设备、介质及产品,方法包括:获取第一用户的第一语音信息;对第一语音信息进行声纹分析,得到第一用户的目标声纹;根据第一语音信息从目标声纹对应的数据库中进行信息搜索,得到第一语音信息的应答信息,数据库中预先存...
  • 本发明公开了一种基于语音的智能调度交互系统及方法,旨在解决铁路调度系统中传统快捷菜单操作繁琐、效率低下的问题。该系统通过客户端和服务端协同工作,利用语音识别、语义理解和指令生成技术,实现语音操控铁路调度系统。客户端采集用户语音,通过服务端的...
  • 本公开的实施例提供了语音交互的方法、装置、设备、存储介质和程序产品。该方法包括:在语音交互中,在向用户输出语音响应的同时获取从环境中采集到的音频信号,语音响应基于机器学习模型来生成;利用机器学习模型,基于与语音交互相关的上下文信息和在第一时...
  • 本公开提供语音交互方法、装置、计算机设备及存储介质。所述方法包括:接收用户通过语音助手输入的用户指令,其中,所述用户指令包括与场景信息关联的事件问题信息;通过所述语音助手播放与所述事件问题信息对应的答案信息,其中,所述答案信息用于描述所述场...
  • 本申请公开了一种空调设备控制方法、装置、程序产品、介质及空调设备,所述方法包括:获取目标用户的语音控制指令,并通过预先训练的语音识别模型识别所述语音控制指令对应的语音指令意图;获取针对所述目标用户训练的意图预测模型;基于所述语音指令意图,通...
  • 本发明公开了基于多Agent的智能语音分析系统,涉及语音分析技术领域,包括多模态数据采集与转换模块、语义单元智能切分模块、主体标识与关联整合模块、行业定制化分析模块、可视化决策支持模块、操作改进与算法优化模块,本发明利用大语言模型对得到商业...
  • 本申请公开了一种语音的交互方法、装置、电子设备以及计算机程序产品。涉及软件与平台技术领域,该方法包括:接收目标客户的待识别语音,提取待识别语音中的语音特征,其中,语音特征包括声学特征和韵律特征;将语音特征输入情绪分类模型,输出情绪分布结果,...
  • 一种提供与用户话语的意图匹配的颜色的方法和装置。该方法包括:为预先创建的表中的一个或多个第一颜色代码生成一个或多个第二自然语言表达,每个第二自然语言表达对应于由每个第一颜色代码表示的颜色;以及基于解释与颜色相关的用户话语的结果来生成响应。
  • 本申请提供了通信方法及通信装置,应用于通信领域。本申请的技术方案中,意图驱动管理服务生产者向意图驱动管理服务消费者指示支持的意图处理功能是否支持自然语言意图,以便于意图驱动管理服务消费者在意图驱动管理服务生产者支持自然语言意图的情况下能够通...
  • 本发明提供多路语音流实时分离与内容检索方法,包括:利用注册语音样本构建本地声纹库,通过深度声纹编码器提取并归一化目标说话人声纹特征;对混合语音信号进行帧级特征分析,计算当前语音帧与目标声纹的语义距离并生成动态置信度分数;结合置信度阈值与去抖...
  • 本发明公开一种智能语音交互方法及装置,应用于数据处理技术领域,本发明通过获取用户图像、语音、文本多模态原始数据,经特定模型与工具处理:以RetinaFace检测裁剪人脸后用ResNet‑50网络模型提取图像情绪特征,torchaudio库提...
  • 本发明实施例提供一种面向语音信息保留的匿名化隐私保护方法和系统。该方法包括:提取原始音频的说话人嵌入以及消除说话人音调、保留语义、韵律的说话人无关特征;将说话人嵌入输入至基于U‑Net架构的三阶段流匹配的说话人匿名模块,得到匿名嵌入;利用预...
  • 本公开的实施例涉及一种用于语音识别的方法、装置、设备和存储介质。在此提出的方法包括:基于目标语音的内容,从经训练的机器学习模型的第一组识别网络中确定出用于识别目标语音中的目标语音片段的第二组识别网络,其中在机器学习模型的第一组识别网络中,至...
  • 本发明公开了一种数据处理模型的训练方法、数据处理方法、视频处理方法。其中,该方法包括:获取第一训练数据;利用第一训练数据中同一模态的训练数据对初始处理模型进行对比学习,并利用第一训练数据中不同模态的训练数据对初始处理模型进行对比学习,得到目...
技术分类