Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于声纹识别与行为分析的信贷身份验证增强技术,包括数据采集模块、数据预处理模块、特征提取模块、身份验证模型模块、反馈与更新模块和系统管理模块。数据采集模块利用麦克风阵列采集语音数据,通过触摸屏传感器、加速度传感器等采集用户行...
  • 本发明公开了一种恶意语音检测方法及装置。其中,方法包括:获取待检测语音数据集;对语音数据集中每个语音数据进行特征维度提取,确定每个语音数据的维度特征集;从每个语音数据的维度特征集中选取出预先训练选取的最优维度特征组合,确定每个语音数据的检测...
  • 一种自动语者注册方法与系统,在方法中,以摄影机拍摄影像,产生影像数据,从中辨识人的脸部位置,以麦克风阵列进行收音,产生语音数据,运用声音定位技术估测声源方向,之后根据人的脸部位置与声源方向匹配出目标语者,特别是确认是否是在有效几何范围内的目...
  • 一种语音处理方法,包括:获取语音数据,语音数据包括至少一个说话人的语音,语音数据通过至少一个语音通道拾取得到;对语音数据进行编码,得到基础语音特征;确定至少一个说话人中每个说话人的说话人特征;根据每个说话人的说话人特征和基础语音特征,得到每...
  • 本发明公开了一种基于语音输入的智能应答互动方法及装置,本公开涉及人工智能技术领域。本公开主要的技术方案为:该方法适用于通过智能设备实现的智能互动系统,在预先向服务端配置的业务内容相对应的“目标业务场景”下,客户端采集声音数据,服务端从中确定...
  • 本发明涉及语音信号处理技术领域,具体涉及一种实时对话双向语音转写和翻译方法及装置,所述方法包括:响应于用户输入的第一语言的第一语音信号,将第一语音信号传输至预设语音识别模型以输出得到第一语言文本信息;将第一语言文本信息输入至预设文本翻译模型...
  • 本发明为一种基于准实时语音转写和说话人识别分类的会议记录智能化管理方法及系统。会议前采集说话人语音样本,经信噪比校验后提取声纹嵌入向量,结合姓名、照片等构建注册特征库;会议中采用非流式语音识别模型分段转写并合并文本,通过滑动窗口动态计算语音...
  • 一种基于人工智能的声音环境分析及监测方法,属于人工智能领域,包括:声音信号采集与预处理;声音特征提取与参数分析;声音转文本;利用具备声音事件分析的多模态大语言模型将声音事件转换为文本描述形式并输出文本信息;对输出的文本信息加上时间戳,分类整...
  • 本公开涉及一种智能座舱语音交互方法、系统、电子设备、存储介质及车辆,其中,该方法包括:通过KWS检测到语音输入,触发ASR将语音输入转换为文本信息;从本地RAG知识库中获取与文本信息相关的知识信息,其中,知识信息包括:与文本信息相关的背景信...
  • 本发明公开了一种基于检索增强生成的语音识别方法、设备及介质,属于语音识别技术领域,用于解决现有语音识别系统在噪声环境下关键词识别准确率低,且对特定领域下的术语识别能力不足的技术问题。方法包括:将预处理后的音频信号进行有关语音编码器的核心特征...
  • 本发明公开了一种用户语音服务评价信息生成方法、装置、设备、介质及产品。可应用于金融科技领域,该方法包括:在监测到与目标用户的语音通话服务结束后,向目标用户发送服务评价请求,以供目标用户基于服务评价请求,生成并反馈服务评价响应结果;生成各服务...
  • 本公开提供的一种语音检查方法,包括:获取待检查语音文件及其对应的台词文本;基于台词文本作为先验知识输入语音识别模型,执行语音文件的转录以获得转录文本;检测转录文本是否包含幻觉内容;当检测到幻觉内容时,调整语音识别模型的参数并重新执行转录。这...
  • 广播电视历史节目语音转译系统,涉及人工智能技术领域,解决现有大模型因价格昂贵,成本偏高而难于广泛应用的问题。通过在计算机上回放节目历史录制文件,利用一种接口电路把音频信号送给人工智能系统转译为文字,再通过接口电路回送到计算机保存。系统支持一...
  • 本公开涉及用于生成音乐的方法、装置、设备、车辆和产品。该方法包括基于车辆的座舱内的人声内容,生成与人声内容对应的歌词文本内容。该方法还包括基于车辆的车身音频数据、车外音频数据中的至少一项音频数据对应的音频特征以及歌词文本内容,生成音乐。通过...
  • 本发明公开了一种去唤醒词的本地语音控制方法、系统、电视机及存储介质,所述方法包括:持续采集环境语音信号,将目标环境语音信号输入到自动语音识别模型进行语音识别,输出文本;将文本输入到意图置信度检测模块进行语义分类,输出语义检测结果的置信度,若...
  • 本发明提供一种语音数据响应方法、装置、电子设备和存储介质,属于智能交互技术领域,包括:获取与待响应的第一语音数据对应的第一文本数据和第一情感信息;采用语音识别模块对第一语音数据进行处理,得到第一文本数据;采用语音情感编码器对第一语音数据进行...
  • 本发明提出了基于智能语音的沙发控制方法及系统。属于智能家居及人机交互技术领域。所述方法包括:对智能沙发进行多模态传感器部署,生成综合感知网络,根据综合感知网络采集用户原始交互数据,对原始交互数据进行预处理,生成多模态融合感知数据;基于多模态...
  • 本发明公开了一种面向多端的语音控制方法、装置、设备及介质。其中,该方法包括:获取当前车辆内目标用户的音频数据以及多个客户端设备的多个视觉元素数据;其中,所述多个客户端设备与所述车辆通过设定通信协议进行通信连接;对所述音频数据进行语义识别,得...
  • 本申请实施例提供一种车辆的语音指令中断的处理方法、装置、设备、介质及车辆,涉及车辆技术领域。该方法包括:在检测到用户语音流被系统事件中断时,获取已采集的部分语音数据。然后根据预先获取的候选数据库,对该部分语音数据中的缺失槽位进行补全,得到第...
  • 本发明涉及语音交互技术领域,具体涉及基于向量语音智能体的两轮电动车实时交互系统。该系统包括:采集两轮电动车周边的声源信号,基于声源信号建立交互声源定位阵列模型,并基于交互声源定位阵列模型确定声源信号与两轮电动车的位置距离,基于位置距离判定该...
技术分类