Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于框架知识探测的预训练语言模型事后解释方法及系统,具体属于人工智能和自然语言处理领域。包括基于框架的语义解析模块、基于框架的知识图谱构建模块和可解释性知识探测模块。本发明是基于框架语义语言学认知机理的事后解释机制,其核心是...
  • 本发明公开了一种数据识别方法、装置、电子设备及存储介质。该方法包括:确定第一语句;将所述第一语句输入到预先构建的实体关系抽取模型中,得到至少一个三元组;根据各个三元组,进行目标信息识别,确定所述第一语句是否属于目标语句。第一个独权的有益效果...
  • 本申请提供了一种多模态文本分块方法以及电子设备,涉及数据处理技术领域,其中,该方法包括:获取多模态数据文档,并根据多模态数据文档生成原始文档文本;根据原始文档文本中的文档结构标记,得到多个物理段落以及多个初始簇类中心;根据每个物理段落与多个...
  • 本申请涉及自然语言处理技术领域,公开了一种分词方法、装置、设备及存储介质。其中,方法包括:针对文本中任一句子,对句子进行切分,得到句子对应的多个分词结果;针对多个分词结果中任一分词结果,根据分词结果中的任一分词的词向量、基于词向量转换的频域...
  • 本发明提供一种英语文本立场标注方法及系统,属于信息技术与自然语言处理的交叉领域,包括:词性预处理:为英语文本的每个词生成词性标签;规则构建:在所述词性标签的基础上制定立场词汇标注规则,编写代码得到基于规则的立场词汇标注器;数据集标注:依据所...
  • 本申请公开了一种网页错词检测方法、装置、设备及存储介质,该方法包括:基于目标页面的访问地址或页面属性信息,确定所述目标页面的页面类型,并基于所述页面类型以及预选训练完成的错误预判模型,确定所述目标页面的目标网页错误类型;基于所述目标网页错误...
  • 本发明涉及大数据管理技术领域,具体涉及一种产业数字化运营信息大数据管理系统。该系统包括:数据采集模块,用于获取产业数字化运营信息的各个文本并对其进行分句分词处理;分词处理模块,用于通过计算词汇的歧义度与语义关联度来校正分词并识别关键实体;利...
  • 本发明提供一种待办事项的生成方法、装置、电子设备及计算机存储介质,能够对用户输入的长文本中的时间信息进行提取,得到时间提取结果,并识别得到长文本的场景类型,然后,基于长文本和场景类型,生成任务标题,最终,基于所述任务标题和所述时间提取结果,...
  • 本发明公开了一种基于大语言模型的电子书目录识别重构方法、系统及存储介质,属于目录识别的技术领域,基于原始PDF电子书,进行PDF文档多模态解析,筛选得到候选标题项,对每个候选标题项构建多模态特征向量,构建候选标题序列;针对候选标题序列中每个...
  • 本申请涉及数据处理技术领域,具体涉及基于自然语言处理的外事表格智能填表纠错方法及系统。该方法包括:获取历史语料库和词汇的文本图像;筛选待纠错分词;基于输入词汇的频次占比和词汇种类确定模块的模糊度;基于待纠错分词相邻词汇与相似分词的共现概率以...
  • 本发明公开了一种面向招投标场景的跨文档语义一致性校验系统及方法,涉及数据处理技术领域,包括:采集招投标文档数据并进行预处理;分析招投标文档数据中语义单元的关键程度构建术语关键指数;基于术语关键指数分析招投标文档的关键语义单元的风险程度并构建...
  • 本发明提供一种基于AI智能体的产业情报数据处理方法及设备,方法包括,获取产业情报数据;根据产业情报数据生成文本嵌入向量及位置编码向量;将文本嵌入向量和位置编码向量拼接,得到语义增强嵌入向量;利用时态卷积网络处理所述语义增强嵌入向量,捕捉局部...
  • 本发明公开了一种基于语篇图结构的作文问题句因果链推断方法,涉及自然语言处理、语篇分析与自动化作文诊断技术。该方法将作文建模为由句子节点和语义—篇章关系边构成的语篇图结构,通过构建句级问题得分、错误影响力矩阵以及传播路径模型,实现对作文问题句...
  • 本发明涉及计算机技术领域,公开了一种异构文档智能提取方法、系统、电子设备及存储介质,包括获取待处理的异构结构化文档进行解析处理,提取文档中所有数据节点的路径表达式;将路径表达式分批次输入至预先训练好的字段分类模型;基于字段分类模型对每个路径...
  • 本发明公开了一种异构资源交互信息与公共对象模型的智能匹配方法及系统,包括以下步骤:S1.对基于GBB的异构资源交互信息,通过结构体解析、路径生成和路径信息保存进行异构资源解析,将信息中隐含的类型约束与层级关联转化为结构化符号序列,输出标准化...
  • 本公开公开了数据的解析方法及装置、电子设备和存储介质,涉及数据处理技术领域,能整合多源异构文档为多模态数据,标注溯源术语并构建条款逻辑依赖图,可避免解析碎片化,识别逻辑冲突并及时合规校验,因此能解决现有方法解析碎片化、冲突未识别、合规校验滞...
  • 本发明提供基于多模态预训练模型的PDF标题与图表联合解析方法,包括:根据最大词元数分割文档,并根据集成分层提示策略和标题上下文传递机制,识别各文本块的标题层级;基于版面分析工具和多模态大语言模型,生成每页表格的三元组标签,根据三元组标签和延...
  • 本发明涉及自然语言处理和中医药技术领域,特别是涉及一种基于多任务学习和指令微调的中医药术语标准化算法,该算法先构建含目标领域语料和标准术语关联语料的训练数据集,选取经大规模通用文本预训练的深度学习模型,并通过领域自适应预训练得到至少两种领域...
  • 本发明涉及一种剧本质量评估方法、装置、设备和存储介质。剧本质量评估方法,包括:获取剧本文本,并确定剧本文本包括的多个目标角色;在剧本文本中确定记载多个目标角色的至少一个互动情节文本;通过预先训练好的情感分析模型,基于至少一个互动情节文本分析...
  • 本申请公开了一种模板化文档管理方法及装置。其中,该方法包括:确定文档库内多个第一模板化文档中与待入库的第二模板化文档的相似度最高的第三模板化文档,并确定第二模板化文档的第一复杂度和第三模板化文档的第二复杂度;依据第一复杂度和第二复杂度将第二...
技术分类