卓宇智能科技有限公司史文中获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉卓宇智能科技有限公司申请的专利基于文本修正的主题建模增强方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116842119B 。
龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310806674.X,技术领域涉及:G06F16/29;该发明授权基于文本修正的主题建模增强方法及装置是由史文中;沈枭麒设计研发完成,并于2023-07-03向国家知识产权局提交的专利申请。
本基于文本修正的主题建模增强方法及装置在说明书摘要公布了:本发明公开了基于文本修正的主题建模增强方法及装置,包括:提取词的时间分布特征,根据所述时间分布特征度量词之间的相似性,计算词的时间表达能力指数,得到时间特殊词汇集合;提取词的空间分布特征,根据所述空间分布特征度量词的空间分布差异,并生成词距离矩阵,基于所述词距离矩阵进行词汇聚类,得到空间特殊词汇集合;融合兴趣点数据,根据所述兴趣点数据提取词的语义分布特征,并计算词的语义表达能力指数,得到语义特殊词汇集合;基于所述时间特殊词汇集合、所述空间特殊词汇集合以及所述语义特殊词汇集合修改文本内容,得到增强后的主题模型;本发明可以提取时空语义特殊词汇并计算表达能力指数,进一步修正文本,以增强主题建模。
本发明授权基于文本修正的主题建模增强方法及装置在权利要求书中公布了:1.基于文本修正的主题建模增强方法,其特征在于,包括: 提取词的时间分布特征,根据所述时间分布特征度量词之间的相似性,计算词的时间表达能力指数,得到时间特殊词汇集合; 提取词的空间分布特征,根据所述空间分布特征度量词的空间分布差异,并生成词距离矩阵,基于所述词距离矩阵进行词汇聚类,得到空间特殊词汇集合; 融合兴趣点数据,根据所述兴趣点数据提取词的语义分布特征,并计算词的语义表达能力指数,得到语义特殊词汇集合; 基于所述时间特殊词汇集合、所述空间特殊词汇集合以及所述语义特殊词汇集合修改文本内容,得到增强后的主题模型; 所述基于所述时间特殊词汇集合、所述空间特殊词汇集合以及所述语义特殊词汇集合修改文本内容,得到增强后的主题模型,包括: 对所述时间特殊词汇集合、所述空间特殊词汇集合以及所述语义特殊词汇集合进行标记,将原始文本集合中每个文本里所有不在标记中的词进行过滤,得到基于过滤的文本集合; 根据所述时间特殊词汇集合、所述空间特殊词汇集合以及所述语义特殊词汇集合的类别对文本词汇进行标注,得到基于词的时空语义特性的文本集合; 基于原始文本生成时空语义分布向量,并将向量中元素名称作为新词集合,并根据所述新词集合的集合元素值生成文本集合; 基于分布中元素值对所述新词集合中不同的词进行多次复制,得到新文本集合; 将包含所述新文本集合的多种修正文本应用于主题模型,得到增强后的主题模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人卓宇智能科技有限公司,其通讯地址为:中国香港九龙观塘成业街6号泓富广场11楼6室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励