Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 电子科技大学长三角研究院(湖州)瑞嘉获国家专利权

电子科技大学长三角研究院(湖州)瑞嘉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉电子科技大学长三角研究院(湖州)申请的专利一种构建支持短文本流在线聚类的上下文增强狄利克雷模型的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115827861B

龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211504585.1,技术领域涉及:G06F16/353;该发明授权一种构建支持短文本流在线聚类的上下文增强狄利克雷模型的方法是由瑞嘉;杰库码;任晓龙;邵俊明;李想设计研发完成,并于2022-11-29向国家知识产权局提交的专利申请。

一种构建支持短文本流在线聚类的上下文增强狄利克雷模型的方法在说明书摘要公布了:本发明提供了一种支持短文本流在线聚类的上下文增强狄利克雷模型,其特征在于:包括以下步骤:步骤1,根据计算的概率,选择将到达的文档添加到模型的活动集群中,或者创建一个新的集群进行添加;步骤2,当模型中已有集群的文档到达的概率小于伪概率时,则将文档视为新主题的出现,从而创建新的集群;步骤3,随着文档的到来,模型对旧的集群即过时的主题进行检查并删除,从而使得当前分布的近期主题集群在模型中处于活跃状态,为了推断模型中的活跃簇数,在每个ρ时间单位间隔后重新采样来自最近ψ文档的随机文档数η。本发明具有模型效率高,稳健性强的优点。

本发明授权一种构建支持短文本流在线聚类的上下文增强狄利克雷模型的方法在权利要求书中公布了:1.一种构建支持短文本流在线聚类的上下文增强狄利克雷模型的方法,其特征在于:包括以下步骤: 步骤1,根据计算的概率,选择将到达的文档添加到模型的活动集群中,或者创建一个新的集群进行添加; 步骤2,当模型中已有集群的文档到达的概率小于伪概率时,则将文档视为新主题的出现,从而创建新的集群; 步骤3,随着文档的到来,模型对旧的集群即过时的主题进行检查并删除,从而使得当前分布的近期主题集群在模型中处于活跃状态,为了推断模型中的活跃簇数,在每个ρ时间单位间隔后重新采样来自最近ψ文档的随机文档数η; 最初在模型中,没有集群,因此创建了一个新的空集群并将第一个到达的文档添加到其中,下一个到达的文档应该被添加到模型的现有活动集群z,z∈M,或者将导致新集群的创建; 初始化时,文本流的第一个文档创建一个新的集群,为了随着时间的推移自动识别到达文档中的新主题,通过变换公式pzd|Gz=pGz.pd|Gz,概率pznew|d导出如下, 其中,为文档d中w的词频矩阵,Nd为文档d中的总字数,αD代表文档的伪群体,Vz是活动集群的平均词汇量β的值有助于计算与新聚类的伪词相似度;等式给出了创建新集群的条件; 引入了基于窗口的术语共现矩阵,其中每个术语只能与具有距离的邻近数据配对,同时保持句子顺序; 为了保持概念的当前分布,模型需要保持活跃的集群并移除过时的集群,每个集群随时间的衰减权重更新为 其中,tc表示模型的当前时间戳,并存储集群的最后更新时间戳uz,每个新集群的衰减权重设置为1,如果lz近似为零,则处理集群以从模型中删除,即该集群无法捕获文本流中主题的当前词条分布。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人电子科技大学长三角研究院(湖州),其通讯地址为:313000 浙江省湖州市西塞山路819号南太湖科技创新综合体B2幢8层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。