恭喜四川农业大学陈子墺获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜四川农业大学申请的专利一种多模态数据驱动的社会工作领域建模优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119939482B 。
龙图腾网通过国家知识产权局官网在2025-06-20发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510424096.2,技术领域涉及:G06F18/2433;该发明授权一种多模态数据驱动的社会工作领域建模优化方法是由陈子墺;冯义强;王苓;张雨昕;黄文湲;覃涵;刘梦可设计研发完成,并于2025-04-07向国家知识产权局提交的专利申请。
本一种多模态数据驱动的社会工作领域建模优化方法在说明书摘要公布了:本发明涉及一种多模态数据驱动的社会工作领域建模优化方法,属于数据处理领域,优化方法包括:构建社会工作多模态数据,并进行数据预处理后将文本转换为嵌入向量;采用流行度偏差正则化处理器通处理社会工作领域的数据输入;动态选择降维维度,并采用UMAP算法将BERT嵌入空间中的向量降维;将文档聚类到相似的嵌入组中,通过计算数据点之间的密度关系形成层次化的聚类结构,并通过密度阈值划分最终的簇;计算每个词在主题集群中的词频和该词在整个语料库中的逆文档频率,并计算语义相似度来重新分配离群点。本发明优化BERTopic模型的多模态兼容性,支持从不同数据来源提取并融合主题信息,增强社会议题的分析深度。
本发明授权一种多模态数据驱动的社会工作领域建模优化方法在权利要求书中公布了:1.一种多模态数据驱动的社会工作领域建模优化方法,其特征在于:所述优化方法包括:S1、构建一个包含文本、音频、图像视频数据的社会工作多模态数据,并进行数据预处理后进行文本嵌入将文本转换为嵌入向量;S2、采用流行度偏差正则化处理器通过高频通用词衰减加权和社会学术语增强双重优化策略处理社会工作领域的数据输入;S3、通过动态文档嵌入优化器动态选择降维维度来优化主题建模的效果,并采用UMAP算法将BERT嵌入空间中的向量降维;S4、使用HDBSCAN算法将文档聚类到相似的嵌入组中以便从中提取主题,通过计算数据点之间的密度关系形成层次化的聚类结构,并通过密度阈值划分最终的簇;S5、通过c-TF-IDF通过计算每个词在主题集群中的词频和该词在整个语料库中的逆文档频率来衡量词汇的重要性,并通过概率重分配矩阵方法计算语义相似度来重新分配离群点,以确保数据的最大化利用;所述通过概率重分配矩阵方法计算语义相似度来重新分配离群点包括:构建文档-主题概率矩阵:概率重分配矩阵为每个文档计算其属于各个主题的概率分布,每个文档的概率分布表示该文档属于每个主题的概率;对于每个文档,所有主题的概率总和为1,即,其中,M为主题的总数,表示每个文档在所有主题中的分布情况;计算每个文档对各主题的概率:对于被标记为离群点的文档,概率重分配矩阵计算每个文档与各个主题之间的相似性,并将其概率性地重新分配给最接近的主题,概率重分配矩阵使用一个距离度量函数来衡量文档和主题之间的相似度,设文档和主题之间的相似度通过来表示,PRM使用以下公式计算文档属于主题的概率为,进而得到文档属于各个主题的概率,其中,是当前文档与某个特定主题的距离,是当前文档与所有主题的距离,用于衡量文档与各个主题的匹配程度,距离越小,表示越相关,最终用于通过Softmax转换为概率;更新离群点的主题分配:一旦每个文档的主题概率分布计算出来,概率重分配矩阵根据每个文档对各个主题的概率分布决定该文档是否应该重新分配到某个主题中,尤其是那些被HDBSCAN标记为离群点的文档,如果某个文档在某个主题上的概率高,且超过设定的阈值,则该文档被重新分配到最接近的主题簇。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川农业大学,其通讯地址为:625000 四川省雅安市雨城区新康路46号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。