哈尔滨工业大学周学权获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学申请的专利基于相似性的医康养服务需求分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116933164B 。
龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310918638.2,技术领域涉及:G06F18/2411;该发明授权基于相似性的医康养服务需求分类方法是由周学权;徐晓飞;赵誉茹;涂志莹;初佃辉;姚若岚;孟凡超;张华;李春山设计研发完成,并于2023-07-25向国家知识产权局提交的专利申请。
本基于相似性的医康养服务需求分类方法在说明书摘要公布了:本发明公开了一种基于相似性的医康养服务需求分类方法,所述方法包括如下步骤:步骤一、数据预处理;步骤二、训练全局语义向量;步骤三、训练词向量;步骤四、计算功能语义权重FunSemWeight;步骤五、关键词提取;步骤六、训练主题语义向量;步骤七、计算相似性并选择核函数;步骤八、构建支持向量机分类器。本发明在进行相似性计算时,通过更加准确的语义向量表示来提升对用户需求的理解,在全局语义向量的基础上结合主题语义向量,补充主题信息有利于提升对特定领域的识别能力,有利于提高相似性计算的准确性进而更准确的分类。
本发明授权基于相似性的医康养服务需求分类方法在权利要求书中公布了:1.一种基于相似性的医康养服务需求分类方法,其特征在于所述方法包括如下步骤: 步骤一、数据预处理: 对老年用户服务平台的需求数据进行清洗、过滤操作; 步骤二、训练全局语义向量: 数据文档d中的描述文本集合为{t1,t2,…,ti,…,tN},共有N个样本,ti表示第i个样本,对每个样本转化为词嵌入形式作为模型输入,利用Bert模型对全局语义特征进行提取得到全局语义向量,全局语义向量集合为{veca,1,veca,2,…,veca,i,…,veca,N},veca,i对应第i个样本ti的语义向量,共有N个向量; 步骤三、训练词向量: 将数据文档d中的描述文本ti作为样本,对样本依次进行分词、去停用词、词性标注、词向量训练处理后计算每个词语的功能语义权重值; 步骤四、计算功能语义权重FunSemWeight: 将数据文档d中的一个描述文本ti作为样本,在计算功能语义权重时考虑了语境权重、词性权重和词频权重; 步骤五、关键词提取: 对描述文本ti中的所有词语按照功能语义权重值大小顺序排序,选择权值最大的k个词语作为该文本的关键词; 步骤六、训练主题语义向量: 由步骤五得到数据文档d中所有文本的关键词,利用GSDMM主题模型对描述文本ti的关键词进行主题语义概括,得到文本对应的主题语义向量vecb,i,主题语义向量集合为{vecb,1,vecb,2,…,vecb,i,…,vecb,N},共有N个向量; 步骤七、计算相似性并选择核函数: 将步骤二得到的全局语义向量集合{veca,1,veca,2,…,veca,N}和步骤六得到的主题语义向量集合{vecb,1,vecb,2,…,vecb,N}进行对应向量拼接,得到综合语义向量集合{veca,1:vecb,1,veca,2:vecb,2,……,veca,N:vecb,N},一个向量对应样本空间中一个点,相接近的点代表着语义的相似性,相似性通过两个样本之间的欧氏距离进行度量;在支持向量机中使用径向基核函数来进行特征选择构建样本以解决非线性分类问题; 步骤八、构建支持向量机分类器: 以径向基函数为核函数,对样本在特征空间中进行非线性映射,多次训练对模型参数进行调整,得到最优的支持向量机来对用户服务需求进行分类。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励