西北工业大学丛扬帆获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西北工业大学申请的专利一种小样本评论数据驱动的产品关键用户需求挖掘方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115713349B 。
龙图腾网通过国家知识产权局官网在2026-01-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211441246.3,技术领域涉及:G06Q30/0201;该发明授权一种小样本评论数据驱动的产品关键用户需求挖掘方法是由丛扬帆;初建杰;余隋怀;苏兆婧设计研发完成,并于2022-11-17向国家知识产权局提交的专利申请。
本一种小样本评论数据驱动的产品关键用户需求挖掘方法在说明书摘要公布了:本发明公开了一种小样本评论数据驱动的产品关键用户需求挖掘方法,首先使用爬虫工具从电商网站中获取产品的用户评论,建立初始用户评论数据集;然后对初始用户评论数据集做预处理,得到产品用户评论数据集;接下来基于ERNIE模型进行用户评论主题聚类,得到若干主题用户评论数据集;再对主题用户评论数据集进行二次处理;最后基于ISIFRankImprovedSIFRank模型进行关键产品信息短语提取,建立关键用户需求集。本发明的最终结果以关键用户需求集的方式呈现,产品设计与决策的相关人员均可从中获取支持自身工作的参考信息。
本发明授权一种小样本评论数据驱动的产品关键用户需求挖掘方法在权利要求书中公布了:1.一种小样本评论数据驱动的产品关键用户需求挖掘方法,其特征在于,包括如下步骤: 步骤1:使用爬虫工具从电商网站中获取产品的用户评论,建立初始用户评论数据集; 步骤2:对初始用户评论数据集做预处理,得到用于用户评论主题聚类的产品用户评论数据集; 步骤2-1:剔除默认评价和重复评价; 步骤2-2:去除用户评论中无效的字符、空白和乱码,完成用户文本数据的清洗; 步骤2-3:识别评论中的拼写错误、词法错误、句法错误和语义错误,完成纠错; 步骤2-4:将同一实体的不同描述方式进行合并,统一使用相同实体名称; 步骤3:基于ERNIE模型进行用户评论主题聚类,得到若干主题用户评论数据集,包括: 步骤3-1:构造用户评论文本的输入向量,将用户评论文本转换为向量,送入到ERNIE模型中进行训练和学习; 用户评论文本的输入向量,包括:词嵌入、段嵌入和位置嵌入三部分融合生成用户评论文本的输入向量; 步骤3-2:基于用户在线评论编码和用户评论知识整合训练用户评论文本的输入向量,获取用户评论的词向量表征; 步骤3-3:连接Softmax层,用于支持用户评论的主题聚类任务; 步骤4:对主题用户评论数据集进行二次处理; 步骤4-1:使用THULAC工具将主题用户评论数据集的用户评论文本进行分词处理; 步骤4-2:使用NLTK工具对分词进行词性标注; 步骤4-3:根据中文用词习惯和词性匹配原则,设定8种反映用户需求的词法规则,采用正则表达式聚合得到产品信息短语,构成产品信息短语集合;PIP1~PIPm分别表示第1至第m个产品信息短语; 其中,所述设定8种反映用户需求的词法规则,包括:围绕形容词和动词设计词法规则各4种: 其中,JJ为形容词,NN为名词,RB为副词,VB为动词,DT为限定词,符号表示以NLTK工具词性标注符号为基准; 步骤5:基于ISIFRank模型进行关键产品信息短语提取,建立关键用户需求集,包括: 步骤5-1:使用ERNIE替换SIFRank模型中的ELMo,对其进行改进,基于ERNIE得到主题用户评论的词向量表征; 步骤5-2:基于SIF算法得到产品信息短语和主题用户评论的句向量表征; SIF算法对每个词向量加权平均得到句向量,每个词向量的权重大小具体公式为: 7 其中为常数,为词频; 得到的评论文本句向量表示为: 8 同理,计算得到产品信息短语的句向量; 步骤5-3:基于Rank算法进行关键产品信息短语提取; 对于给定的主题产品用户评论,产品信息短语的排序取决于主题用户评论句向量和产品信息短语的句向量之间的余弦相似度: 9 10 设立阈值,将余弦相似度大于的产品信息短语提取,作为最终的关键产品信息短语; 步骤5-4:结合专家知识和具体产品的领域知识,将分散的关键产品信息短语进行串联,转化为基于自然语言描述的完整关键用户需求表述,建立完整的关键用户需求集; 每一个主题的用户评论均建立一个关键用户需求子集,由关键用户需求短语、归一化权重和自然语言描述三个要素构成,即; 关键用户需求集由所有的关键用户需求子集构成,即。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西北工业大学,其通讯地址为:710072 陕西省西安市友谊西路;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励