Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 上海小零网络科技有限公司陈颖辉获国家专利权

上海小零网络科技有限公司陈颖辉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉上海小零网络科技有限公司申请的专利一种集成预训练NLP模型的文本数据自动化标注方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120407775B

龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510896609.X,技术领域涉及:G06F16/334;该发明授权一种集成预训练NLP模型的文本数据自动化标注方法及系统是由陈颖辉;周开龙设计研发完成,并于2025-07-01向国家知识产权局提交的专利申请。

一种集成预训练NLP模型的文本数据自动化标注方法及系统在说明书摘要公布了:本发明提供一种集成预训练NLP模型的文本数据自动化标注方法及系统,涉及人工智能技术领域,所述方法包括:获取待标注的原始文本数据,所述文本数据包括客户咨询、投诉或反馈的对话记录、评价及工单;对原始文本数据进行分词、停用词过滤及词性标注处理,生成结构化文本数据;将结构化文本数据输入预训练NLP模型,通过领域适配层对模型输出的语义特征进行修正,以得到修正后的语义特征;对修正后语义特征进行少样本学习,通过对比学习机制强化对低频文本模式的识别能力,生成抗长尾干扰的增强特征向量。本发明通过自动化处理数据获取与预处理,集成预训练NLP模型实现文本数据自动化标注。

本发明授权一种集成预训练NLP模型的文本数据自动化标注方法及系统在权利要求书中公布了:1.一种集成预训练NLP模型的文本数据自动化标注方法,其特征在于,所述方法包括: 步骤S1:获取待标注的原始文本数据,所述文本数据包括客户咨询、投诉或反馈的对话记录、评价及工单; 步骤S2:对原始文本数据进行分词、停用词过滤及词性标注处理,生成结构化文本数据; 对原始文本数据进行分词、停用词过滤及词性标注处理,生成结构化文本数据,包括: 扫描原始文本数据的每个字符编码并进行处理,以生成净化文本; 根据净化文本,计算每个字符在当前位置作为词语起始、中间或结束位置的概率分布,结合条件随机场状态转移分数,动态规划生成全局最大概率切分路径,输出词语边界明确的基础分词序列; 根据哈希表存储的停用词词典,遍历基础分词序列的每个词语,若词语命中停用词哈希表且未被命名实体识别模块标记为受保护实体,则移除该词语;若词语属于实体保护列表,则保留至新序列;生成携带核心语义单元的过滤后词序列; 对过滤后词序列中的每个目标词语,提取其前后各2个词语的上下文窗口,组合为特征模板;查询预训练词性概率矩阵,计算目标词语在其上下文环境中属于各词性类别的联合概率;基于动态规划构建词性状态转移网格,迭代计算从序列首词至末词的所有词性标注路径累积概率,选取最大概率路径作为最终词性序列;将每个词语与其最优词性标签组合为二元组,生成带语法标记的结构化文本数据; 步骤S3:将结构化文本数据输入预训练NLP模型,通过领域适配层对模型输出的语义特征进行修正,以得到修正后的语义特征; 步骤S4:对修正后语义特征进行少样本学习,通过对比学习机制强化对低频文本模式的识别能力,生成抗长尾干扰的增强特征向量; 步骤S5:基于增强特征向量,同步执行多维度标签提取操作,输出包含以下四类标签的标签集合:需求类型标签、情感倾向标签、产品或服务实体标签、问题关键词标签; 步骤S6:对标签集合中的每个标签,通过注意力机制定位其在增强特征向量中的关键决策词,生成标签判定依据的自然语言描述,形成带解释性文本的增强标签集合; 步骤S7:基于增强标签集合中的低频标签分布及领域术语新增频率,触发预训练NLP模型的增量训练。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海小零网络科技有限公司,其通讯地址为:200120 上海市浦东新区中国(上海)自由贸易试验区临港新片区海基六路218弄12号2楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。