语风文化科技(南通)有限公司孙亭广获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉语风文化科技(南通)有限公司申请的专利文本纠错方法、系统及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120373292B 。
龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510500555.0,技术领域涉及:G06F40/232;该发明授权文本纠错方法、系统及存储介质是由孙亭广;朱丽华设计研发完成,并于2025-04-21向国家知识产权局提交的专利申请。
本文本纠错方法、系统及存储介质在说明书摘要公布了:本发明公开了一种文本纠错方法、系统及存储介质,本发明属于文本纠错技术领域。包括以下步骤:获取已确认无误的文本数据作为训练语料,并通过人工标记添加分割标记,对样本进行词对分割,获得每个文本的词对及其词性。接着,利用这些数据训练词对分割模型,使其能够输出分割后的词对及对应词性。对待纠错文本输入模型后,评估其语义一致性指数。考虑词长度和词性,计算词对的复杂度指数,结合这两项生成错误判断系数。通过与设定的阈值比较,标记出待纠正的词对。计算待纠正词对与候选词对库中词对的词义相似度,选择相似度最高的词对进行替换实现文本纠错。此方法有效整合了词对分析与相似度计算,以提升文本的准确性和流畅性。
本发明授权文本纠错方法、系统及存储介质在权利要求书中公布了:1.一种文本纠错方法,其特征在于,具体步骤包括: 获取若干已确定无错误的语言文本数据,以获取的文本数据作为样本训练语料,采用人工标记的方法添加分割标记以对样本训练语料进行词对分割,得到样本训练语料中每个文本数据的若干词对,并为词对添加对应的词性; 建立词对分割模型,将样本训练语料内的语言文本数据作为输入数据,并以添加的分割标记和词对的词性作为标签对词对分割模型进行训练,词对分割模型的输入为语言文本数据,输出为语言文本数据分割后的若干词对及对应词性; 将待纠错的文本句子输入完成训练的词对分割模型中,通过词对分割模型输出待纠错文本句子经分割后的若干词对,计算分割后的各词对在样本训练语料中出现的联合概率,通过联合概率计算词对的语义一致性指数; 获取各词对的词长度,基于各词对的词长度和词性,计算对应词对的复杂度指数,根据得到的词对复杂度指数,结合词对的语义一致性指数,共同生成词对的错误判断系数,将词对的错误判断系数与预先设置的错误判断阈值相对比,将错误判断系数超过错误判断阈值的对应词对进行标记,记为待纠正词对; 基于被标记的待纠正词对,计算待纠正词对与候选词对库中每个词对的词义相似度,选取候选词对库中词义相似度最大的词对,将选取的词对与待纠正词对进行替换,完成文本纠错。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人语风文化科技(南通)有限公司,其通讯地址为:226000 江苏省南通市开发区中兴街道广州路42号430室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励