上海墨百意信息科技有限公司林雨琦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海墨百意信息科技有限公司申请的专利文本处理方法、装置、电子设备和可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115759059B 。
龙图腾网通过国家知识产权局官网在2026-04-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211572918.4,技术领域涉及:G06F40/253;该发明授权文本处理方法、装置、电子设备和可读存储介质是由林雨琦;李媛媛设计研发完成,并于2022-12-08向国家知识产权局提交的专利申请。
本文本处理方法、装置、电子设备和可读存储介质在说明书摘要公布了:本申请实施例提供了一种文本处理方法、装置、电子设备和可读存储介质,涉及计算机技术领域。在本申请实施例中,本申请实施例会先通过根据第一预定比例的原始样本进行训练得到的目标模型筛选出目标样本,再通过目标样本训练语法检测模型。因此,本申请实施例可以先准确筛选出特定类型的目标样本,在根据特定类型的目标样本构建目标训练集,从而更有效地训练语法检测模型。因此,通过本申请实施例,通过基于目标训练集训练后的语法检测模型,可以使得语法检测模型能够更准确地进行语法检测,从而提高语法错误检测的准确度。
本发明授权文本处理方法、装置、电子设备和可读存储介质在权利要求书中公布了:1.一种文本处理方法,其特征在于,所述方法包括: 获取目标文本;以及 将所述目标文本输入预先训练的语法检测模型,以确定所述目标文本对应的语法检测结果,其中,所述语法检测模型基于目标训练集训练得到,所述目标训练集中至少包括目标样本,所述目标样本由目标模型筛选得到,所述目标模型根据第一预定比例的原始样本进行训练得到,所述第一预定比例用于表征具有语病的样本和没有语病的样本二者之间的比例关系; 获取预训练模型和原始样本,所述原始样本中包括第一预定比例的正样本和第一负样本,所述正样本用于表征没有语病的样本,所述第一负样本用于表征具有语病的样本,所述第一负样本的比例大于所述正样本的比例;以及 根据所述原始样本对所述预训练模型进行训练,确定所述目标模型; 获取待筛选数据集; 将所述待筛选数据集中的文本输入所述目标模型,以确定所述目标模型输出的识别结果,其中,所述识别结果包括没有语病的文本和具有语病的文本;以及 将所述识别结果中没有语病的文本确定为目标样本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海墨百意信息科技有限公司,其通讯地址为:200232 上海市徐汇区丰谷路315弄24号2层2015室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励