清华大学深圳国际研究生院;北京三快在线科技有限公司郑海涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学深圳国际研究生院;北京三快在线科技有限公司申请的专利一种用于神经网络训练的大规模POI数据处理和加载方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118796966B 。
龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411096264.1,技术领域涉及:G06F16/29;该发明授权一种用于神经网络训练的大规模POI数据处理和加载方法是由郑海涛;刘汉卿;谢睿;江勇;夏树涛;肖喜设计研发完成,并于2024-08-12向国家知识产权局提交的专利申请。
本一种用于神经网络训练的大规模POI数据处理和加载方法在说明书摘要公布了:本发明提出一种用于神经网络训练的大规模POI数据处理和加载方法,包括以下步骤:S1:定义基本参数;S2:辅助文件构建;S3:数据加载,即为系统实际使用时的工作过程,对步骤S1中的辅助文件进行逐步解析以得到结果。采用本方法,POI相关数据的处理高效且磁盘和内存占用低;随机读取高效,复杂度为O1,内存占用低;分割为训练、验证和测试集的过程高效、计算资源消耗低。
本发明授权一种用于神经网络训练的大规模POI数据处理和加载方法在权利要求书中公布了:1.一种用于神经网络训练的大规模POI数据处理和加载方法,其特征在于,包括以下步骤: S1:定义基本参数,包括POI数据表格的结构定义; S2:辅助文件构建:对数据进行预处理并将处理结果存储在伴随文件中;构建查找文件和映射文件,其中所述查找文件用于记录POI数据在原始文件中的位置和处理结果,所述映射文件用于提供数据快速定位; S3:数据加载:在实际使用时,系统先根据所述映射文件找到POI数据在所述查找文件中的位置,然后打开所述查找文件,根据所述映射文件指示的偏移量读取相应的数据行;其中,所述伴随文件中的处理结果可提供参考以对读取的数据进行进一步的处理和利用; 步骤S1具体为:定义POI数据表格,包括若干数据表格文件,为表格个数,所述POI数据表格有4个字段,分别为POI标识符POIID,行标识符ITEMID,数据字段1:,数据字段2:;所述数据表格文件为文本形式,其中每一个POI在所述POI数据表格中对应的一系列行连续且处于同一数据表格文件中,同一数据表格文件中存在若干POI; 步骤S2包括以下步骤: S2-1:数据处理,处理结果以伴随文件的形式存储;数据处理过程可以多次进行,其结果文件分别记为,其中为处理次数,表示对表格的第i次处理所得的伴随文件;对应于表格的一次处理所得的伴随文件记为,中包含两个字段,状态字段和ITEMID字段,其中状态字段表示该行的处理结果,字段存储对应的用于校验;中的第行与中的第行对应; S2-2:根据处理后的数据构建加载所需的相关辅助文件; 步骤S3包括以下步骤: S3-1:根据映射文件定位所需POI所在的查找文件及其位于该查找文件的位置; S3-2:根据S3-1步骤中得到的定位信息,打开对应的查找文件,将文件指针偏移个字节,读取一行,得到对应POI的一组数据; S3-3:根据偏移字节数和数据处理结果读取原始文件中的数据; S3-4:利用数据处理结果根据需求选择数据利用方式。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学深圳国际研究生院;北京三快在线科技有限公司,其通讯地址为:518071 广东省深圳市南山区桃源街道丽水路2279号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励