浙江云朵网科技股份有限公司陆世栋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江云朵网科技股份有限公司申请的专利基于数智大脑的数据分析方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120197073B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510685421.0,技术领域涉及:G06F18/243;该发明授权基于数智大脑的数据分析方法及系统是由陆世栋;倪光耀;俞利敏设计研发完成,并于2025-05-27向国家知识产权局提交的专利申请。
本基于数智大脑的数据分析方法及系统在说明书摘要公布了:本发明涉及数据处理技术领域,尤其涉及基于数智大脑的数据分析方法及系统。方法包括:通过多源数据采集途径获取目标领域内包含多个特征的样本;获取带有标签的样本数据集,并生成样本数据集的若干子空间;确定样本之间的多尺度流形距离;获取每个样本的可靠度;确定每个特征的特征重要度;基于所述特征重要度,构建随机森林模型,应用样本数据集训练随机森林模型,利用训练后的随机森林模型,对新获取到的待测数据进行分析。本发明通过确定每个特征的特征重要度,能够充分考虑不同特征对决策贡献的差异,在构建随机森林模型时,避免因低效特征的影响导致最终输出结果不准确的问题,提高了模型决策的准确性。
本发明授权基于数智大脑的数据分析方法及系统在权利要求书中公布了:1.基于数智大脑的数据分析方法,其特征在于,包括: 通过多源数据采集途径获取目标领域内包含多个特征的样本,所述目标领域为金融领域或医疗领域,其中,金融领域的特征包括交易金额,医疗领域的特征包括就诊时间; 对样本的每个特征进行标准化,依据所有样本的标准化后的特征进行标签编码,得到带有标签的样本数据集,其中,金融领域的样本数据集的标签为风险等级,医疗领域的样本数据集的标签为疾病类型,对样本数据集利用t-SNE进行降维,生成若干个不同尺度下的子空间; 对于样本数据集内的任意两个样本,根据所述两个样本在每个子空间中的值的差异、所有样本在每个子空间与其余子空间的预设近邻样本的平均重叠数量,确定所述两个样本的多尺度流形距离,所述多尺度流形距离的获取方式为:将任一子空间记为目标子空间,对于任一样本,将该样本在目标子空间与其余子空间的预设近邻样本的平均重叠数量与预设近邻样本的数量的比值,记为该样本的信任度权重,将所有样本的信任度权重之和记为目标子空间的信任度权重;将所述信任度权重与所述两个样本在目标子空间中的值的差异的乘积,记为所述两个样本在目标子空间的流形距离;将所述两个样本在所有子空间的流形距离之和的标准归一化结果,记为所述两个样本的多尺度流形距离; 根据所述多尺度流形距离的大小,确定每个样本的多个近邻样本,将每个样本与每个样本的所有近邻样本的多尺度流形距离的均值的归一化的结果,作为每个样本的可靠度; 根据所述可靠度、每个样本在每个特征中的值,以及所有样本在每个特征中的均值,确定每个特征的特征重要度; 基于所述特征重要度,构建随机森林模型,应用样本数据集训练随机森林模型,利用训练后的随机森林模型,对新获取到的待测数据进行分析,包括:将新获取到的待测数据输入训练后的随机森林模型,获取与样本数据集的标签对应的决策结果,依据决策结果,进行金融领域中的风险拦截阈值或医疗领域中的分级诊疗,完成基于数智大脑的数据分析。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江云朵网科技股份有限公司,其通讯地址为:315700 浙江省宁波市象山县丹西街道滨海大道929号(主楼西)7层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。