Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 大连海事大学左毅获国家专利权

大连海事大学左毅获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉大连海事大学申请的专利一种基于BLS的NAVTEX报文语义自动分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116719933B

龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310572057.8,技术领域涉及:G06F16/353;该发明授权一种基于BLS的NAVTEX报文语义自动分类方法是由左毅;李心宇;蒋龙;李铁山;陈俊龙设计研发完成,并于2023-05-19向国家知识产权局提交的专利申请。

一种基于BLS的NAVTEX报文语义自动分类方法在说明书摘要公布了:本发明公开了一种基于BLS的NAVTEX报文语义自动分类方法,对NAVTEX报文数据应用数据清洗和分词操作,并提出了语义标签来给报文标注类别,具体表现为对航行警告中所包含的报文内容进行总结,定义了7类语义标签。通过本发明可以有效地将冗余繁杂的原始报文数据进行精简化处理并初步为后续的分类任务打好基础,使训练出来的特征更具有代表性。本发明通过对预处理后的NAVTEX报文数据采用向量空间模型进行特征提取,具有计算方便和结构简单的优点;然后,基于BLS进行语义分类,具有训练时间短且分类效果好的优势,能够有效缓解船员劳动强度以及提高应对安全信息的应急反应速度和效率,从而提升船舶的安全航行性能。

本发明授权一种基于BLS的NAVTEX报文语义自动分类方法在权利要求书中公布了:1.一种基于BLS的NAVTEX报文语义自动分类方法,所述BLS为宽度学习系统的简称,其特征在于:所述方法包括以下步骤: S1、对NAVTEX报文数据进行预处理 NAVTEX报文数据即船舶航行过程中接收到的相关海上安全信息数据,NAVTEX报文数据预处理包括数据清洗、分词处理以及类别标注,具体步骤如下: S11、数据清洗 在数据清洗阶段,针对报文数据中的无效报文进行滤除;并将报文中的非文本部分通过正则表达式的方法将其滤除,得到一个报文数据集,其中表示集合中的第条报文,为报文样本数; S12、分词处理 分词处理包括对所述报文进行空格拆分、去停用词、标点、提取词干;报文利用单词与单词之间的空格进行拆分单词;通过去除报文中的停用词、虚词以及标点符号精简内容;对报文进行提取词干的处理,得到一组报文分词集合,其中表示第条报文的分词集合; S13、类别标注 根据分析NAVTEX报文中描述内容进行人工分类标注的语义标签,设置为7个语义类别,分别是:海事作业、碍航事物、航标变化、军事演习、海盗、取消之前警告、其他信息;每个报文分词集合只对应一类标签,标签矩阵记为,其中,即L属于m则为7类报文语义标签中的第类标签; S2、对报文分词进行特征提取 根据所述报文分词集合,采用向量空间模型的方法对其进行特征提取,构建一个多维度的向量空间,步骤如下: S21、用特征项-权重矩阵表示整个报文数据集 将一组报文分词集合用报文特征矩阵来表示,其中第条报文的分词集合用向量表示为: 看成是二元特征组构成的维分词向量;其中,是报文特征向量的第个报文特征向量的第个特征项;是特征项所对应的权重,代表特征项在报文里的重要程度;代表特征维度,任一维度均表示报文特征向量中的一个特征项,且为分词集合中所有分词数目去除包含的重复分词数目后所剩余分词的总数; S22、求解报文特征项所对应的权重 当收集到的报文数据中的特征维度确定后,特征向量简化为: 称为第条报文的报文特征项权重向量;其中的权重使用下述公式来进行计算: 其中,代表特征项在报文特征向量中的频次,计算公式如下: 为特征项在报文特征向量中出现的次数,为中所有特征项合计出现的次数;而代表特征项的逆文档频率,其计算公式如下: 其中,为报文特征矩阵中出现特征项的报文特征向量数;归一化因子的计算公式如下: S3、将报文语义标签排序并进行编码 引入One-Hot编码将类别变量转换为便于分类模型利用的形式,步骤如下: S31、对报文语义标签进行整数编码 规定7类报文语义标签排序并进行整数编码,分别将整数0至6依次对应分配给所述7个语义类别;即将语义标签矩阵映射到整数标签矩阵,其中,为代表对应语义类别的整数; S32、对整数标签进行One-Hot编码 创建一个二进制向量表示每个整数值;根据共有7类整数值,从而确定二进制向量的长度为7;将整数编码为0的标签用二进制向量表示,其中第0个索引标记为1,其余位置为0;另外6类整数编码也同理,除了整数对应位置的索引标记为1外,其余位置均为0,则得到One-Hot标签矩阵: 其中,,且One-Hot标签向量中仅一个位置为1,其余位置皆为0; S4、建立基于BLS的分类模型 利用步骤S2得到的报文特征项权重矩阵作为分类模型的输入,从而实现对报文语义分类模型的建立;BLS的网络结构包括四个部分:输入样本层、特征映射层、增强节点层以及输出层;采用BLS进行报文语义分类,每一层的算法流程如下: S41、列出分类模型的输入矩阵 报文语义分类模型的输入矩阵如下: 其中,,为报文样本数,为特征维度,为特征项在中的权重; S42、将输入的报文特征项权重矩阵进行特征映射 在输入样本层,将报文特征项权重矩阵输入分类模型,BLS网络将对进行特征映射,通过特征映射函数将报文特征项权重矩阵映射为组不同特征的映射节点,设每组映射生成个节点,第组报文特征映射节点的计算公式如下: 其中,,将进行并连表示得到;并把映射的特征项权重特征视作一层,即特征映射层;其中,为线性映射函数,为随机生成权值矩阵,为其对应偏置项; S43、生成报文增强节点 将S42步骤得到的组报文特征映射节点和增强节点层进行连接,随机生成权重系数矩阵和偏置项,通过非线性函数映射为组随机生成权重的报文增强节点,进行并连表示为,即得到增强节点层;设每组映射生成个节点,代表第组报文增强节点,计算公式如下: S44、求解连接权值矩阵 分别将由S42步骤得到的和由S43步骤得到的进行并连表示,则得到: 将特征映射层和增强节点层并连得到的直接连接到输出端,称为输出层;因此,输出矩阵为: 其中,为输出层的连接权值矩阵,则有: 式中表示矩阵的伪逆矩阵,通过求解的岭回归近似解计算,进而得到连接权值矩阵,至此整个模型训练结束,计算公式如下: 其中代表单位矩阵,为的转置矩阵; S45、列出分类模型的输出矩阵 分类模型的输出矩阵如下: 其中,为第条报文样本经过分类模型所求得的对应输出概率向量,为其中属于对应报文语义类别的概率值;取每个输出概率向量中的最大值,将最大值所对应概率向量中的位置表示为1,其余位置则表示为0,从而得到最终的输出矩阵,即最终的报文语义分类结果,表示如下: 其中,代表第条报文所对应的输出向量,,且输出向量中仅一个位置为1,其余位置皆为0;根据与步骤S32得到的One-Hot标签矩阵进行对比,从而判断所对应的报文语义类别,最终输出第条报文的语义分类结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连海事大学,其通讯地址为:116026 辽宁省大连市高新园区凌海路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。