海洋 作品数:6 被引量:1 H指数:1 供职机构: 宝鸡市公安局 更多>> 相关领域: 自动化与计算机技术 更多>>
一种工控协议识别中的特征字符串挖掘算法 2024年 对工控协议的识别,是对工控协议开展研究的第一步。而在通信过程中频繁出现的字符串,是对工控协议识别中的重要特征。针对工控协议识别中特征字符串的提取问题,提出了一种自顶向下的频繁字符串挖掘算法,可以直接得到没有冗余的频繁字符串集。同时,对于自顶向下方法中原始数据过于庞大、算法迭代次数较多等问题,借鉴了N-gram模型,提出了一种数据划分策略,解决了自顶向下处理时数据过大的问题。此外,在挖掘频繁字符串的过程中,采取了删除重叠项与字符串分裂相结合的方法。实验结果表明,该算法针对多种协议均能识别出其中的特征字符串;同时,利用识别出的字符串作为特征,在协议识别工作中也能取得良好的效果。可以得出结论,该算法能够较好地提取出工控协议中的特征字符串。 海洋 徐魁 李晓辉 曾涛 陶军关键词:自顶向下 数据划分 特征提取 数据处理 基于伽马内核与加权K近邻的流量分类算法 2023年 K最近邻算法(KNN)是一种简单有效的分类方式。当数据集分布均衡,不同类别样本之间的差异显著时,KNN的分类效果一般较好。但实际中数据集通常不理想,网络流量往往呈现倾斜分布,存在样本之间差异不显著等问题。为了更好地权衡样本距离之间差异以及流量类别分布不均带来的模型准确率下降问题,提出了一种基于Gamma内核与加权KNN的流量分类算法,综合考虑了距离和流量分布对分类结果的影响。采用Gamma分布函数作为内核,对不同类别采用自信息进行加权。最后得到G-WKNN模型,并将该模型应用于CIC-IDS2017数据集。实验结果表明,在流量均衡的情况下,模型准确率稳定在0.91左右。在流量不均衡时,依旧具备良好的分类表现。对比其余几种改良的KNN算法,其分类准确率较高且模型稳定性好,对K值相对不敏感。同时G-WKNN模型对少数类别分类准确率的提升效果也较为显著。 徐魁 海洋 许艺凡 段靖海 孙炜策 陶军关键词:K最近邻算法 GAMMA分布 自信息 距离函数 网络流量分类 未知二进制协议的报文分割方法 2023年 基于网络轨迹的协议逆向工程使用捕获的数据包进行分析,进而逆向未知协议的格式等信息。该文提出了一种利用二进制协议在网络通信过程中使用报文序列数据集来推断消息字段划分的新方法HV。该方法首先利用定义的测度分析各条消息中的值分布,分析报文的内部结构,对字段边界初次划分。接着利用消息序列之间所隐藏的统计信息对字段边界再次划分。最后将两次划分的结果结合,生成最终的字段划分结果。此前的研究很少利用每个消息内部的结构特征,而是通过比较多条消息得出结论。对于消息之间的统计特征,该文仅仅比较相邻的消息,而不是相互比较多条消息。此外,该文还定义了格式匹配分数,用于消息字段划分的质量的度量。将格式匹配分数应用于HV和以前的方法的对比实验中,进而验证HV字段划分的质量。由于HV在水平分析上利用了消息的内部结构,并且在垂直分析中只比较相邻消息之间的异同,因此HV不仅具有较好的字段划分效果,而且只有线性复杂度。 徐魁 海洋 李晓辉 朱承才 陶军关键词:报文格式 浅析分布式防火墙技术的实际运用 2015年 1分布式防火墙的产生伴随着计算机用户对防火墙功能的逐渐提高,产生为一种新型的防火墙技术-分布式防火墙,分布式防火墙是以边界式防火墙为基础而研发。分布式防火墙具体模式如图1。 海洋关键词:分布式防火墙 防火墙技术 防火墙功能 计算机用户 基于图像重建的深度估计方法 2024年 实现可靠精度的深度估计是三维目标检测方法的关键,该文提出了一种图像深度估计方法。基于深度学习方法,通过训练深度神经网络,从立体图像的一幅图像中重建另一幅图像实现深度估计,并在训练中采用最小化深度误差替代最小化视差误差,利用立体图像对的几何约束引入左右视图一致性损失实现更加精确的深度估计。针对图像真实深度数据获取困难、数据集制作成本高的问题,构建了基于图像重建的自监督训练的图像深度估计框架,不需要图像真实深度数据,节省了数据集制作成本;针对深度估计误差随深度的增加急剧增大的问题,采用最小化深度误差替代最小化视差误差,解决了深度估计网络过分强调近处的微小深度误差而忽略远处深度误差的问题。另外,该文还充分利用了立体图像对的几何约束,在训练中引入左右视图一致性损失来提高深度估计的准确性。实验验证了提出的图像深度估计方法在性能上优于现有的其他方法,对远处区域和细小目标进行深度估计时具有更好的性能。 徐魁 海洋 李晓辉 陶军关键词:图像重建 基于信息熵与服务器识别的DoH流量检测 被引量:1 2024年 DNS over HTTPS(DoH)协议是一种针对域名系统(DNS)的最新改进方案,然而用户可使用第三方DoH服务规避内网原有的监管,所以异常流量检测方法不再适用于检测DoH流量。针对该问题提出了一种DTESI算法。首先,基于信息熵将DoH流量作为异常流量从全部网络流量中筛选出来;然后,利用DoH服务器与同一客户端建立TLS连接时响应方式总是相同的特性,用指纹识别检测客户端与DoH服务器之间的TLS协商,确定DoH服务器身份;最后,使用Top-K抽样算法选出一定时段内网络中前K台活跃主机着重进行流量检测,使算法能应用于中大型组织的网络。实验结果表明,针对发现的异常流量,DTESI算法检测出的DoH服务提供商准确率超过94%。在此基础上比较了在不同K值下的算法检测时间和对网络中全部DoH流量的检测覆盖率,结果表明合理选择K值可以提升算法的整体效能。 徐魁 海洋 李晓辉 陶军关键词:网络流量检测 信息熵 TLS协议