深度学习在网络入侵检测系统中的实用性与效率研究

2024-02-03 08:52吴瑕

信息记录材料 2024年1期

吴瑕

（东莞开放大学信息教研室广东东莞 523000）

0 引言

随着信息技术飞速进步与广泛应用，网络入侵已成为互联网安全的主要问题之一。网络入侵涉及非法访问、破坏或篡改电脑系统、网络和通信设备的行为，可能对国家信息安全造成巨大威胁，因此，研究并应用网络入侵检测系统的重要性不言而喻。近年来，深度学习作为一种领先的机器学习方法，在多个领域都有出色的表现和广大的应用前景。在网络入侵检测领域传统的基于规则或者特征工程的策略已经难以应对复杂的入侵行为。人工设定的规则和特征难以覆盖所有的入侵行为，随着网络入侵行为的复杂多样，这种方法的局限性越来越明显。深度学习技术通过对大量的网络数据进行学习，能够自动识别出入侵行为的模式，甚至在一些非线性的情况下也能提供出检测效果。因此，本文结合深度学习算法设计出一套无线通信网络入侵检测系统，提高了网络入侵检测系统的灵敏度，并与同类型的模型进行基线比较，证明了所提出算法的优越性。

1 深度学习的理论概述

深度学习是一种机器学习算法，旨在模拟人类大脑的工作原理通过多层神经网络来处理复杂的数据，它的核心思想是利用训练神经网络来学习数据的特征表示，从而实现自动化的特征提取和模式识别。深度学习的理论基础是神经网络和反向传播算法，神经网络是由多个神经元组成的网络结构，每个神经元都可以对输入数据进行处理，并将结果传递给下一层神经元。根据多层神经元的组合和权重调整，神经网络可以学习到复杂的数据特征。反向传播算法则是一种计算梯度来优化神经网络权重的方法，它可以根据网络输出与实际标签之间的误差来更新网络参数，从而逐步提高网络性能。

深度学习在许多领域都取得了重大突破，在计算机视觉方面深度学习在图像分类、目标检测和图像生成等任务上取得了很高的准确率；在自然语言处理领域，深度学习被广泛应用于机器翻译、文本生成和情感分析等任务中。此外深度学习还在语音识别、推荐系统和医学影像分析等领域展示出了强大的能力。

2 无线通信网络入侵检测系统的设计

2.1 建立无线通信网络数据处理模块

无线通信网络入侵检测系统的设计是保障网络安全的关键步骤之一。为了有效地检测和识别潜在的入侵行为，需要建立一个高效的无线通信网络数据处理模块，该模块能够对原始网络数据进行预处理和转换，以便后续的深度学习模型能够进行有效的分析和识别。

数据预处理是无线通信网络数据处理模块的重要组成部分。原始网络数据往往具有高维度、复杂性和噪声，直接应用深度学习模型可能会导致训练困难和模型的低效性。因此，数据预处理的目标是对原始数据进行降维、去噪和标准化等操作，以减少数据的冗余性和噪声干扰，并提取出具有较高信息含量的特征［1］。在数据预处理阶段，可以采用多种技术和方法，例如可以应用降维算法如主成分分析或线性判别分析，将高维数据映射到低维空间中，减少数据的复杂性和计算成本。此外可以使用滤波器和去噪算法如中值滤波、小波变换等，降低数据中的噪声干扰，提升信号的准确性和可靠性。

特征选择可以采用多种方法，包括过滤式方法、包装式方法和嵌入式方法等。过滤式方法主要基于特征之间的相关性和重要性进行筛选，如相关系数、信息增益等。包装式方法将特征选择任务视为优化问题，根据评估特征子集的性能来选择最佳特征组合。嵌入式方法将特征选择与模型训练过程融合在一起，通过模型自身的特性选择关键特征。在建立无线通信网络数据处理模块时，还需要考虑数据的实时性和动态性。无线通信网络数据是不断生成和流动的，因此数据处理模块需要具备较高的实时处理能力，能够及时响应和处理大量的数据流。

2.2 构造基于深度学习的入侵检测智能体

在无线通信网络入侵检测系统的设计中，构造基于深度学习的入侵检测智能体是至关重要的一步。入侵检测智能体作为系统的核心组件，通过深度学习模型实现对网络数据的分析和入侵行为的识别，能够快速准确地检测潜在的入侵威胁。构造基于深度学习入侵检测智能需要选择适合的模型架构。在网络入侵检测领域，常用的深度学习模型包括卷积神经网络、循环神经网络和长短期记忆网络等。这些模型具有较强的表达能力和模式识别能力，能够从网络数据中学习到复杂的特征和规律［2］。

构造深度学习入侵检测智能体需要进行模型的参数配置和训练策略设计，参数配置包括设置模型的层数、节点数、学习率等超参数，以及选择适当的激活函数、损失函数和优化算法等。训练策略包括数据集的划分、批量大小、训练轮数等，以及采用合适的正则化和迭代技术来避免过拟合。图1 为采用合适的正则化和迭代技术来避免过拟合的原理图。

图1 采用合适的正则化和迭代技术来避免过拟合的原理图

在训练深度学习模型时，数据集的选择和准备是至关重要的。由于网络入侵数据的获取和标注成本较高，可以利用已有的公开数据集如NSL⁃KDD 数据集或UNSW⁃NB15 数据集进行模型训练。此外，加入数据处理与优化机制如随机翻转、旋转和缩放等来扩充训练数据，提高模型的泛化能力。构造基于深度学习的入侵检测智能体还需要进行模型的训练和优化。通过预处理后的数据输入深度学习模型，进行反向传播和梯度更新，不断调整模型的参数和权重，以提高模型的性能和准确性。在训练过程中，可以监控模型的损失函数和精度指标，及时调整训练策略和参数配置，以达到最佳的入侵检测效果。除了模型的训练，更多地使用迁移学习和集成学习等技术来提升入侵检测智能体的性能。迁移学习可以通过从相关领域的预训练模型中学习到的知识来加速模型的训练和提升性能。集成学习则组合多个不同的模型来达到更好的分类效果和鲁棒性。

构造基于深度学习入侵检测智能体能够利用深度学习模型的优势和能力，实现对网络数据的深入分析和入侵行为的准确识别。智能体能够有效应对复杂和多样化的入侵攻击，提高网络入侵检测系统的安全性和可靠性，通过优化模型训练策略和引入相关技术，进一步提升入侵检测智能体的性能和鲁棒性。

2.3 设计入侵检测智能体训练策略

在无线通信网络入侵检测系统的设计中，合理的训练策略对于构建高效的入侵检测智能体至关重要。训练策略的设计涉及数据集的选择和划分、模型的训练过程和优化方法等，旨在加大深度学习模型在入侵检测任务上的性能和泛化能力。

数据集的选择和划分是设计训练策略的首要考虑因素。由于网络入侵数据的获取和标注相对困难，可以利用已有的公开数据集如KDD99 数据集进行模型训练。然而，这些数据集通常包含大量的正常流量，而入侵样本相对较少。为了解决数据不平衡问题，可以采用欠采样、过采样或基于生成对抗网络的合成样本生成方法来平衡数据集；模型的训练过程应该充分利用训练数据和验证数据进行监控和调整。在训练过程中可以设置早停策略，即当模型在验证集上的性能不再提升时停止训练，以避免过拟合。另外可以采用批量梯度下降法或随机梯度下降法等优化算法来更新模型的参数和权重，设置合适的学习率和学习率衰减策略［3］。

为了提高模型的泛化能力和鲁棒性，模型中引入正则化技术如L1 正则化、L2 正则化或迭代等。正则化可以防止模型过拟合训练数据，减少模型的复杂度，提高对未知样本的预测能力。另外在训练过程中采用交叉验证方法也极大地提升了模型和性能，将数据集划分为训练集、验证集和测试集，评估模型在不同数据集上的性能，以验证模型的鲁棒性和泛化能力。迭代的训练过程中还可以进行模型的参数调优和超参数的搜索。通过调整模型的超参数如学习率、批量大小、激活函数等，可以找到最佳的模型配置，提高模型的性能和训练效果。可以使用网格搜索、随机搜索或贝叶斯优化等方法进行超参数的搜索和调优，同时考虑引入模型集成技术来进一步提升入侵检测智能体的性能。

模型集成可以结合多个不同的深度学习模型或训练出的不同版本模型来获得更好的分类效果和鲁棒性。常用的模型集成方法包括投票法、堆叠法或权重融合等。

设计合理的入侵检测智能体训练策略，可以有效地加大深度学习模型在入侵检测任务上的性能和泛化能力。合适的数据集选择和划分、模型训练过程和优化方法的设计、正则化和参数调优、模型集成等都是构建高效入侵检测智能体的关键要素。通过优化训练策略可以提高入侵检测系统的准确性和鲁棒性，实现对网络入侵行为的及时识别和防御。

2.4 训练与测试入侵检测智能体训练过程中的注意点

在设计无线通信网络入侵检测系统时，合理的训练策略对于构建高效的入侵检测智能体至关重要。训练策略的设计涉及数据集的选择和划分、模型的训练过程和优化方法等，旨在加大深度学习模型在入侵检测任务上的性能和泛化能力。首先，数据集的选择和划分是设计训练策略时的首要考虑因素，由于获取和标注网络入侵数据相对困难，可以利用已有的公开数据集，如NSL⁃KDD 数据集或UNSW⁃NB15 数据集进行模型训练。然而这些数据集通常包含大量的正常流量，而入侵样本相对较少。其次，为了解决数据不平衡的问题，可以采用欠采样、过采样或基于生成对抗网络的合成样本生成方法来平衡数据集。可以提供更多的入侵样本，从而更好地训练入侵检测模型。再次，模型的训练过程应充分利用训练数据和验证数据进行监控和调整。在训练过程中，应该定期评估模型在验证集上的性能，并根据性能结果进行必要的调整。如果模型在验证集上的性能不再提升或开始下降，可以选择停止训练，以避免过拟合现象的发生。此外还可以使用交叉验证方法来评估模型的鲁棒性和泛化能力，将数据集划分为多个折叠，进行多次训练和验证，以更全面地评估模型的性能，以确保模型在不同数据集上都能表现良好。最后，优化方法的选择也对训练过程的效果有重要影响，常用的优化方法包括随机梯度下降算法等。选择合适的优化方法和调整参数可以加快模型的收敛速度，并提高模型的准确性和鲁棒性。

3 提升深度学习在网络入侵检测系统中的实用性和效率的策略

数据集的选择和划分是设计训练策略的首要考虑因素。由于网络入侵数据的获取和标注相对困难，可以利用已有的公开数据集如KDD99 数据集进行模型训练。然而，这些数据集通常包含大量的正常流量，而入侵样本相对较少［4］。为了解决数据不平衡问题，可以采用欠采样、过采样或基于生成对抗网络的合成样本生成方法来平衡数据集。迭代的训练过程中还可以进行模型的参数调优和超参数的搜索。通过调整模型的超参数如学习率、批量大小、激活函数等，可以找到最佳的模型配置，提高模型的性能和训练效果。可以使用网格搜索、随机搜索或贝叶斯优化等方法进行超参数的搜索和调优。模型集成技术可以进一步提升入侵检测智能体的性能。模型集成可以结合多个不同的深度学习模型或训练出的不同版本模型来获得更好的分类效果和鲁棒性。常用的模型集成方法包括投票法、堆叠法或权重融合等［5］。

4 系统测试与实验结果分析

测试阶段采用的KDD99 数据集源自麻省理工学院林肯实验室的入侵检测评估项目。该项目的目的是分析当前的网络安全技术，并为未来的网络防御提供建议。该数据集包含超过500 万个数据样本，每个样本包含41 个特征和一个标签。在本研究中使用了484 021 个训练数据和30 029 个测试数据。标签可以分为两个主要类别，即“Normal（正常）”和“Attack（攻击）”，而攻击标签又大致分为四类如表1 所示。

表1 数据标签

本实验采用准确率作为算法性能比较的评估标准，进行的是一个多分类任务，表2 为本文提出的TEST 模型与其他模型的对比。

从表2 中可以看出，TEST 比其他检测系统快得多，准确率也大幅提高。支持向量机模型，使用几十万级的数据进行培训已经变得很困难。支持向量机算法和卷积神经网络算法具有极高的内存消耗、较高的硬件成本和较低的准确率。综合来看，与上述其他算法相比，轻量化的TEST更适合海量、高维数据的应用场景，并且可以避免梯度爆炸和消失。本文设计的模型具有粒度平行加速运算的特点，在多核CPU 条件下，本文设计的模型效率更高。

5 结语

综上所述，深度学习在无线通信网络入侵检测系统中的应用具有重要的研究价值和实际应用前景，为网络安全提供了新的解决方案和保障。深度学习在无线通信网络入侵检测系统中的实用性和效率与同类型的模型进行数据对比，具有显著优势，本文深入探索深度学习在网络入侵检测中的潜在价值，并提出一套实践有效的方案，以增强网络入侵检测系统的准确度、稳健性和效率，为网络安全领域的后续研究和实践提供宝贵的参考。