ivdon3@bk.ru
Рассматривается проблема оценки размерности атрибутного пространства в контексте многозначной классификации компьютерных атак. Исследуется влияние многозначных закономерностей, проявляющихся в одновременной реализации нескольких типов компьютерных атак, на информативность атрибутов и точность классификации. Объектом исследования является табличное представление данных, собранное с использованием программно-аппаратного комплекса, предназначенного для имитационного моделирования многозначных компьютерных атак. Проведен сравнительный анализ корреляционных диаграмм, собственной информации, а также точности классификации с использованием алгоритма Random Forest для наборов данных, представленных как в классическом виде с одним целевым атрибутом, так и в виде модели, учитывающей многозначные закономерности. Практическая значимость работы заключается в повышении точности обнаружения и классификации компьютерных атак за счёт учёта многозначности целевых атрибутов, что позволяет строить более эффективные системы защиты информации.
Ключевые слова: многозначная классификация, атрибутное пространство, компьютерные атак, информационная безопасность, классификация сетевого трафика, обнаружение атак, информативность атрибутов, энтропия
2.3.6 - Методы и системы защиты информации, информационная безопасность
Рассматривается разработка и применение методов предварительной обработки табличных данных для решения задач многозначной классификации компьютерных атак. Объектом исследования является набор данных, содержащий многозначные записи, собранный при помощи разработанного авторами программно-аппаратного комплекса. Проведен анализ атрибутов набора данных, в ходе которого были выявлены 28 атрибутов, которые имеют наибольшую информационную важность при их использовании для классификации алгоритмами машинного обучения. Обоснована целесообразность использования автокодировщиков в области информационной безопасности, в задачах, связанных с наборами данных, обладающих свойством многозначности целевых атрибутов. Практическая значимость: предварительная обработка данных может быть использована для повышения точности обнаружения и классификации многозначных компьютерных атак.
Ключевые слова: информационная безопасность, компьютерные атаки, multi-label, multi-label classification, многозначная классификация, анализ набора данных, сбор экспериментальных данных, многозначные данные, сетевые атаки, информационная безопасность
2.3.6 - Методы и системы защиты информации, информационная безопасность