Научный электронный журнал КубГАУ . № 01(1), 2003



Численный расчет эластичности
объектов информационной безопасности
на основе системной теории информации

Луценко Е.В., кандидат технических наук, доцент

Кубанский государственный аграрный университет,
кафедра компьютерных технологий и систем

 

Постановка задачи. Пусть существует ряд угроз объекту информационной безопасности (ОИБ). Степень опасности каждой угрозы зависит от значений ряда факторов, повышающих или понижающих защищенность ОИБ от данной угрозы. Факторы, понижающие защищенность ОИБ будем называть факторами риска, а повышающими ее – факторами защищенности. Интегральная оценка уязвимости и защищенности ОИБ является функцией его защищенности от каждого вида угроз.

Существует несколько вариантов формализации зависимости степени защищенности ОИБ от факторов:

1. Каждая угроза y зависит от одного фактора x, т.е. между степенью угрозы и значениями фактора существуют отношения взаимно-однозначного соответствия. В этом случае эту зависимость можно выразить в виде однозначной функции одного аргумента: y=f(x).

2. Каждая угроза y зависит от значений многих факторов {xi}. Такую зависимость можно выразить в виде однозначной функции многих аргументов: y=f(x1,…,xi).

3. Одни и те же факторы {xi} в общем случае оказывают влияние на степень защищенности ОИБ не от одного, а от многих видов угроз {yj}. В этом случае каждая угроза является многозначной функцией многих аргументов: y1,…,yj=f(x1,…,xi).

Задача построения математической модели ОИБ состоит в определении вида функции f непосредственно на основе эмпирических данных. На основе этой модели решаются подзадачи:

1. Определение силы и направления действия факторов, влияющих на защищенность ОИБ.

2. Оптимизация системы факторов ОИБ путем исключения несущественных.

3. Оценка адекватности математической модели ОИБ.

4. Идентификация и прогнозирование защищенности ОИБ от системной угрозы.

5. Поддержка принятия решений и выработка рекомендаций по реструктуризации и оптимизации системы безопасности ОИБ.

6. Построение семантических сетей угроз и факторов риска (безопасности).

7. Построение когнитивных диаграмм угроз и факторов риска (безопасности).

Первым шагом на пути построения математической модели является выбор количественной меры, позволяющей измерять степень влияния фактора на исследуемый параметр. К этой мере предъявляется ряд требований [2], основными из которых являются сопоставимость, интерпретируемость и вычислимость на основе непосредственно эмпирических данных.

Традиционный подход к понятию эластичности.

Рассмотрим первый вариант формализации зависимости степени защищенности ОИБ от факторов (взаимно-однозначное степени защищенности ОИБ от угрозы y в зависимости от значений фактора x): y=f(x).

Понятие эластичности. Коэффициент эластичности показывает относительное изменение исследуемого параметра системы под действием единичного относительного изменения некоторого фактора [1]. Это понятие является обобщением понятия производной с учетом требования безразмерности и сопоставимости.

Эластичность в непрерывном случае. Пусть численное значение некоторого параметра экономической, социально-психологической или организационно-технической системы описывается переменной y, зависящей от фактора x и эта зависимость описывается функцией y=f(x). Тогда степень и направление влияния фактора x на параметр y можно численно измерить производной (1), представляющей собой предел отношения абсолютных изменений величин y и x:

( 1 )

Однако применение производной не очень удобно, т.к. она зависит от размерности величин y и x и, по этой причине, обладает недостаточной сопоставимостью в пространстве и времени. Кроме того, сама по себе скорость абсолютного изменения некоторого параметра объекта безотносительно к средней величине этого параметра, содержит недостаточно информации об этом объекте. Например, если на очередных выборах за некоторого кандидата отдано на 500 голосов больше, чем на предыдущих, то важно знать, а на сколько это процентов больше.

Поэтому в экономике введено понятие эластичности функции y=f(x), которое определяется как предел отношения не абсолютных, а относительных изменений значений переменных y и x:

(2)

Так как , и , то эластичность можно представить в виде логарифмической производной:

(3)

Как исключительно удачное, автор предлагает применить понятие эластичности для исследования и управления не только экономическими, но и социально-психологическими, и организационно-техническими системами, прежде всего объектами информационной безопасности (ОИБ).

Эластичность в дискретном случае. Для численных расчетов необходимо перейти к дискретному случаю, в частности для численного взятия производных используем метод конечных разностей. В конечных разностях выражение (3) принимает вид:

(4)

Свойства эластичности. Рассмотрим некоторые свойства эластичности, которые, как мы заметили, удивительным образом полностью или частично совпадают со свойствами логарифма (таблица 1).

Таблица 1 – Свойства эластичности и логарифма

Необходимо отметить, что ряд других свойств эластичности, таких как эластичность суммы функций, эластичность линейной функции и др., не совпадают со свойствами логарифма.

Итак, учитывая свойства эластичности 2-5 мы видим, что многие свойства эластичности такие же, как свойства логарифмической функции. Это позволяет высказать гипотезу, что эластичность каким-то образом связана с количеством информации, т.к. во все выражения для количества информации Хартли-Найквиста-Больцмана, Шеннона и Харкевича входит логарифмическая функция.

Какая же из этих мер информации в наибольшей степени соответствует понятию эластичности? Ключевым в решении этого вопроса является свойство 5 (таблица 1): область значений мер Хартли-Найквиста-Больцмана и Шеннона изменяется от 0 до ; область значений меры Харкевича, как и эластичности, изменяется от – от  до , как и эластичности. Однако классическая мера семантической целесообразности информации мера Харкевича не удовлетворяет принципу соответствия с мерой Хартли в детерминистском случае, поэтому автором данной статьи в работе [4] предложена системная мера целесообразности информации (рисунок 1), в последующем получившая развитие в работах [3] и [2]:

 

Рисунок 1. Генезис выражения для системной целесообразности информации

С этой мерой и предлагается ассоциировать эластичность. Использован термин "ассоциировать", а не "отождествить", т.к. не все свойства эластичности совпадают со свойствами системной информационной меры. Несмотря на это применение данной информационной меры вместо классической эластичности оправдано тем, что эластичность не определена для однозначных функций и многозначных функций многих переменных, а также для нечетких функций, тогда как именно для этого общего случая разработан универсальный численный метод и инструментарий, позволяющие проводить информационные расчеты влияния факторов на параметры систем на основе непосредственно эмпирических данных.

Предлагаемая модель, численный метод и инструментарий.

Рассмотрим формы представления эмпирических данных для численных расчетов эластичности при трех различных вариантах формализации зависимости степени защищенности ОИБ от факторов, приведенных в постановке задачи (таблица 2 – таблица 5).

Вопрос о смысле значений фактора xi остается открытым и требует решения. В данной статье, как и в работе [2], предлагается в качестве значений фактора рассматривать количество информации, содержащейся в факте наблюдении данного фактора о том, что функция примет определенное значение.

 

Таблица 2 – ФОРМА ПРЕДСТАВЛЕНИЯ ЭМПИРИЧЕСКИХ ДАННЫХ ДЛЯ РАСЧЕТА ЭЛАСТИЧНОСТИ ВЗАИМНО-ОДНОЗНАЧНОЙ ФУНКЦИИ ОДНОГО АРГУМЕНТА

 

Численный расчет эластичности в этом случае осуществляется на основе выражения (4), модифицированного для этого случая формулы (5):

(5)
Таблица 3 – ФОРМА ПРЕДСТАВЛЕНИЯ ЭМПИРИЧЕСКИХ ДАННЫХ ДЛЯ РАСЧЕТА ЭЛАСТИЧНОСТИ ВЗАИМНО-ОДНОЗНАЧНОЙ ФУНКЦИИ МНОГИХ АРГУМЕНТОВ

Численный расчет эластичности в этом случае осуществляется на основе формулы (4), обобщенной для случая многих переменных (6):

(6)

Предлагается эластичность, рассчитанную согласно выражения (6), называть частной эластичностью. Введем понятие интегральной эластичности, под которой понимается некоторая функция, аргументами которой является частная эластичность ОИБ для всех факторов. Будем различать аддитивную интегральную эластичность для непрерывного и дискретного случая, которая адекватна в том случае, если ни один из факторов не имеет определяющего влияния на уровень защищенности ОИБ (7):

(7)

и мультипликативную интегральную эластичность, применимую в случае, когда некоторые из факторов безопасности или риска имеет определяющее (решающее) влияние на общий уровень защищенности ОИБ (8):

(8)

Здесь использовано обозначение для нового, предлагаемого в рамках данной статьи, понятия: теоретически максимально-возможный ущерб (ТМВУ), который определяется как эластичность детерминистского фактора, в результате действия которого некоторый жизненно-важный параметр ОИБ принимает неприемлемое значение. Численно ТМВУ равен количеству информации, которое мы получаем о степени защищенности ОИБ из факта о действии данного смертельно-опасного детерминистского фактора. Если встречается хотя бы один подобный фактор – значение мультипликативной интегральной эластичности принимает нулевое значение, если же подобных факторов нет - то оно положительно и тем выше, чем выше защищенность ОИБ.

Предложенная численная мера системной целесообразности информации позволяет вычислить численное значение ТМВУ для любого конкретного ОИБ, о котором есть необходимые исходные данные. Если обычные факторы риска могут привести к определенному ущербу ОИБ, то решающие факторы риска могут привести к непоправимому ущербу для ОИБ или его уничтожению. Возможен и смешанный вариант, при котором одни факторы имеют определенное положительное и отрицательное влияние на защищенность ОИБ, а другие имеют решающее значение.

 

Таблица 4 – ФОРМА ПРЕДСТАВЛЕНИЯ ДАННЫХ ДЛЯ РАСЧЕТА ЭЛАСТИЧНОСТИ В СЛУЧАЕ МНОГОЗНАЧНОЙ ФУНКЦИИ МНОГИХ АРГУМЕНТОВ

Численный расчет частной эластичности в этом случае осуществляется с использованием выражения (6), а интегральной эластичности ОИБ по каждому параметру – по формулам (7) или (8). Многозначность в данном случае выражается в том, что одно и то же сочетание факторов (т.е. некоторое определенное сочетание факторов) обуславливает некоторые различные значения каждого параметра защищенности (уязвимости) ОИБ и всего объекта в целом.

Математическая модель эластичности, основанная на системной теории информации. В классической теории информации Шеннона, созданной на основе обобщения результатов Больцмана, Найквиста и Хартли, само понятие информации определяется на основе теоретико-множественных и комбинаторных представлений на основе анализа поведения классического макрообъекта, который может переходить только в четко фиксированные альтернативные редуцированные состояния. Однако, квантовые объекты и сложные активные рефлексивные системы могут оказываться одновременно в двух и более альтернативных для классических объектов состояниях. Такие состояния будем называть смешанными. Таким образом наблюдается картина последствий, не сводящаяся к простой сумме последствий альтернативных вариантов, т.е. очень напоминающая квантовое физическое явление, которое называется интерференцией плотности вероятности. Это явление, безусловно имеющее системный характер, предлагается называть "интерференция последствий выбора".

Предлагается обобщение классической теория информации Хартли-Шеннона путем рассмотрения квантовых и активных объектов в качестве объектов, на основе анализа которых формируется само основополагающее понятие информации. Обобщенную таким образом теорию информации предлагается называть системной или эмерджентной теорией информации (было бы удачным назвать ее и квантовой, но этот термин уже используется в другом смысле). Основным отличием эмерджентной теории информации от классической является учет свойства системности, как фундаментального и универсального свойства всех объектов, на уровне самого понятия информации, а не только в последующем изложении, как в классической теории.

Предложена системная модификация формулы Хартли для количества информации:

где:

W – количество чистых (классических) состояний системы;

– сочетания "по m" классических состояний.

Так как , то при M=1 выполняется принцип соответствия, являющийся обязательным для более общей теории. Данная формула дает верхнюю оценку возможного количества информации состоянии системы, т.к. возможны различные правила запрета и реальное количество возможных состояний системы будет меньшим, чем .

Предложено приближенное выражение для системной модификации формулы Хартли (при M=W):

При W>4 погрешность данного выражения не превышает 1%.

Дополнительная информация, которую мы получаем из поведения объекта в СТИ, по сути дела является информацией о множестве всех его возможных состояний, как системы, элементом которой является объект в некотором данном состоянии.

Численные расчеты и аналитические выкладки показывают, что при возрастании количества элементов в системе доля системной информации в поведении ее элементов возрастает, причем возрастает ускоренно. Это обнаруженное нами свойство систем предлагается назвать "Законом возрастания эмерджентности".

Предложена системная модификация классической формулы А.Харкевича, являющееся нелинейной суперпозицией классических выражением для плотности информации Шеннона и количества информации Хартли.

где: j – коэффициент эмерджентности Хартли (уровень системной организации объекта, имеющего W чистых состояний):

Полученное выражение учитывает как взаимосвязь между признаками (факторами) и будущими, в т.ч. целевыми состояниями объекта управления, так и мощность множества будущих состояний. Кроме того она объединяет возможности интегрального и дискретного описания объектов, что является основой формализации смысла, а также удовлетворяет принципу соответствия, т.е. преобразуется в формулу Хартли в предельном случае, когда каждому классу (состоянию объекта) соответствует один признак (фактор), и каждому признаку – один класс, и эти классы (а, значит и признаки), равновероятны.

Все это делает выражение оптимальным по сформулированным критериям для целей построения семантической информационной модели активных объектов управления и для применения для синтеза рефлексивных АСУ активными системами.

В предложенной семантической информационной модели генерируется обобщенная таблица решений, в которой входы (факторы) и выходы будущие состояния активного объекта управления (АОУ) связаны друг с другом не с помощью классических (Аристотелевских) импликаций, принимающих только значения: "Истина" и "Ложь", а различными значениями истинности, выраженными в битах и принимающими значения от положительного теоретически-максимально-возможного ("Максимальная степень истинности"), до теоретически неограниченного отрицательного ("Степень ложности"). Синтез обобщенных таблиц решений для различных предметных областей осуществляется непосредственно на основе эмпирических исходных данных, на основе этих таблиц продуцируются прямые и обратные правдоподобные (нечеткие) логические рассуждения по неклассическим схемам с различными расчетными значениями истинности, являющимся обобщением классических импликаций. При этом в прямых рассуждениях как предпосылки рассматриваются факторы, а как заключение – будущие состояния АОУ, а в обратных – наоборот. Степень истинности i-й предпосылки – это количество информации Iij, содержащейся в предпосылке о наступлении j-го будущего состояния активного объекта управления.

Евклидово расстояние в качестве меры сходства объекта с классом, класса с классом и атрибута с атрибутом не применимо, т.к. информационное семантическое пространство вообще говоря неортонормированно, расстояние Махалонобиса также неприменимо, т.к. измеряет расстояние от центроида, а не между векторами, поэтому на основе леммы Неймана-Пирсона в качестве неметрической меры сходства предложено использовать суммарное количество информации. Если предпосылок несколько, то степень истинности наступления j-го состояния АОУ равна суммарному количеству информации, содержащемуся в них об этом:

Или в координатной форме:

,

где: – вектор j–го состояния объекта управления, координаты которого в информационном семантическом пространстве рассчитываются согласно системного обобщения формулы Харкевича, приведенной в п.6;  – булев вектор состояния предметной области, включающий все виды факторов, характеризующих объект управления, возможные управляющие воздействия и окружающую среду (массив–локатор).

Предложенная семантическая информационная модель позволяет решать задачи идентификации и прогнозирования развития активных систем (разложение вектора объекта по векторам классов – "Объектный анализ"), а также вырабатывать эффективные управляющие воздействия путем решения обратной задачи прогнозирования и применения элементов нетрадиционной логики и правдоподобных (нечетких) рассуждений. В ней объединены преимущества содержательных и статистических моделей, созданы предпосылки для реализации АСК-анализа.

Исследована взаимосвязь примененной в модели семантической меры Харкевича со статистикой Х2, и, на этой основе, предложена новая статистическая мера наличия причинно-следственных связей H, основанная на модифицированной формуле Харкевича:

где:

- средняя информативность признаков по матрице информативностей.

Обоснована устойчивость модели при малых выборках, дано обоснование сопоставимости частных критериев, разработана интерпретация распознавания как объектного анализа (разложение вектора объекта в ряд по векторам классов), предложены робастные процедуры, а также процедуры обеспечения структурной репрезентативности выборки.

Предложен коэффициент эмерджентности Хартли j, который представляет собой относительное превышение количества информации о системе при учете системных эффектов (смешанных состояний, иерархической структуры ее подсистем и т.п.) над количеством информации без учета системности, т.е. этот коэффициент отражает уровень системности объекта. Уровень системности объекта изменяется от 1 (системность минимальна, т.е. отсутствует) до W/Log2W (системность максимальна). Для каждого количества элементов системы существует свой максимальный уровень системности, который никогда реально не достигается из-за действия правил запрета на реализацию в системе ряда подсистем различных уровней иерархии.

Предложен коэффициент эмерджентности Харкевича Y, который изменяется от 0 до 1 и определяет степень детерминированности системы:

Y=1 соответствует полностью детерминированной системе, поведение которой однозначно определяется действием минимальным количеством факторов, которых столько же, сколько состояний системы;

Y=0 соответствует полностью случайной системе, поведение которой никак не зависит действия факторов независимо от их количества;

0<Y<1 соответствуют большинству реальных систем поведение которых зависит от многих факторов, число которых превосходит количество состояний системы, причем ни одно из состояний не определяется однозначно никакими сочетаниями действующих факторов.

Увеличение уровня системности влияет на семантическую информационную модель аналогично повышению уровня детерминированности. Понижение уровня системности, также как и степени детерминированности системы приводит к ослаблению влияния факторов на поведение системы, т.е. к своего рода "инфляции факторов".

Итак, в предложенном системном обобщении формулы Харкевича впервые непосредственно в аналитическом выражении для самого понятия "Информация" отражены такие фундаментальные свойства систем, как "Уровень системности" и "Степень детерминированности" системы, кроме того это выражение (как и формула Шеннона) удовлетворяет принципу соответствия с выражением Хартли в детерминистском случае, учитывает понятие цели, мощность множества будущих состояний объекта управления, объединяет возможности интегрального и дискретного описания объектов. По этим причинам полученное выражение является оптимальным в качестве основы для построения математической модели рефлексивных АСУ активными объектами.

Численный метод расчета эластичности, основанный на системной теории информации. В работе [2] разработан численный метод АСК-анализа, включающий: иерархическую структуру данных семантической информационной модели; 24 детальных алгоритма 10 базовых когнитивных операций системного анализа, алгоритмы кластерно-конструктивного и когнитивного анализа, нечеткой логики и когнитивной графики, обеспечивающие оригинальную визуализацию результатов интеллектуального анализа данных (нечеткие графы). Предложенный численный метод АСК-анализа обеспечил конкретизацию моделей БКОСА, достаточную для их реализации в программной системе.

Программный инструментарий для расчета эластичности – универсальная когнитивная аналитическая система "Эйдос". Автором создано специальное программное обеспечение реализации базовых когнитивных операций системного анализа – Универсальная когнитивная аналитическая система "Эйдос", защищенная 4 Свидетельствами РосПатента РФ [5].

Система "Эйдос" воплощает формализуемую когнитивную концепцию, реализует предложенную семантическую информационную модель и алгоритмы базовых когнитивных операций системного анализа, и, таким образом, является специальным программным инструментарием для решения проблемы и задач, поставленных в данном исследовании. Система "Эйдос" является инструментарием системного анализа, структурированного до уровня базовых когнитивных операций. В функциях и структуре системы "Эйдос" нашли воплощение фундаментальные закономерности человеческого способа познания Реальности, связанные с функциональной асимметрией мозга и знаковых систем.

В системе "Эйдос" реализуется определенная наукоемкая технология синтеза и эксплуатации приложений системы "Эйдос", видеограммы интерфейса и технические характеристики (текущая версия системы "Эйдос-7.3" позволяет обрабатывать до 4000 будущих состояний АОУ и 4000 градаций факторов).

Технология разработки приложения в системе "Эйдос" включает: когнитивную структуризацию и формализацию предметной области (подсистема "Словари"); синтез модели (подсистема "Обучение"); оптимизацию модели (подсистема "Оптимизация"); верификацию модели (оценка степени адекватности, скорости сходимости и семантической устойчивости модели).

Технология эксплуатации приложения системы "Эйдос" в режиме адаптации и синтеза модели включает: идентификацию и прогнозирование (подсистема "Распознавание"); кластерно-конструктивный, семантический и когнитивный анализ (подсистема "Типология"); анализ достоверности, валидности, независимости (подсистема "Анализ"); средства и инструменты обеспечения надежности эксплуатации (подсистема "Сервис").

Система "Эйдос" является большой системой: листинг ее исходных текстов (вместе с системами окружения "Эйдос-фонд" и "Эйдос-Y") 6-м шрифтом составляет 731 страницу, в процессе работы система оперирует десятками баз данных (около 70).

В работах [2-4] разработана инфраструктура применения системы "Эйдос", детализированы организационные, юридические, экономические, технические и другие аспекты информационной технологии применения данной системы для решения задач синтеза рефлексивных АСУ активными объектами и эксплуатации этих АСУ в режиме адаптации и периодического синтеза модели.

Выводы. Предлагается математическая модель, основанная на системной теории информации, а также численный метод и специальный программный инструментарий (система "Эйдос"), которые позволяют создавать и эксплуатировать в режиме адаптации и периодического синтеза многофакторные информационные модели объектов информационной безопасности. На основе использования данных моделей могут быть определены точки уязвимости ОИБ и предложены комплексные меры по обеспечению необходимого уровня защищенности ОИБ от угроз.

 

Литература

1. Замков О.О., Тостопятенко А.В., Черемных Ю.Н. Математические методы в экономике: Учебник / Под общ. ред. д.э.н., проф. А.В.Сидоровича; МГУ им. М.В.Ломоносова. – 3-е изд., перераб. – М.: Издательство "Дело и Сервис", 2001.–368 с.

2. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ. 2002. – 605 с.

3. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). - Краснодар: КЮИ МВД РФ, 1996. - 280с.

4. Луценко Е.В. Автоматизированная система распознавания образов: математическая модель и опыт применения. //В сб.: "В.И. Вернадский и современность (к 130-летию со дня рождения)". - Краснодар: КНА, 1993. - С.37-42.

5. Пат. № 940217. РФ. Универсальная автоматизированная система распознавания образов "ЭЙДОС". /Е.В.Луценко (Россия); Заяв. № 940103. Опубл. 11.05.94. – 12с.

Научный электронный журнал КубГАУ . № 01(1), 2003