УДК 574.5+578.087.1+51.001.572
СИНТЕЗ, ОПТИМИЗАЦИЯ И ВЕРИФИКАЦИЯ СЕМАНТИЧЕСКОЙ ИНФОРМАЦИОННОЙ МОДЕЛИ УПРАВЛЕНИЯ
КАЧЕСТВОМ ГРУНТОВЫХ ВОД НА РИСОВЫХ ОРОСИТЕЛЬНЫХ СИСТЕМАХ
Сафронова Т.И. – к. т. н., доцент
Луценко Е.В. – д. э. н., к. т. н., профессор
Кубанский государственный аграрный
университет
В статье описывается порядок синтеза,
оптимизации и верификации семантической информационной модели управления
минерализацией и уровнем грунтовых вод.
1. Синтез
семантической информационной модели
Проблема исследования, её
актуальность, идея решения, когнитивная структуризация и формализация задачи
приведены в [2, 3].
База прецедентов используется в системе "Эйдос" для
автоматического расчета
статистических матриц, входящих в состав семантической информационной модели:
– матрицы частот фактов, т.е. сочетаний "значение
фактора – состояние МиУГВ";
– матрицы информативностей, содержащей сведения о силе и направлении
действия факторов.
Эти матрицы здесь не приводятся из-за их большой
размерности. Подробно соответствующие подсистемы и режимы системы
"Эйдос" описаны в работе [1].
2.
Оптимизация семантической информационной модели
На этом этапе осуществляется:
1. Ранжирование всех факторов по средней силе их влияния на
переход МиУГВ в те или иные будущие состояния.
2. Исключение из модели МиУГВ тех факторов, которые несущественно
влияют на его поведение (Парето-оптимизация).
Во 2-м режиме 3-й подсистемы "Эйдос" генерируется и
печатается отчет по степени влияния градаций факторов на поведение оросительной
системы (табл. 1).
Таблица 1 – Градации
описательных шкал (значения факторов)
в порядке убывания средней силы влияния на поведение оросительной системы
(фрагмент)
Из таблицы 1 видно, что 28 % наиболее значимых факторов
оказывает 50 % суммарного влияния на поведение оросительной системы и урожаи риса,
50 % факторов оказывает примерно 80 % суммарного влияния на поведение
этой системы, а 28 % незначительных факторов вообще не оказывает на нее
никакого влияния.
На рисунке приведена Парето-диаграмма ценности факторов. В начале
диаграммы расположены признаки с высоким влиянием, а в конце видна характерная
"полочка", соответствующая признакам, не оказывающим никакого влияния
на поведение оросительной системы и урожаи риса.
 |
Парето-диаграмма ценности факторов
|
Из таблицы 1 следует, что исключение из модели половины признаков
практически не скажется на ее адекватности, но существенно уменьшит затраты
различных ресурсов на сбор и обработку информации.
3.
Проверка адекватности (верификация) семантической информационной модели
Оценка адекватности включает в себя проверку способности
модели правильно осуществлять идентификацию состояний МиУГВ как входящих в базу
прецедентов (внутренняя валидность), так и не входящих в нее (внешняя
валидность), как средневзвешенную по всем будущим состояниям МиУГВ
(интегральная валидность), так и в разрезе по конкретным состояниям
(дифференциальная валидность) [1].
Если модель обладает достаточно высокой адекватностью, то ее
корректно использовать для анализа и исследования моделируемого объекта,
прогнозирования его поведения при воздействии на него различных сочетаний
факторов и для управления ими.
Результаты измерения адекватности модели, т.е. верификации,
представлены в таблице 2.
Таблица 2 – Результаты измерения адекватности
семантической информационной модели
Анкет физических: 21 логических
(всего/факт): 112/ 112
Верная идентификация: 106
Ошибочная неидентификация: 6
Верная идентификация: 94.64%
Ошибочная неидентификация: 5.36%
Минимальный уровень сходства: 0.0
Максимальное кол-во классов: 99999
Графы в таблице 2 имеют следующий смысл.
"Всего логических анкет" –
это количество анкет (примеров текстов) в обучающей выборке, на основе которых
формировался образ данного класса.
"Идентифицировано верно" –
это количество анкет обучающей выборки, которые идентифицированы как классы, к
которым они действительно относятся.
"Идентифицировано ошибочно"
– это количество анкет обучающей выборки, которые идентифицированы как классы,
к которым они в действительности не относятся (ошибка идентификации).
"Неидентифицировано верно" –
это количество анкет обучающей выборки, которые неидентифицированы как классы,
к которым они действительно не относятся.
"Неидентифицировано ошибочно"
– это количество анкет обучающей выборки, которые неидентифицированы как
классы, к которым они в действительности относятся (ошибка неидентфикации).
В правой части формы приведены те же показатели, но
в процентом выражении:
– для анкет, идентифицированных верно и
неидентифицированных ошибочно, за 100 % принимается количество логических анкет
обучающей выборки по данному классу;
– для анкет, идентифицированных ошибочно и неидентифицированных
верно, за 100 % принимается суммарное количество логических анкет обучающей
выборки за вычетом логических анкет по данному классу.
Из анализа таблицы 2 можно сделать вывод, что
созданная семантическая информационная модель МиУГВ обладает достаточно высокой
адекватностью, чтобы выводы, сделанные на основе ее исследования, можно было
корректно отнести к объекту моделирования.
Список литературы
1. Луценко Е.В. Автоматизированный
системно-когнитивный анализ в управлении активными объектами (системная теория
информации и ее применение в исследовании экономических,
социально-психологических, технологических и организационно-технических
систем): Монография (научное издание). – Краснодар: КубГАУ, 2002. – 605 с.
2.
Сафронова Т.И., Луценко Е.В. Проблема управления качеством грунтовых вод на
рисовых оросительных системах и концепция ее решения // Научный журнал КубГАУ.
– 2004. – №5(7). – 9 с. – http://ej.kubagro.ru.
3. Сафронова Т.И.,
Луценко Е.В. Когнитивная структуризация и формализация задачи управления
минерализацией и уровнем грунтовых вод на рисовых оросительных системах //
Научный журнал КубГАУ. – 2004. – №5(7). – 15 с. – http://ej.kubagro.ru.
4. Пат. № 2003610986 РФ. Универсальная когнитивная
аналитическая система "ЭЙДОС" / Е.В. Луценко (Россия); Заяв. №
2003610510 РФ. Опубл. от 22.04.2003. – 50 с.
5. Сафронова Т.И. Гидрогеологическое обоснование
мероприятий по охране подземных вод // Труды Российской ассоциации
"Женщины-математики". Воронеж, 2002. – С. 92–95.
|