Научный электронный журнал КубГАУ . № 05(7), 2004 УДК 574.5+578.087.1+51.001.572 СИНТЕЗ, ОПТИМИЗАЦИЯ И ВЕРИФИКАЦИЯ СЕМАНТИЧЕСКОЙ ИНФОРМАЦИОННОЙ МОДЕЛИ УПРАВЛЕНИЯ КАЧЕСТВОМ ГРУНТОВЫХ ВОД НА РИСОВЫХ ОРОСИТЕЛЬНЫХ СИСТЕМАХ Сафронова Т.И. – к. т. н., доцент Луценко Е.В. – д. э. н., к. т. н., профессор Кубанский государственный аграрный университет В статье описывается порядок синтеза, оптимизации и верификации семантической информационной модели управления минерализацией и уровнем грунтовых вод. 1. Синтез семантической информационной модели Проблема исследования, её актуальность, идея решения, когнитивная структуризация и формализация задачи приведены в [2, 3]. База прецедентов используется в системе "Эйдос" для автоматического расчета статистических матриц, входящих в состав семантической информационной модели: – матрицы частот фактов, т.е. сочетаний "значение фактора – состояние МиУГВ"; – матрицы информативностей, содержащей сведения о силе и направлении действия факторов. Эти матрицы здесь не приводятся из-за их большой размерности. Подробно соответствующие подсистемы и режимы системы "Эйдос" описаны в работе [1].
2. Оптимизация семантической информационной модели На этом этапе осуществляется: 1. Ранжирование всех факторов по средней силе их влияния на переход МиУГВ в те или иные будущие состояния. 2. Исключение из модели МиУГВ тех факторов, которые несущественно влияют на его поведение (Парето-оптимизация). Во 2-м режиме 3-й подсистемы "Эйдос" генерируется и печатается отчет по степени влияния градаций факторов на поведение оросительной системы (табл. 1). Таблица 1 – Градации
описательных шкал (значения факторов)
в порядке убывания средней силы влияния на поведение оросительной системы
(фрагмент)
Из таблицы 1 видно, что 28 % наиболее значимых факторов оказывает 50 % суммарного влияния на поведение оросительной системы и урожаи риса, 50 % факторов оказывает примерно 80 % суммарного влияния на поведение этой системы, а 28 % незначительных факторов вообще не оказывает на нее никакого влияния. На рисунке приведена Парето-диаграмма ценности факторов. В начале диаграммы расположены признаки с высоким влиянием, а в конце видна характерная "полочка", соответствующая признакам, не оказывающим никакого влияния на поведение оросительной системы и урожаи риса.
Из таблицы 1 следует, что исключение из модели половины признаков практически не скажется на ее адекватности, но существенно уменьшит затраты различных ресурсов на сбор и обработку информации. 3. Проверка адекватности (верификация) семантической информационной модели Оценка адекватности включает в себя проверку способности модели правильно осуществлять идентификацию состояний МиУГВ как входящих в базу прецедентов (внутренняя валидность), так и не входящих в нее (внешняя валидность), как средневзвешенную по всем будущим состояниям МиУГВ (интегральная валидность), так и в разрезе по конкретным состояниям (дифференциальная валидность) [1]. Если модель обладает достаточно высокой адекватностью, то ее корректно использовать для анализа и исследования моделируемого объекта, прогнозирования его поведения при воздействии на него различных сочетаний факторов и для управления ими. Результаты измерения адекватности модели, т.е. верификации, представлены в таблице 2. Таблица 2 – Результаты измерения адекватности
семантической информационной модели
Анкет физических: 21 логических (всего/факт): 112/ 112 Верная идентификация: 106 Ошибочная неидентификация: 6 Верная идентификация: 94.64% Ошибочная неидентификация: 5.36% Минимальный уровень сходства: 0.0 Максимальное кол-во классов: 99999 Графы в таблице 2 имеют следующий смысл. "Всего логических анкет" – это количество анкет (примеров текстов) в обучающей выборке, на основе которых формировался образ данного класса. "Идентифицировано верно" – это количество анкет обучающей выборки, которые идентифицированы как классы, к которым они действительно относятся. "Идентифицировано ошибочно" – это количество анкет обучающей выборки, которые идентифицированы как классы, к которым они в действительности не относятся (ошибка идентификации). "Неидентифицировано верно" – это количество анкет обучающей выборки, которые неидентифицированы как классы, к которым они действительно не относятся. "Неидентифицировано ошибочно" – это количество анкет обучающей выборки, которые неидентифицированы как классы, к которым они в действительности относятся (ошибка неидентфикации). В правой части формы приведены те же показатели, но в процентом выражении: – для анкет, идентифицированных верно и неидентифицированных ошибочно, за 100 % принимается количество логических анкет обучающей выборки по данному классу; – для анкет, идентифицированных ошибочно и неидентифицированных верно, за 100 % принимается суммарное количество логических анкет обучающей выборки за вычетом логических анкет по данному классу. Из анализа таблицы 2 можно сделать вывод, что созданная семантическая информационная модель МиУГВ обладает достаточно высокой адекватностью, чтобы выводы, сделанные на основе ее исследования, можно было корректно отнести к объекту моделирования.
Список литературы 1. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). – Краснодар: КубГАУ, 2002. – 605 с. 2. Сафронова Т.И., Луценко Е.В. Проблема управления качеством грунтовых вод на рисовых оросительных системах и концепция ее решения // Научный журнал КубГАУ. – 2004. – №5(7). – 9 с. – http://ej.kubagro.ru. 3. Сафронова Т.И., Луценко Е.В. Когнитивная структуризация и формализация задачи управления минерализацией и уровнем грунтовых вод на рисовых оросительных системах // Научный журнал КубГАУ. – 2004. – №5(7). – 15 с. – http://ej.kubagro.ru. 4. Пат. № 2003610986 РФ. Универсальная когнитивная аналитическая система "ЭЙДОС" / Е.В. Луценко (Россия); Заяв. № 2003610510 РФ. Опубл. от 22.04.2003. – 50 с. 5. Сафронова Т.И. Гидрогеологическое обоснование мероприятий по охране подземных вод // Труды Российской ассоциации "Женщины-математики". Воронеж, 2002. – С. 92–95. |
||
Научный электронный журнал КубГАУ . № 05(7), 2004 |