Научный электронный журнал КубГАУ . № 02(4), 2004 УДК 007.681.5:519.714:519.766
ВОЗМОЖНОСТИ ПРОГНОЗИРОВАНИЯ УЧЕБНЫХ ДОСТИЖЕНИЙ СТУДЕНТОВ НА ОСНОВЕ АСК-АНАЛИЗА ИХ ИМЕДЖЕВЫХ ФОТОРОБОТОВ Луценко Е.В., – д.э.н., профессор Кубанский государственный аграрный университет
В статье подробно описывается конкретная реализация методики прогнозирования учебных достижений студентов на основе применения математического метода автоматизированного системно-когнитивного анализа и его инструментария – универсальной когнитивной аналитической системы «Эйдос». Изложенная технология может быть применена как для реального прогнозирования учебных достижений студентов и оценки их профессиональных способностей в различных предметных областях, так и в качестве лабораторной работы при преподавании дисциплины: «Интеллектуальные информационные системы» для студентов специальностей: «Прикладная информатика в экономике» и «Прикладная информатика в юриспруденции». Изложение адаптировано для использования данной статьи в качестве руководства к лабораторной работе по данной дисциплине.
Краткая теория Автоматизированный системно когнитивный анализ является новым математическим методом, который оснащен реализующим его программным инструментарием и обеспечивает решение задач мониторинга, анализа, прогнозирования и управления в самых различных предметных областях [1, 2, 3]. Универсальность метода обеспечивается тем, что он частично или полностью автоматизирует базовые когнитивные операции, к которым сводятся процессы познания. Задачами данной работы являются: 1. Продемонстрировать студентам возможность выявления причинно-следственных связей между признаками внешнего вида (описательные шкалы и градации), и их полом, успеваемостью, тем, откуда они родом, обучением в той или иной группе (классификационные шкалы и градации). 2. Сформировать у студентов навыки формализации предметной области, подготовки и ввода обучающей выборки, синтеза информационной семантической модели и проверки ее адекватности, анализа модели (информационные портреты, кластерно-конструктивный анализ, семантические сети и когнитивные диаграммы, графическое отображение векторов классов и признаков). Задание 1. Формализовать задачу: – создать классификационные и описательные шкалы; – собрать исходную фактографическую информацию и ввести в систему обучающую выборку. 2. Осуществить синтез и верификацию модели. 3. Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи. 4. Провести анализ модели, дав ответы на следующие вопросы: – как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине? – как сказывается пол на посещаемости? – как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Успеваемость", "Посещаемость"? – какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью; Результаты анализа отобразить в графической форме нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для хорошо и плохо успевающих студентов. Пример решения задания 1Пример решения задания 1.1: Формализовать задачу: создать классификационные и описательные шкалыОдин из вариантов классификационных шкал и градаций представлен в таблице 1, а описательных – в таблице 2:
Таблица 1 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ
Таблица 2 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ
Пример решения задания 1.2: Формализовать задачу: собрать исходную фактографическую информацию и ввести в систему обучающую выборкуС точки зрения методики организации занятия возможны различные варианты сбора и ввода информации обучающей выборки. Опыт проведения занятий по данной лабораторной работе показал, что с точки зрения экономии времени и обеспечения качества и единого вида обучающей выборки наиболее рациональным является вариант, приведенный ниже. 1. На доске чертится таблица вида 3. Это делается с таким расчетом, чтобы каждому присутствующему студенту группы соответствовала строка. Таблица 3 – ШАБЛОН ДЛЯ ВВОДА ОБУЧАЮЩЕЙ ВЫБОРКИ
2. Студентам дается задание с использованием классификационных и описательных шкал (таблицы 1 и 2) описать каждому самого себя и занести эту информацию в таблицу на доске. В результате на доске появляется таблица вида 4: Таблица 4 – ПРИМЕР ЗАПОЛНЕННОГО ШАБЛОНА ДЛЯ ВВОДА ОБУЧАЮЩЕЙ
ВЫБОРКИ
Видно, что по ряду студентов нет описательной информации, а классификационная – минимальна. Это связано с тем, что они отсутствовали на занятиях, когда проводилась данная лабораторная работа и не участвовали в формализации предметной области и подготовке обучающей выборки. При этом для удобства кодирования информации о себе студентами с помощью Блокнота открываются файлы: Object.txt и Priz_per.txt из поддиректории TXT, содержащие ту же информацию, что и таблицы 1, 2. Для правильного отображения этих файлов задается шрифт Courier New (при Windows-98) Terminal (при Windows-2000) 3. Студентам дается задание переписать эту таблицу себе в тетради и затем ввести в систему "Эйдос" в подсистеме "F2 Обучение" в режиме "Ввод-корректировка обучающей выборки". Пример решения задания 2: Осуществить синтез и верификацию моделиВерификацию модели предлагается проверить путем расчета внутренней дифференциальной и интегральной валидности. Для этого студентам необходимо выполнить следующие действия: 1. Скопировать обучающую выборку в распознаваемую в подсистеме: "F2 Обучение – ввод корректировка обучающей информации – F5 Об.инф.->Расп.анк. – F2 Перезапись БД распознаваемых анкет – F1 Копировать всю БД". 2. Выполнить пакетное распознавание в подсистеме: "F4 Распознавание – Пакетное распознавание – Критерий сходства [1] корреляция". 3. Измерить внутреннюю интегральную и дифференциальную валидность информационной модели в подсистеме: "F6 Анализ". Пример решения задания 3: Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.В подсистеме: "F3 Оптимизация" выбрать режим: "Исключение признаков с низкой селективной силой". В результате появится экранная форма, представленная на рисунке 1:
Количественные значения селективной силы можно просмотреть, прокручивания экранную форму по горизонтали. Более подробно эта информация представлена в таблице 5: Таблица 5 – ПРИЗНАКИ (ГРАДАЦИИ ШКАЛ) В ПОРЯДКЕ УБЫВАНИЯ
СЕЛЕКТИВНОЙ СИЛЫ (ИНТ.ИНФ.)
Соответствующую логистическую кривую (накопительную селективной силы) можно получит в графической форме нажав на клавишу "F8 График". Пример решения задания 4: Провести анализ моделиАнализ модели позволяет дать обоснованные ответы, например, на следующие вопросы: 1. Как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине? 2. Как сказывается пол на посещаемости? 3. Как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Успеваемость", "Посещаемость"? 4. Какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью? Результаты анализа отобразить в графической форме нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для хорошо и плохо успевающих студентов. Пример решения задания 4.1: Как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?Для ответа на этот вопрос войдем в подсистему: "Типология" режим: "Типологический анализ первичных признаков – Информационные (ранговые) портреты" и установив курсор на строке с кодом 30 "Посещаемость плохая" нажмем Enter. В результате в экранной форме отобразиться информационный портер признака, т.е. состояния студентов, расположенные в порядке убывания значимости данного признака для их наступления. Однако в этой экранной форме приведены все состояния, а нас интересует только успеваемость. Успеваемость – это классификационная шкала, с кодами градаций от 7 до 10. Поэтому, чтобы отобразить только эти классы, нажмем клавиши: "F6 Фильтрация", затем "F1 Диапазон кодов" и зададим коды 7 – 10. В результате получим экранную форму, приведенную на рисунке 2:
Аналогично получим экранную форму для информационного портера признака: 32 "Посещаемость хорошая", представленную на рисунке 3.
Из рисунков 3 и 4 видно, что плохой посещаемости соответствует низкая успеваемость, а хорошей – высокая, как и можно было ожидать. Эту же информацию можно получить и другим способом. В подсистеме F6 "Анализ" запустить режим "Просмотр профилей классов и признаков" и нажать функциональную клавишу F2 "Выбор статистической матрицы" F3 "Загрузить матрицу информативностей". Затем нажать F5 "Профили 3d", F1 "Трехмерная поверхность" и задать диапазон кодов классов: 7-10 (классификационная шкала: "Успеваемость") и диапазон кодов признаков 29-33 (классификационная шкала: "Посещаемость"). После этого появится возможность настройки ориентации трехмерной системы координат, описанная в Help в системе. Выход из настройки по клавише Esc. После этого в экранных формах в виде трехмерных графиков последовательно отображаются информативности выбранной подматрицы, которые имеется возможность записать в форме PCX-файлов, пропустить или распечатать. Некоторые из этих форм представлены на рисунках 4, 5.
Из анализа этих трехмерных графиков видно, что очень хорошая успеваемость слабо зависит от посещаемости, а низкая – сильно. На основании этого можно сформулировать гипотезу, что хорошая посещаемость может гарантировать от низкой успеваемости, но сама по себе не гарантирует высокой, для достижения которой, видимо, играют важную роль также другие факторы, например, уровень достатка. Чтобы проверить эту гипотезу в подсистеме F6 "Анализ" запустим режим "Просмотр профилей классов и признаков" и поставим курсор на класс: код 7 "Успеваемость – 5 более 75%", а затем нажмем F4 "Профили 2d", F1 "Класс распознавания" и зададим диапазон признаков, градаций описательных шкал: 24-33 (шкалы: "Достаток" и "Посещаемость"). В результате получим графическую форму, представленная на рисунке 5:
Из этой формы видно, что хорошая посещаемость (код 32) положительно влияет на высокую успеваемость примерно также, как наличие квартиры (код 24) и компьютера (код 26), но все эти факторы вместе взятые уступают влиянию одного фактора: "Есть автомобиль" (код 25). Пример решения задания 4.2: Как сказывается пол на посещаемости?В подсистеме: "Типология" зайдем в режим: "Типологический анализ классов распознавания – Информационные (ранговые) портреты" и установив курсор на строке с кодом 1 "ПОЛ - мужской" нажмем Enter. В результате в экранной форме отобразиться информационный портер класса, т.е. признаки студентов, расположенные в порядке убывания характерности признаков для данного класса. Однако в этой экранной форме приведены все признаки, а нас интересует только посещаемость. Посещаемость – это описательная шкала, с кодами градаций от 29 до 33. Поэтому, чтобы отобразить только эти признаки, нажмем клавиши: "F6 Фильтрация", затем "F1 Диапазон кодов" и зададим коды 29 – 33. В результате получим экранную форму, приведенную на рисунке 6:
Аналогично получим информационный портрет класса: код 2, "ПОЛ – женский". Результат представлен на рисунке 7:
Из этих рисунков видно, что для ребят характерны плохая и средняя посещаемость, а для девушек – очень хорошая и хорошая. Как это сказывается на успеваемости мы уже знаем. Пример решения задания 4.3: Как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Посещаемость"?Ответ на первые три вопроса дает анализ, который можно провести в подсистеме F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]". После этого выполним режим: "Генерация кластеров и конструктов классов", при следующих параметрах: – количество уровней кластеризации – 1; – порог модуля сходства – 0; – диапазон кодов классов: 1-14; – исключаем кластеры с одним классом; – не исключаем кластеры с тождественным набором классов. Результаты кластерно-конструктивного анализа классов можно просмотреть в режиме: "Просмотр и печать кластеров и конструктов классов" (рисунок 8), а также получить в виде TXT-файла с именем Klas_obj.txt в поддиректории TXT (таблица 6):
Таблица 6 – КОНСТРУКТЫ И КЛАСТЕРЫ КЛАССОВ РАСПОЗНАВАНИЯ
Конструкт: "Посещаемость" является конструктом градаций описательных шкал, т.е. признаков. Он генерируется в подсистеме F5 "Типология", "Типологический анализ признаков", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]". После этого выполним режим: "Генерация кластеров и конструктов признаков", при следующих параметрах: – количество уровней кластеризации – 1; – порог модуля сходства – 0; – диапазон кодов классов: 1-33; – исключаем кластеры с одним признаком; – не исключаем кластеры с тождественным набором признаков. Результаты кластерно-конструктивного анализа признаков можно получить в виде TXT-файла с именем Klas_prp.txt в поддиректории TXT (таблица 7):
Таблица 7 – КОНСТРУКТ ПРИЗНАКОВ: "ПОСЕЩАЕМОСТЬ"
15-10-04 10:31:44 Фильтр по кодам: 1-33
Пример решения задания 4.4: Какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью?Чтобы ответить на этот вопрос необходимо провести в подсистеме: F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]". После этого выполним режим: "Генерация кластеров и конструктов классов", при следующих параметрах: – количество уровней кластеризации – 1; – порог модуля сходства – 0; – диапазон кодов классов: 13-56 (коды классов учебных групп и индивидуально студентов); – исключаем кластеры с одним классом; – не исключаем кластеры с тождественным набором классов. Результаты кластерно-конструктивного анализа классов можно получить в виде TXT-файла с именем Klas_obj.txt в поддиректории TXT (таблица 8):
Таблица 8 – КОНСТРУКТ: "УЧЕБНАЯ ГРУППА"
Из таблицы 8 видно, что: – студенты: Мясников, Черкашина, Нагапетян, Бабенко являются "типичными представителями" группы ПИ-51; – студенты: Григорьева, Люлик, Еременко, Паршакова, Нарижний, Иванова, Цисарь являются "типичными представителями" группы ПИ-52; – студенты: Шульгин, Куркина, Воробьева, Силенко, Иванова, Лях, Кузина О. и Кузина Я. обладают своеобразием и более ярко выраженной индивидуальностью, по сравнению с другими, т.к. они не похожи на типичных представителей ни одной группы (в рассматриваемой системе признаков). Необходимо также отметить, что в учебной группе ПИ-51 степень разнообразия студентов в рассматриваемой системе признаков выше, чем в группе ПИ-52, что можно объяснить тем, что в 51 группе больше ребят, чем девушек и они в основном из краевого центра, а в 52 группе больше девушек и в основном они из села, как это видно из конструкта "Пол" в таблице 6. Пример решения задания 4.5: Результаты анализа отобразить в графической форме семантических сетей классов, нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для студентов с различной успеваемостьюСемантические сети классов отображаются на экране и записываются в форме PCX-файла в поддиректории: PCX/Klas-obj в подсистеме F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Вывод 2d семантических сетей классов". На рисунке 9 приведена семантическая сеть классов с кодами от 1 до 14 (обобщенные классы). Нелокальные нейроны отображаются в подсистеме F6 "Анализ", режиме: "Графическое отображение нелокальных нейронов". Они записываются в форме PCX-файла в поддиректории: PCX/NeuroNet. На рисунке 10 приведен нелокальный нейрон: "Успеваемость: очень хорошая". Семантическая сеть признаков отображается в подсистеме: F6 "Типология", в режиме: "Типологический анализ первичных признаков – Кластерный и конструктивный анализ – Вывод 2d семантических сетей признаков". Семантическая сеть отображается на экране и записывается в виде PCX-файла в поддиректории: PCX/Klas-att. На рисунке 11 приведена семантическая сеть для тех признаков, у которых оказались наибольшие весовые коэффициенты в приведенном на рисунке 10 нейроне (показаны только те связи между признаками, которые оказались больше 30%):
Если дополнить графическое изображение нейрона на рисунке 10 связями между признаками, показанными в семантической сети на рисунке 11, то получим классическую когнитивную карту (рисунок 12).
Таким образом, метод, технология и инструментарий АСК-анализа система "Эйдос" обеспечивает автоматизированное получение когнитивных карт. Судя по литературным данным и информации, размещенной в Internet, в настоящее время система "Эйдос" является единственной системой, обеспечивающей автоматизированный расчет и графическое отображение семантических сетей классов и факторов, прямых и инвертированных когнитивных диаграмм, нелокальных нейронов, Паретто-подмножеств нейронных сетей, а теперь и прямых и инвертированных классических когнитивных карт и интегральных когнитивных карт. Студентам это предлагается получить когнитивные карты для других уровней успеваемости. ВыводыИмеется техническая возможность прогнозирования учебных достижений студентов на основе применения математического метода автоматизированного системно-когнитивного анализа и его инструментария – Универсальной автоматизированной системы «Эйдос». Изложенная технология может быть применена как для реального прогнозирования учебных достижений студентов и оценки их профессиональных способностей в различных предметных областях, если руководством будет принято соответствующее решение, так и в качестве лабораторной работы при преподавании дисциплины: «Интеллектуальные информационные системы» для студентов специальностей: «Прикладная информатика в экономике» и «Прикладная информатика в юриспруденции».
Список литературы 1. Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). – Краснодар: КЮИ МВД РФ, 1996. – 280с. 2. Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). –Краснодар: КубГАУ. 2002. –605 с. 3. Пат. № 2003610986 РФ. Универсальная когнитивная аналитическая система "ЭЙДОС" / Е.В.Луценко (Россия); Заяв. № 2003610510 РФ. Опубл. от 22.04.2003. – 50с. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Научный электронный журнал КубГАУ . № 02(4), 2004 |