Научный электронный журнал КубГАУ . № 02(4), 2004



УДК 007.681.5:519.714:519.766

 

ВОЗМОЖНОСТИ ПРОГНОЗИРОВАНИЯ УЧЕБНЫХ ДОСТИЖЕНИЙ СТУДЕНТОВ НА ОСНОВЕ АСК-АНАЛИЗА ИХ ИМЕДЖЕВЫХ ФОТОРОБОТОВ



Луценко Е.В., – д.э.н., профессор

Кубанский государственный аграрный университет

 

В статье подробно описывается конкретная реализация методики прогнозирования учебных достижений студентов на основе применения математического метода автоматизированного системно-когнитивного анализа и его инструментария – универсальной когнитивной аналитической системы «Эйдос». Изложенная технология может быть применена как для реального прогнозирования учебных достижений студентов и оценки их профессиональных способностей в различных предметных областях, так и в качестве лабораторной работы при преподавании дисциплины: «Интеллектуальные информационные системы» для студентов специальностей: «Прикладная информатика в экономике» и «Прикладная информатика в юриспруденции». Изложение адаптировано для использования данной статьи в качестве руководства к лабораторной работе по данной дисциплине.

 

Краткая теория

Автоматизированный системно когнитивный анализ является новым математическим методом, который оснащен реализующим его программным инструментарием и обеспечивает решение задач мониторинга, анализа, прогнозирования и управления в самых различных предметных областях [1, 2, 3]. Универсальность метода обеспечивается тем, что он частично или полностью автоматизирует базовые когнитивные операции, к которым сводятся процессы познания.

Задачами данной работы являются:

1. Продемонстрировать студентам возможность выявления причинно-следственных связей между признаками внешнего вида (описательные шкалы и градации), и их полом, успеваемостью, тем, откуда они родом, обучением в той или иной группе (классификационные шкалы и градации).

2. Сформировать у студентов навыки формализации предметной области, подготовки и ввода обучающей выборки, синтеза информационной семантической модели и проверки ее адекватности, анализа модели (информационные портреты, кластерно-конструктивный анализ, семантические сети и когнитивные диаграммы, графическое отображение векторов классов и признаков).

Задание

1. Формализовать задачу:

– создать классификационные и описательные шкалы;

– собрать исходную фактографическую информацию и ввести в систему обучающую выборку.

2. Осуществить синтез и верификацию модели.

3. Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.

4. Провести анализ модели, дав ответы на следующие вопросы:

– как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?

– как сказывается пол на посещаемости?

– как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Успеваемость", "Посещаемость"?

– какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью;

Результаты анализа отобразить в графической форме нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для хорошо и плохо успевающих студентов.

Пример решения задания 1

Пример решения задания 1.1: Формализовать задачу: создать классификационные и описательные шкалы

Один из вариантов классификационных шкал и градаций представлен в таблице 1, а описательных – в таблице 2:

 

Таблица 1 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ И ГРАДАЦИИ
Таблица 2 – ОПИСАТЕЛЬНЫЕ ШКАЛЫ И ГРАДАЦИИ

 

Пример решения задания 1.2: Формализовать задачу: собрать исходную фактографическую информацию и ввести в систему обучающую выборку

С точки зрения методики организации занятия возможны различные варианты сбора и ввода информации обучающей выборки. Опыт проведения занятий по данной лабораторной работе показал, что с точки зрения экономии времени и обеспечения качества и единого вида обучающей выборки наиболее рациональным является вариант, приведенный ниже.

1. На доске чертится таблица вида 3. Это делается с таким расчетом, чтобы каждому присутствующему студенту группы соответствовала строка.

Таблица 3 – ШАБЛОН ДЛЯ ВВОДА ОБУЧАЮЩЕЙ ВЫБОРКИ
Код Наименование Классы Признаки
1 2 3 4 5 6 1 2 3 4 5 6 7 8 9 10 11
1                                    
2                                    
3                                    
4                                    
5                                    
6                                    
7                                    

2. Студентам дается задание с использованием классификационных и описательных шкал (таблицы 1 и 2) описать каждому самого себя и занести эту информацию в таблицу на доске. В результате на доске появляется таблица вида 4:

Таблица 4 – ПРИМЕР ЗАПОЛНЕННОГО ШАБЛОНА ДЛЯ ВВОДА ОБУЧАЮЩЕЙ ВЫБОРКИ
Код Наименование Классы Признаки
1 2 3 4 5 6 1 2 3 4 5 6 7 8 9 10 11
1 Бабенко ПИ-51 1 4 10 12 13 15 1 5 10 18 27 31          
2 Воробьева ПИ-51 2 5 10 12 13 16 3 7 12 13 18 20 25 26 27 32  
3 Гура ПИ-51 1 13 17                            
4 Гловнев ПИ-51 1 13 18                            
5 Дыбова ПИ-51 2 13 19                            
6 Жеребятьев ПИ51 1 5 8 12 13 20 2 8 10 18 21 27 30        
7 Заяц ПИ-51 2 4 10 12 13 21 3 6 12 15 18 21 26 27 31    
8 Иванова ПИ-51 2 3 7 12 13 22 2 5 12 13 14 15 18 21 26 32  
9 Котенко ПИ-51 2 4 7 12 13 23 1 6 11 13 15 18 21 26 27 32  
10 Кузина О. ПИ-51 2 3 8 12 13 24 1 7 11 14 18 22 26 27 32    
11 Кузина Я. ПИ-51 2 3 8 12 13 25 1 7 14 17 22 32          
12 Лях ПИ-51 1 3 8 12 13 26 1 5 9 13 17 18 20 24 26 27 31
13 Мясников ПИ-51 1 3 9 12 13 27 1 5 10 13 16 18 20 24 27 32 0
14 Нагапетян ПИ-51 1 4 9 12 13 28 1 6 11 15 18 21 24 26 27 30 0
15 Полонская ПИ-51 2 13 29                            
16 Трунина ПИ-51 2 13 30                            
17 Черкашина ПИ-51 2 4 10 12 13 31 3 6 11 13 18 21 24 26 27 30  
18 Чепурченко ПИ51 1 13 32                            
19 Чушкин ПИ-51 1 13 33                            
20 Шульгин ПИ-51 1 5 8 12 13 34 1 5 9 17 20 26 30        
21 Арушунян ПИ-52 1 14 35                            
22 Быченок ПИ-52 1 14 36                            
23 Веревкина ПИ-52 2 3 9 12 14 37 1 8 9 15 18 21 28 33      
24 Григорьева ПИ52 2 4 8 12 14 38 2 5 9 13 18 22 28 33      
25 Давыдич ПИ-52 2 14 39                            
26 Дронова ПИ-52 2 14 40                            
27 Еременко ПИ-52 2 4 8 12 14 41 2 5 12 9 13 15 18 21 26 27 31
28 Жмурко ПИ-52 1 14 42                            
29 Иванова ПИ-52 2 3 9 12 14 43 2 4 10 14 15 17 18 20 28 33  
30 Костенко ПИ-52 2 14 44                            
31 Крейс ПИ-52 2 4 8 12 14 45 1 5 9 15 19 21 28 32      
32 Куркина ПИ-52 2 3 8 12 14 46 3 6 11 13 15 18 19 22 26 27 32
33 Люлик ПИ-52 2 5 8 12 14 47 2 7 12 15 18 22 24 26 32    
34 Максимов ПИ-52 1 14 48                            
35 Мануйлов ПИ-52 1 3 7 12 14 49 1 5 9 14 18 20 24 25 26 27 30
36 Нарижний ПИ-52 1 3 7 12 14 50 1 5 9 14 18 20 24 25 26 27 31
37 Ольховская ПИ52 2 14 51                            
38 Паршакова ПИ-52 2 6 8 12 14 52 2 6 11 13 19 22 26 32      
39 Силенко ПИ-52 1 3 7 12 14 53 1 6 12 13 18 20 28 32      
40 Соколова ПИ-52 2 4 8 12 14 54 1 5 12 17 18 22 24 26 27 32  
41 Турбин ПИ-52 1 14 55                            
42 Цисарь ПИ-52 2 5 9 12 14 56 2 7 11 13 18 22 27 33      

 

Видно, что по ряду студентов нет описательной информации, а классификационная – минимальна. Это связано с тем, что они отсутствовали на занятиях, когда проводилась данная лабораторная работа и не участвовали в формализации предметной области и подготовке обучающей выборки.

При этом для удобства кодирования информации о себе студентами с помощью Блокнота открываются файлы:

Object.txt и Priz_per.txt из поддиректории TXT, содержащие ту же информацию, что и таблицы 1, 2.

Для правильного отображения этих файлов задается шрифт Courier New (при Windows-98) Terminal (при Windows-2000)

3. Студентам дается задание переписать эту таблицу себе в тетради и затем ввести в систему "Эйдос" в подсистеме "F2 Обучение" в режиме "Ввод-корректировка обучающей выборки".

Пример решения задания 2: Осуществить синтез и верификацию модели

Верификацию модели предлагается проверить путем расчета внутренней дифференциальной и интегральной валидности.

Для этого студентам необходимо выполнить следующие действия:

1. Скопировать обучающую выборку в распознаваемую в подсистеме: "F2 Обучение – ввод корректировка обучающей информации – F5 Об.инф.->Расп.анк. – F2 Перезапись БД распознаваемых анкет – F1 Копировать всю БД".

2. Выполнить пакетное распознавание в подсистеме: "F4 Распознавание – Пакетное распознавание – Критерий сходства [1] корреляция".

3. Измерить внутреннюю интегральную и дифференциальную валидность информационной модели в подсистеме: "F6 Анализ".

Пример решения задания 3: Оценить ценность признаков для прогнозирования. Выделить признаки, наиболее существенные для решения поставленной задачи.

В подсистеме: "F3 Оптимизация" выбрать режим: "Исключение признаков с низкой селективной силой". В результате появится экранная форма, представленная на рисунке 1:

 

Рисунок 1. Экранная форма "Селективная сила признаков"

 

Количественные значения селективной силы можно просмотреть, прокручивания экранную форму по горизонтали.

Более подробно эта информация представлена в таблице 5:

Таблица 5 – ПРИЗНАКИ (ГРАДАЦИИ ШКАЛ) В ПОРЯДКЕ УБЫВАНИЯ СЕЛЕКТИВНОЙ СИЛЫ (ИНТ.ИНФ.)

Соответствующую логистическую кривую (накопительную селективной силы) можно получит в графической форме нажав на клавишу "F8 График".

Пример решения задания 4: Провести анализ модели

Анализ модели позволяет дать обоснованные ответы, например, на следующие вопросы:

1. Как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?

2. Как сказывается пол на посещаемости?

3. Как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Успеваемость", "Посещаемость"?

4. Какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью?

Результаты анализа отобразить в графической форме нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для хорошо и плохо успевающих студентов.

Пример решения задания 4.1: Как посещаемость занятий по системам искусственного интеллекта влияет на успеваемость по этой дисциплине?

Для ответа на этот вопрос войдем в подсистему: "Типология" режим: "Типологический анализ первичных признаков – Информационные (ранговые) портреты" и установив курсор на строке с кодом 30 "Посещаемость плохая" нажмем Enter. В результате в экранной форме отобразиться информационный портер признака, т.е. состояния студентов, расположенные в порядке убывания значимости данного признака для их наступления. Однако в этой экранной форме приведены все состояния, а нас интересует только успеваемость. Успеваемость – это классификационная шкала, с кодами градаций от 7 до 10. Поэтому, чтобы отобразить только эти классы, нажмем клавиши: "F6 Фильтрация", затем "F1 Диапазон кодов" и зададим коды 7 – 10. В результате получим экранную форму, приведенную на рисунке 2:

 

Рисунок 2. Информационный портрет признака: 30 "Посещаемость плохая", фильтр по успеваемости.

 

Аналогично получим экранную форму для информационного портера признака: 32 "Посещаемость хорошая", представленную на рисунке 3.

 

Рисунок 3. Информационный портрет признака: 32 "Посещаемость хорошая", фильтр по успеваемости.

 

Из рисунков 3 и 4 видно, что плохой посещаемости соответствует низкая успеваемость, а хорошей – высокая,  как и можно было ожидать.

Эту же информацию можно получить и другим способом.

В подсистеме F6 "Анализ" запустить режим "Просмотр профилей классов и признаков" и нажать функциональную клавишу F2 "Выбор статистической матрицы" F3 "Загрузить матрицу информативностей". Затем нажать F5 "Профили 3d", F1 "Трехмерная поверхность" и задать диапазон кодов классов: 7-10 (классификационная шкала: "Успеваемость") и диапазон кодов признаков 29-33 (классификационная шкала: "Посещаемость"). После этого появится возможность настройки ориентации трехмерной системы координат, описанная в Help в системе. Выход из настройки по клавише Esc. После этого в экранных формах в виде трехмерных графиков последовательно отображаются информативности выбранной подматрицы, которые имеется возможность записать в форме PCX-файлов, пропустить или распечатать. Некоторые из этих форм представлены на рисунках 4, 5.

 

 

Рисунок 4. Некоторые варианты отображения подматрицы: классификационная шкала "Успеваемость"  ´ описательная шкала "Посещаемость" в системе "Эйдос"

Из анализа этих трехмерных графиков видно, что очень хорошая успеваемость слабо зависит от посещаемости, а низкая – сильно. На основании этого можно сформулировать гипотезу, что хорошая посещаемость может гарантировать от низкой успеваемости, но сама по себе не гарантирует высокой, для достижения которой, видимо, играют важную роль также другие факторы, например, уровень достатка. Чтобы проверить эту гипотезу в подсистеме F6 "Анализ" запустим режим "Просмотр профилей классов и признаков" и поставим курсор на класс: код 7 "Успеваемость – 5 более 75%", а затем нажмем F4 "Профили 2d", F1 "Класс распознавания" и зададим диапазон признаков, градаций описательных шкал: 24-33 (шкалы: "Достаток" и "Посещаемость"). В результате получим графическую форму, представленная на рисунке 5:

Рисунок 5. Профиль влияния описательных шкал: "Достаток" и "Посещаемость" на классификационную шкалу "Успеваемость"

 

Из этой формы видно, что хорошая посещаемость (код 32) положительно влияет на высокую успеваемость примерно также, как наличие квартиры (код 24) и компьютера (код 26), но все эти факторы вместе взятые уступают влиянию одного фактора: "Есть автомобиль" (код 25).

Пример решения задания 4.2: Как сказывается пол на посещаемости?

В подсистеме: "Типология" зайдем в режим: "Типологический анализ классов распознавания – Информационные (ранговые) портреты" и установив курсор на строке с кодом 1 "ПОЛ - мужской" нажмем Enter. В результате в экранной форме отобразиться информационный портер класса, т.е. признаки студентов, расположенные в порядке убывания характерности признаков для данного класса. Однако в этой экранной форме приведены все признаки, а нас интересует только посещаемость. Посещаемость – это описательная шкала, с кодами градаций от 29 до 33. Поэтому, чтобы отобразить только эти признаки, нажмем клавиши: "F6 Фильтрация", затем "F1 Диапазон кодов" и зададим коды 29 – 33. В результате получим экранную форму, приведенную на рисунке 6:

 

Рисунок 6. Информационный портрет класса: 1 "ПОЛ - мужской", фильтр по посещаемости.

 

Аналогично получим информационный портрет класса: код 2, "ПОЛ – женский". Результат представлен на рисунке 7:

 

Рисунок 7. Информационный портрет класса: код 2 "ПОЛ – женский", фильтр по посещаемости.

 

Из этих рисунков видно, что для ребят характерны плохая и средняя посещаемость, а для девушек – очень хорошая и хорошая. Как это сказывается на успеваемости мы уже знаем.

Пример решения задания 4.3: Как выглядят конструкты "Пол", "Город-деревня", "Учебная группа", "Посещаемость"?

Ответ на первые три вопроса дает анализ, который можно провести в подсистеме F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".

После этого выполним режим: "Генерация кластеров и конструктов классов", при следующих параметрах:

– количество уровней кластеризации – 1;

– порог модуля сходства – 0;

– диапазон кодов классов: 1-14;

– исключаем кластеры с одним классом;

– не исключаем кластеры с тождественным набором классов.

Результаты кластерно-конструктивного анализа классов можно просмотреть в режиме: "Просмотр и печать кластеров и конструктов классов" (рисунок 8), а также получить в виде TXT-файла с именем Klas_obj.txt в поддиректории TXT (таблица 6):

 

Рисунок 8. Конструкт: "Пол"
Таблица 6 – КОНСТРУКТЫ И КЛАСТЕРЫ КЛАССОВ РАСПОЗНАВАНИЯ

 

Конструкт: "Посещаемость" является конструктом градаций описательных шкал, т.е. признаков. Он генерируется в подсистеме F5 "Типология", "Типологический анализ признаков", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".

После этого выполним режим: "Генерация кластеров и конструктов признаков", при следующих параметрах:

– количество уровней кластеризации – 1;

– порог модуля сходства – 0;

– диапазон кодов классов: 1-33;

– исключаем кластеры с одним признаком;

– не исключаем кластеры с тождественным набором признаков.

Результаты кластерно-конструктивного анализа признаков  можно получить в виде TXT-файла с именем Klas_prp.txt в поддиректории TXT (таблица 7):

 

Таблица 7 – КОНСТРУКТ ПРИЗНАКОВ: "ПОСЕЩАЕМОСТЬ"
15-10-04  10:31:44  Фильтр по кодам: 1-33

 

Пример решения задания 4.4: Какие студенты являются "типичными представителями" для своих учебных групп, а какие обладают своеобразием и выраженной индивидуальностью?

Чтобы ответить на этот вопрос необходимо провести в подсистеме: F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Автоматическое выполнение: [1]-[2]-[3]".

После этого выполним режим: "Генерация кластеров и конструктов классов", при следующих параметрах:

– количество уровней кластеризации – 1;

– порог модуля сходства – 0;

– диапазон кодов классов: 13-56 (коды классов учебных групп и индивидуально студентов);

– исключаем кластеры с одним классом;

– не исключаем кластеры с тождественным набором классов.

Результаты кластерно-конструктивного анализа классов можно получить в виде TXT-файла с именем Klas_obj.txt в поддиректории TXT (таблица 8):

 

Таблица 8 – КОНСТРУКТ: "УЧЕБНАЯ ГРУППА"

 

Из таблицы 8 видно, что:

– студенты: Мясников, Черкашина, Нагапетян, Бабенко являются "типичными представителями" группы ПИ-51;

– студенты: Григорьева, Люлик, Еременко, Паршакова, Нарижний, Иванова, Цисарь являются "типичными представителями" группы ПИ-52;

– студенты: Шульгин, Куркина, Воробьева, Силенко, Иванова, Лях, Кузина О. и Кузина Я. обладают своеобразием и более ярко выраженной индивидуальностью, по сравнению с другими, т.к. они не похожи на типичных представителей ни одной группы (в рассматриваемой системе признаков).

Необходимо также отметить, что в учебной группе ПИ-51 степень разнообразия студентов в рассматриваемой системе признаков выше, чем в группе ПИ-52, что можно объяснить тем, что в 51 группе больше ребят, чем девушек и они в основном из краевого центра, а в 52 группе больше девушек и в основном они из села, как это видно из конструкта "Пол" в таблице 6.

Пример решения задания 4.5: Результаты анализа отобразить в графической форме семантических сетей классов, нелокальных нейронов и семантических сетей признаков. На их основе построить классические когнитивные карты для студентов с различной успеваемостью

Семантические сети классов отображаются на экране и записываются в форме PCX-файла в поддиректории: PCX/Klas-obj в подсистеме F5 "Типология", "Типологический анализ классов", "Кластерный и конструктивный анализ", "Вывод 2d семантических сетей классов". На рисунке 9 приведена семантическая сеть классов с кодами от 1 до 14 (обобщенные классы).

Нелокальные нейроны отображаются в подсистеме F6 "Анализ", режиме: "Графическое отображение нелокальных нейронов". Они записываются в форме PCX-файла в поддиректории: PCX/NeuroNet. На рисунке 10 приведен нелокальный нейрон: "Успеваемость: очень хорошая".

Семантическая сеть признаков отображается в подсистеме: F6 "Типология", в режиме: "Типологический анализ первичных признаков – Кластерный и конструктивный анализ – Вывод 2d семантических сетей признаков". Семантическая сеть отображается на экране и записывается в виде PCX-файла в поддиректории: PCX/Klas-att.

На рисунке 11 приведена семантическая сеть для тех признаков, у которых оказались наибольшие весовые коэффициенты в приведенном на рисунке 10 нейроне (показаны только те связи между признаками, которые оказались больше 30%):

 

Рисунок 9. Семантическая сеть классов
Рисунок 10. Нелокальный нейрон: "Успеваемость: очень хорошая"

 

Рисунок 11.  Семантическая сеть признаков, оказавшихся наиболее значимыми в нелокальном нейроне: "Успеваемость: очень хорошая"

 

Если дополнить графическое изображение нейрона на рисунке 10 связями между признаками, показанными в семантической сети на рисунке 11, то получим классическую когнитивную карту (рисунок 12).

 

Рисунок 12.  Классическая когнитивная карта: "Успеваемость: очень хорошая", рассчитываемая и отображаемая в системе "Эйдос"

 

Таким образом, метод, технология и инструментарий АСК-анализа система "Эйдос" обеспечивает автоматизированное получение когнитивных карт.

Судя по литературным данным и информации, размещенной в Internet, в настоящее время система "Эйдос" является единственной системой, обеспечивающей автоматизированный расчет и графическое отображение семантических сетей классов и факторов, прямых и инвертированных когнитивных диаграмм, нелокальных нейронов, Паретто-подмножеств нейронных сетей, а теперь и прямых и инвертированных классических когнитивных карт и интегральных когнитивных карт.

Студентам это предлагается получить когнитивные карты для других уровней успеваемости.

Выводы

Имеется техническая возможность прогнозирования учебных достижений студентов на основе применения математического метода автоматизированного системно-когнитивного анализа и его инструментария – Универсальной автоматизированной системы «Эйдос».

Изложенная технология может быть применена как для реального прогнозирования учебных достижений студентов и оценки их профессиональных способностей в различных предметных областях, если руководством будет принято соответствующее решение, так и в качестве лабораторной работы при преподавании дисциплины: «Интеллектуальные информационные системы» для студентов специальностей: «Прикладная информатика в экономике» и «Прикладная информатика в юриспруденции».

 

Список литературы

1.   Луценко Е.В. Теоретические основы и технология адаптивного семантического анализа в поддержке принятия решений (на примере универсальной автоматизированной системы распознавания образов "ЭЙДОС-5.1"). – Краснодар: КЮИ МВД РФ, 1996. – 280с.

2.   Луценко Е.В. Автоматизированный системно-когнитивный анализ в управлении активными объектами (системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем): Монография (научное издание). –Краснодар: КубГАУ. 2002. –605 с.

3.   Пат. № 2003610986 РФ. Универсальная когнитивная аналитическая система "ЭЙДОС"  / Е.В.Луценко (Россия); Заяв. № 2003610510 РФ. Опубл. от 22.04.2003. – 50с.

Научный электронный журнал КубГАУ . № 02(4), 2004