Главная
страница 1
Нижегородский Государственный Технический Университет

Кафедра электроники и сети ЭВМ


Лабораторная работа №4


«Методы интеллектуального анализа данных.

Обнаружение логических закономерностей на основе деревьев решений»


Выполнил: студент гр. 04-ИСТ

Шейков А.А.

Н.Новгород 2009г.



Лабораторная работа №4

Методы интеллектуального анализа данных. Обнаружение логических закономерностей на основе деревьев решений.

1) Файл данных

Выявление зависимости величины IQ (FIQ) от биометрических параметров:



  • CCMIDSA: Corpus Collasum Surface Area (cm2)

  • Head Circumference (cm) – Окружность головы

  • SEX – Пол (Female – женский, Male - мужской)

  • TOTSA: Total Surface Area (cm2) – Общая площадь головы

  • TOTVOL: Total Brain Volume (cm3) – Общий объем мозга

  • WEIGHT: Body Weight (kg) – Вес тела

d:\учеба\2009\алексей\лаб4\1.png

2) Загрузка данных в программный комплекс Deductor Studio Lite 4.2

Шаг 1: Выбор типа файла с данными)

d:\учеба\2009\алексей\лаб4\2.png

Шаг 2: Импорт текстового файла:

d:\учеба\2009\алексей\лаб4\3.png

Шаг 3: Параметры открытия текстового файла

d:\учеба\2009\алексей\лаб4\4.png

Шаг 4: Установка параметров столбцов. Все кроме FIQ устанавливаются как Входные, Вещественные, Непрерывные (Столбец SEX – Входной, Строковый); FIQ – Выходной, Целый, Непрерывные

d:\учеба\2009\алексей\лаб4\5.png

Шаг 5: Обработка данных

d:\учеба\2009\алексей\лаб4\6.png

Шаг 6: Выбор способа отображения данных

d:\учеба\2009\алексей\лаб4\7.png

Шаг 7: Установка заголовка окна с данными

d:\учеба\2009\алексей\лаб4\8.png

3) Предобработка данных
Необходимо провести предобработку исходной таблицы:

  1. Очистить данные (цель: избавиться от дубликатов и противоречий)

d:\учеба\2009\алексей\лаб4\9.png
При проверке на дубликаты и противоречия обнаружено 2 дубликата:

d:\учеба\2009\алексей\лаб4\10.png

Таблица после очистки от дубликатов:



d:\учеба\2009\алексей\лаб4\11.png


  1. Трансформация данных. Для построения дерева решений необходимо преобразовать столбец FIQ – выполнить Квантование – Преобразование непрерывных значений в дискретные (от 2 до 5 интервалов)

d:\учеба\2009\алексей\лаб4\12.png

Таблица после квантования на 5 интервалов.



d:\учеба\2009\алексей\лаб4\13.png
4) Обработка данных с помощью методов ИАД

Построение дерева решений. Строиться ДР для исходных данных полученных в результате квантования на 5 интервалов.



d:\учеба\2009\алексей\лаб4\14.png

d:\учеба\2009\алексей\лаб4\15.png


5) Построение карты Кохонена на основе файла «Физ. или Лир. тип личности»

Проведем те же построения: квантование на 2 категории по графе «физ или лир»



d:\учеба\2009\алексей\лаб4\18.png

Построим дерево решений:


d:\учеба\2009\алексей\лаб4\19.png

Построим карты Кохонена:


d:\учеба\2009\алексей\лаб4\20.png

Построение 2х2 таблиц сопряженности:


Правило №1


Условие

Следствие




Истинно,

Ложно,




Истинно,

1

1

2

Ложно,

0

12

12




1

13

14

Выполнение расчета характеристик правил:



Точность правила



Полнота правила



Поддержка правила



Мультипликативная свертка

,

Критерий Пирсона-Фишера. Позволяет проверить гипотезу о независимости двух случайных категориальных переменных. Правила, характеризующиеся большей величиной, оказываются статистически более значимыми



Степень логической достаточности



Мера различия



Полезность. Эффективность правил можно определить с позиций теории полезности. Предположим, что за правильно определенный класс объекта следует вознаграждение +1, а за ошибку -1. Причем правило применяется только в том случае, если условие является истинным.


Правило №2




Условие

Следствие




Истинно,

Ложно,




Истинно,

2

0

2

Ложно,

1

4

5




3

4

7

Выполнение расчета характеристик правил:



Точность правила



Полнота правила



Поддержка правила



Мультипликативная свертка

,

Критерий Пирсона-Фишера. Позволяет проверить гипотезу о независимости двух случайных категориальных переменных. Правила, характеризующиеся большей величиной, оказываются статистически более значимыми



Степень логической достаточности



Мера различия



Полезность. Эффективность правил можно определить с позиций теории полезности. Предположим, что за правильно определенный класс объекта следует вознаграждение +1, а за ошибку -1. Причем правило применяется только в том случае, если условие является истинным.



Правило №3




Условие

Следствие




Истинно,

Ложно,




Истинно,

3

0

3

Ложно,

1

1

2




4

1

5

Выполнение расчета характеристик правил:



Точность правила



Полнота правила



Поддержка правила



Мультипликативная свертка

,

Критерий Пирсона-Фишера. Позволяет проверить гипотезу о независимости двух случайных категориальных переменных. Правила, характеризующиеся большей величиной, оказываются статистически более значимыми



Степень логической достаточности



Мера различия



Полезность. Эффективность правил можно определить с позиций теории полезности. Предположим, что за правильно определенный класс объекта следует вознаграждение +1, а за ошибку -1. Причем правило применяется только в том случае, если условие является истинным.



Правило №5




Условие

Следствие




Истинно,

Ложно,




Истинно,

1

1

2

Ложно,

3

4

7




4

5

9

Выполнение расчета характеристик правил:



Точность правила



Полнота правила



Поддержка правила



Мультипликативная свертка

,

Критерий Пирсона-Фишера. Позволяет проверить гипотезу о независимости двух случайных категориальных переменных. Правила, характеризующиеся большей величиной, оказываются статистически более значимыми



Степень логической достаточности



Мера различия



Полезность. Эффективность правил можно определить с позиций теории полезности. Предположим, что за правильно определенный класс объекта следует вознаграждение +1, а за ошибку -1. Причем правило применяется только в том случае, если условие является истинным.



Правило №6




Условие

Следствие




Истинно,

Ложно,




Истинно,

2

1

3

Ложно,

1

8

9




3

9

12

Выполнение расчета характеристик правил:



Точность правила



Полнота правила



Поддержка правила



Мультипликативная свертка

,

Критерий Пирсона-Фишера. Позволяет проверить гипотезу о независимости двух случайных категориальных переменных. Правила, характеризующиеся большей величиной, оказываются статистически более значимыми



Степень логической достаточности



Мера различия



Полезность. Эффективность правил можно определить с позиций теории полезности. Предположим, что за правильно определенный класс объекта следует вознаграждение +1, а за ошибку -1. Причем правило применяется только в том случае, если условие является истинным.



Правило №7




Условие

Следствие




Истинно,

Ложно,




Истинно,

2

1

3

Ложно,

1

13

14




3

14

17

Выполнение расчета характеристик правил:



Точность правила



Полнота правила



Поддержка правила



Мультипликативная свертка

,

Критерий Пирсона-Фишера. Позволяет проверить гипотезу о независимости двух случайных категориальных переменных. Правила, характеризующиеся большей величиной, оказываются статистически более значимыми



Степень логической достаточности



Мера различия



Полезность. Эффективность правил можно определить с позиций теории полезности. Предположим, что за правильно определенный класс объекта следует вознаграждение +1, а за ошибку -1. Причем правило применяется только в том случае, если условие является истинным.



Правило №8




Условие

Следствие




Истинно,

Ложно,




Истинно,

2

0

2

Ложно,

3

14

17




5

14

19

Выполнение расчета характеристик правил:



Точность правила



Полнота правила



Поддержка правила



Мультипликативная свертка

,

Критерий Пирсона-Фишера. Позволяет проверить гипотезу о независимости двух случайных категориальных переменных. Правила, характеризующиеся большей величиной, оказываются статистически более значимыми



Степень логической достаточности



Мера различия



Полезность. Эффективность правил можно определить с позиций теории полезности. Предположим, что за правильно определенный класс объекта следует вознаграждение +1, а за ошибку -1. Причем правило применяется только в том случае, если условие является истинным.



Выводы:


Достоверность всей карты Кохонена очень высока – почти все узлы определены с достоверностью 100%

Самые точные правила – 2,3,8 – их точность 100%. Из них хорошей поддержкой пользуется только правило 3 (0.6). Следовательно и полезность этого правила тоже высока – 0.6.



По критерию Пирсона-Фишера, самыми высокими показателями обладают правила 1 (6.5), 8 (6.26) и 7 (6)

Самое сильное влияние на коэффициент интеллекта оказывает площадь сечения головного мозга.


Смотрите также:
Лабораторная работа №4 Методы интеллектуального анализа данных. Обнаружение логических закономерностей на основе деревьев решений
104.04kb.
1 стр.
Отчет о лаботарорной работе методы и средства анализа данных по теме: «Система анализа данных weka»
383.87kb.
2 стр.
Методы интеллектуального анализа данных и некоторые их приложения1
28.3kb.
1 стр.
Лабораторная работа №2 Методические указания и описание лабораторной работы по дисциплине "Вычислительная техника и информационные технологии"
100.49kb.
1 стр.
Лабораторная работа № Проверка статистической гипотезы о виде распределения
336.48kb.
2 стр.
Отчет о лаботарорной работе по дисциплине Методы и средства анализа данных по теме: «Система анализа данных weka»
229.16kb.
1 стр.
Программа «Методы анализа и синтеза проектных решений»
26.32kb.
1 стр.
Лабораторная работа №4 Исследование логических микросхем серии 74хх
57.46kb.
1 стр.
Лабораторная работа №5 Лабораторная работа выполняется согласно выбранной теме курсовой работы!!! Количество таблиц в бд: от 4 до 6
46.6kb.
1 стр.
В научно-исследовательской части расчетно-пояснительной записки приводятся и сравниваются разные методы, используемые для минимизации числа типоразмеров используемых в модели sts кабелей
843.09kb.
15 стр.
Место теории измерений в методах анализа данных
266.06kb.
1 стр.
Разработка методик защиты программ от анализа и модификации на основе запутывания кода и данных
262.98kb.
1 стр.