Главная
страница 1страница 2страница 3страница 4
Министерство экономического развития и торговли

Российской Федерации
Государственный университет - Высшая школа экономики
Факультет социологии


Программа дисциплины
«Современные методы анализа данных»
для направления 040200 «Социология»

подготовки магистров

по программе «Прикладные методы социального анализа рынков»
Автор Толстова Ю.Н.

untolstova@mail.ru
Программа разработана при финансировании ГУ-ВШЭ в рамках гранта по ИОП

Рекомендована секцией УМС Одобрена на заседании кафедры


методов сбора и анализа социологической информации

Председатель Зав. кафедрой

_____________________________ ________________________________

«_____» __________________ 200 г. «____»_____________________ 200 г

Утверждена УС факультета

_________________________________

Ученый секретарь

_________________________________

« ____» ___________________200 г.

Москва


2006

Аннотация

Цели курса: осуществить краткий обзор значительной части современных методов анализа данных, показав, в частности, каким образом традиционные, уже знакомые слушателям методы вписываются в более широкий контекст; дать слушателям возможность взглянуть на всю совокупности методов как бы «сверху», отследить логику развития этих методов в исторической ретроспективе, связать тем самым друг с другом разные подходы, решающие сходные задачи; сделать более ясной сущность каждого метода; показать, что использование метода анализа данных – это не нечто наложенное на исследование «сверху», а органическая его часть, использующая своеобразный язык.

Принципы описания методов


Основной методологический принцип, используемый в курсе – тщательное отслеживание модели, заложенной в каждом методе, анализ смысла этой модели с точки зрения потребности социолога.

В арсенале современной социологии имеется огромное количество методов. Хотя бы в какой-то мере рассмотреть каждый практически невозможно. Поэтому мы предлагаем некоторую классификацию методов, опирающуюся на два предлагаемых в курсе основания, и коротко описываем суть методов, попадающих в каждый класс, называя наиболее употребительные.


Требующийся уровень подготовки слушателей.

Для успешного освоения предлагаемого курса слушатели должны быть знакомы с элементами теории измерений, математической статистики и анализа данных, в объеме программ соответствующих дисциплин, включаемых обычно в учебные программы студентов-социологов.



Теория измерений. Необходимо иметь представление об основных положениях репрезентационной теории измерений: о понимании измерения как моделирования, отображения эмпирической системы в числовую; о модели восприятия; о типах шкал, используемых в социологии (номинальной, порядковой, интервальной), об их допустимых преобразованиях, о понятии адекватности математического метода; об известных способах построения одномерных шкал – шкал Терстоуна, Лайкерта, Гуттмана; о методе парных сравнений (модель Терстоуна), методе одномерного развертывания. Объем знаний примерно соответствует содержанию учебного пособия: Толстова Ю.Н. Измерение в социологии. М.: Инфра-М, 1998.

Математическая статистика. Слушатель должен иметь представление о случайной величине и ее распределении, об основных параметрах распределений случайных величин (математическом ожидании, дисперсии, коэффициенте корреляции), о выборке и генеральной совокупности, о проблеме их соотнесения; должен понимать, что такое статистическое оценивание параметров (точечное и интервальное) и проверка статистических гипотез; знать, как строятся доверительные интервалы для математического ожидания, как проверяются гипотезы о равенстве математических ожиданий и об отсутствии связи между переменными. Объем знаний примерно соответствует содержанию подготовленной автором рукописи учебного пособия «Математико-статистические модели в социологии: математическая статистика для социологов» (грант ГУ-ВШЭ в рамках ИОП). Имеется электронный вариант, которым пользуются студенты.

Анализ данных. Предполагается, что слушатели представляют себе методы описательной статистики (простейшие методы построения распределений и расчета мер средней тенденции и разброса), анализа связей между переменными, дисперсионного (однофакторного), регрессионного, факторного анализа, многомерного шкалирования в объеме, реализуемом пакетом SPSS. Объем знаний примерно соответствует содержанию учебного пособия: Крыштановский А.О. Анализ социологических данных с помощью пакета SPSS. М.: Издат. Дом ГУ-ВШЭ, 2006
Отличие нашего курса от того видения анализа данных, которое присуще известным учебникам:

  1. Обращение к истории. Связь идей, лежащих в основе творчества ученых предшествующих поколений, с современными взглядами.

  2. Уделение большого внимания заложенным в методах моделям; попытка проанализировать такие модели с точки зрения адекватности потребностям социологии. При этом рассматриваются как модели, присущие отдельным методам, так и модели, отвечающие интерпретации используемых методами данных.

  3. Особое внимание уделяется моделям измерения (в первую очередь – т.н. моделям восприятия). Понятие измерения расширяется, что дает возможность более четко и адекватно анализировать модели, используемые социологом на всех этапах исследования.

  4. Методы рассматриваются не сами по себе, а с учетом характера той задачи, которую с их помощью намеревается решать социолог.


Тематический план учебной дисциплины





№ темы

Разделы, темы

Всего часов

Аудиторные часы

Самостоя

тельная работа



Лекции

Семинары




Раздел 1. История становления дисциплины. Общие методологические положения













1.

Предыстория становления анализа данных как самостоятельной дисциплины

1

1,0







2

Возникновение анализа данных как самостоятельной научной ветви. Его современное позиционирование в науке


0,5

0,5







3

Методологическая основа дальнейшего изложения

0,5

0,5

0







Раздел II. Описательная статистика













4

Общие цели и принципы описания. Расширение этого понятия

2

1,0

1,0




5

Проблема пропущенных данных

2

1,0

1,0




6

Переход от категориальных признаков к числовым (оцифровка, анализ соответствий)

4

2,0

2,0




7

Переход от числовых признаков к категориальным (разбиение диапазона изменения признаков на интервалы, черно-белый анализ)

4

2,0

2,0




8

Переход от категориальных признаков к категориальным (латентно-структурный анализ (ЛСА), упоминание методов классификации)

4

2,0



2,0




9

Переход от числовых признаков к числовым (факторный анализ)

2

2,0

0




10

Данные, заданные не в виде матрицы «объект-признак» (матрицы близостей, оценки взаимодействий), их роль в социологии, переход от таких данных к числовому пространству (многомерное шкалирование, cовместный анализ)

8

4,0

4,0




11

Меры средней тенденции и стоящие за ними модели. Формальная и содержательная адекватность мер средней тенденции.


4

2,0

2,0




12

Меры разброса и стоящие за ними модели. Формальная и содержательная адекватность мер разброса

4

2,0

2,0







Раздел III. Объяснение: методы анализа статистических связей













13

Цели и общие принципы анализа статистических связей

2

2,0

0




14

Анализ связей между числовыми признаками (понятие многомерной связи, обобщение коэффициента корреляции, канонический анализ, причинный анализ). Возможность использования числовых методов для дихотомических данных

10

6,0

4,0




15

Анализ связей между категориальными и числовым признаком (дисперсионный анализ)

4

2,0

2,0




16

Анализ связей между категориальными признаками: классификация методов

2

2,0

0




17

Анализ связей между категориальными признаками: алгоритмы типа «признак Х признак» (парные коэффициенты связи, отношения преобладания), «(группа признаков)Х (группа признаков)» (разложение частотной таблицы на четырехклеточные подтаблицы, алгоритмы типа AID)

5

4,0

1,0




18

Анализ связей между категориальными признаками: изучение системы признаков (логлинейный анализ)

3

2,0

1,0




19

Обобщение понятия взаимодействия. Сравнение разных подходов к поиску взаимодействий

2

2,0

0







Раздел IV. Объяснение: классификация объектов













20

Цели классификации

2

2,0

0




21

Классификация в числовом пространстве: общие принципы, краткий обзор методов, классификация и типология, основные рассматриваемые элементы формализма

2

2,0

0




22

Классификация в числовом пространстве: выбор функции расстояния между объектами и между классами, форма классов

8

4,0

4,0




23

Классификация категориальных данных (дихотомизация, функции расстояния для дихотомических данных, алгоритмы типа AID как методы классификации, ЛСА)

4

2,0

2







Итого:

210

50

30

126


Базовый учебник, ридеры

Курс новый, базовый учебник отсутствует. Ниже по всем темам указана литература, в том числе ридеры. Предполагается, что в ближайшее время будут сделаны дополнительные ридеры из фрагментов некоторых работ, указанных в библиографии к темам.




следующая страница >>
Смотрите также:
Отчет о лаботарорной работе методы и средства анализа данных по теме: «Система анализа данных weka»
383.87kb.
2 стр.
Программа дисциплины «Современные методы анализа данных»
596.57kb.
4 стр.
Методы анализа данных Кредиты: 3 Аннотация дисциплины
17.78kb.
1 стр.
Бизнес-информатики программа дисциплины Упорядоченные множества для анализа данных
214.13kb.
1 стр.
Отчет о лаботарорной работе по дисциплине Методы и средства анализа данных по теме: «Система анализа данных weka»
229.16kb.
1 стр.
Пояснительная записка краткая характеристика дисциплины
143.36kb.
1 стр.
Программа дисциплины «Управление данными»
169.17kb.
1 стр.
Место теории измерений в методах анализа данных
266.06kb.
1 стр.
Отчет о лаботарорной работе методы и средства анализа данных по теме
286.73kb.
1 стр.
Дисциплины «Методы математической обработки медико-биологических данных»
20.75kb.
1 стр.
Программа дисциплины «Методы сбора и анализа социологической информации»
271.95kb.
1 стр.
[Приборы и методы экспериментальной физики]
43.96kb.
1 стр.