Главная
страница 1


МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

Московский государственный университет экономики, статистики и информатики


МХИТАРЯН С.В.


Маркетинговые исследования рынка с использованием ППП Statistica


Москва, 2009

Мхитарян С.В. Практикум по дисциплине «Маркетинговые исследования рынка с использованием ППП Statistica». / Моск. гос. ун-т экономики, статистики и информатики. – М., 2009.

© Мхитарян Сергей Владимирович, 2009 г.

© Московский государственный университет экономики, статистики и информатики, 2009 г.


Содержание



1. Основы работы с программой 4

2. Анализ временных рядов и прогнозирование 4

2.1. Модель ARIMA – АРПСС: Авторегрессии и проинтегрированное скользящее среднее. 5

2.2. Модель Interrupted ARIMA – Прерванная ARIMA (ARIMA с интервенцией). 10

2.3. Модель Distributed Lags Analysis – Анализ распределенных лагов. 14

3. Изучение взаимосвязи маркетинговых показателей 16

4. Выявление маркетинговых макрохарактеристик 22

5. Сегментирование в маркетинге (без отклика) 26

5.1. Модель Joining (tree clustering) – Иерархические агломеративные методы. 27

5.2. Модель K-means clustering – Метод K-средних. 29

6. Сегментирование в маркетинге (с откликом) 31

7. Задачи для самостоятельной работы 37

Список литературы и ссылки на ресурсы Интернет 50




1. Основы работы с программой



В кратком описании статистических модулей будут приводиться примеры, устанавливающиеся при инсталляции системы из директории \examples\. Рассматриваются задачи для версии Statistica 6.0 и выше.
Запустите систему Statistica, в переключателях модулей выберите необходимый модуль для обработки.


2. Анализ временных рядов и прогнозирование



Анализ временных рядов позволяет выявить скрытые закономерности во временных рядах, построить модели этих закономерностей, провести прогнозирование.
В переключателе модулей выберите модуль Time Series Analysis / Forecasting - Анализ временных рядов и прогнозирование.


Откройте данные - Open Data,

Выберите переменные – Variables,

Запустите необходимую модель обработки.

2.1. Модель ARIMA – АРПСС: Авторегрессии и проинтегрированное скользящее среднее.


Модель ARIMA – АРПСС: Авторегрессии и проинтегрированное скользящее среднее относится к адаптивным методам прогнозирования, которые позволяют строить самокорректирующие экономико-математические модели. Эти модели способны оперативно реагировать на изменение условий путем учета результата прогноза, сделанного на предыдущем шаге и учета различной информационной ценности уровней ряда. Информационная ценность последних наблюдений в экономических рядах обычно значительно выше, чем более ранних, так как информация очень быстро теряет свою актуальность в силу высокой турбулентности экономической среды.

Откройте в стартовой панели модуля файл Series_g.sta.



В окне Time Series Analysis откройте модуль ARIMA & autocorrelation functions – АРПСС и автокорреляционные функции.
В блоке Arima model parameters – устанавливаются параметры модели:

Estimate constant – учет в модели константы,

Sesonal lag – сезонный лаг,

Основные параметры модели:

p – Autoregressive – регулярный параметр авторегрессии,

P – Sesonal – сезонный параметр авторегрессии,

q – Mouving average – регулярный параметр скользящего среднего,

Q - Sesonal – сезонный параметр скользящего среднего.


Большинство наблюдаемых моделей стационарных рядов (без учета тенденции и сезонности) может быть отнесены с высокой степенью точности к одному из пяти классов:

модели авторегрессии с одним параметром: p=1, q=0,

модели авторегрессии с двумя параметрами: p=2, q=0,

модели скользящего среднего с одним параметром: p=0, q=1,

модели скользящего среднего с двумя параметрами: p=0, q=2,

модели авторегрессии с одним параметром и скользящего среднего с одним параметром: p=1, q=1.

Параметры модели подбираются эмпирически, качество различных моделей сравнивается по характеристикам остатков – разности смоделированных и фактических значений. В хорошей модели взаимосвязь остатков низкая, графики автокорреляционной и частной автокорреляционной функции не превышаю допустимых границ.
Для сезонных моделей АРПСС.

После применения дополнительных преобразований - Other transformations & plots, исключающих сезонность - получение разности с соответствующими лагами, сезонные параметры P и Q могут быть определены для каждого из вышеперечисленных классов моделей.


В блоке Transform variable (series) prior to analysis – устанавливаются параметры изменения переменных до обработки:

Natural Log – натуральное логарифмирование,

Power transform – возведение в соответствующую степень,

Difference – разность с соответствующим лагом (Lag), выполняющаяся указанное количество раз (N of passes), разность - важный параметр модели,

Other transformations & plots – другие преобразования и графики.
В блоке Review and plot variables можно просмотреть переменные и построить их графики.
В блоке Autocorrelations можно посмотреть автокорреляционную (Autocorrelations) и частную автокорреляционную (Partial autocorrs) функции, это необходимо для определения параметров модели и изменения параметров переменных до обработки.
После настроек модели (для нашего примера это p=P=0, q=Q=1, Natural Log - включен, Difference – включен, Lag1=1, N of passes=1, Lag2=12, N of passes=1),

нажмите кнопку расчета – OK (Begin parameter estimation).



В верхней части окна – информация о модели и оценках ее параметров.
Блок Forecasting – прогнозирование. Задает параметры прогноза: количество случаев прогноза, с какого случая строить прогноз, доверительный интервал,

кнопки Forecast cases – выводит таблицу прогнозных значений и доверительного интервала, Plot series & forecast – выводит график исходного ряда и прогноза.



Блоки Plots of residuals и Autocorrelation of residuals выводят различные гистограммы и графики остатков и графики автокорреляционной и частной автокорреляционной функций.


На графиках нашего примера автокорреляционная и частная автокорреляционная функция не превышают граничных значений, что говорит об адекватности выбранной модели.

2.2. Модель Interrupted ARIMA – Прерванная ARIMA (ARIMA с интервенцией).

Этой моделью описываются временные ряды, имеющие на графике следующий типичный вид (Director.sta).



В окне Time Series Analysis откройте модуль ARIMA & autocorrelation functions – АРПСС и автокорреляционные функции.

От модели обычной ARIMA стартовая панель прерванной ARIMA отличается блоком Specify times and types of interventions – Определение времени и типа интервенции. Можно задавать до 6-и различных интервенций. Номер случая определяется в поле At case number - задается номер случая начала интервенции, тип интервенции – в поле Type of intervension.

Кнопка Review types of impact позволяет просмотреть различные типы интервенций и выбрать наиболее подходящий: скачкообразного устойчивого типа (Abrupt, Permanent), постепенного устойчивого типа (Gradual, Permanent), скачкообразного временного типа (Abrupt, Temporary).



Скачкообразный устойчивый тип интервенции


Постепенный устойчивый тип интервенции



Скачкообразный временной тип интервенции


Остальные параметры модели подбираются как в обычной модели ARIMA.

2.3. Модель Distributed Lags Analysis – Анализ распределенных лагов.

Анализ распределенных лагов – это метод оценки запаздывающей зависимости между рядами. Такого рода зависимости с запаздыванием особенно часто возникают в эконометрике.

Откройте в стартовой панели модуля файл Teachers.sta, выберите все переменные.
В окне Time Series Analysis откройте модуль ARIMA & autocorrelation functions – АРПСС и автокорреляционные функции.

Кнопка Independent variable – позволяет выбрать независимые переменные. Выберите переменную сhildren. Для выбора зависимой переменной поставьте курсор в верзнем окне на переменную salary.
В блоке Method выбирается метод расчета: Unconstrained polynomial lags – Обычные лаги, Almon polynomial lags – лаги Алмона. Если возникают вычислительные сложности при оценивании коэффициентов регрессии, используют метод Алмона. Выберите лаги Алмона, order=1.
Окно Lag lenth – позволяет задать длину лага – величину одного ряда относительно другого. Задайте длину 2.
Нажмите кнопку OK (begin analisys) – начало расчета.

В появившейся таблице даны: оценки коэффициентов регрессии, стандартные ошибки, значения t-статистики, соответствующие уровни p при различных сдвигах Lag=0, 1, 2. Из четвертого столбца видно, что только коэффициент регрессии, отвечающий лагу 1, является значимым на уровне 0,1.

С высокой степенью достоверности можно утверждать, что зависимость между рядами salary и children имеет вид:



salary(t)=0,000086 * children(t-1), t=2, 3, …

3. Изучение взаимосвязи маркетинговых показателей



Для определения зависимостей в системе данных и построения математических моделей этих зависимостей используется регрессионный анализ.

Функция , описывающая зависимость среднего значения результативного признака у от заданных значений аргументов, называется функцией (уравнением) регрессии. Задача восстановления средних значений результативного показателя у по заданным значениям объясняющих переменных решается методами регрессионного анализа.


В переключателе модулей выберите модуль Multiple Regression – Множественная регрессия.

Откройте в стартовой панели модуля файл Emission.sta, выберите зависимой переменной (dependent) - emission, независимыми переменными (independent) – ln_emiss, speed, ln_speed с помощью кнопки Variables.
Нажмите кнопку OK, появиться окно Model Definition – Построение модели.

Перед началом расчета необходимо определить взаимосвязь переменных между собой. Для этого нажмите кнопку Review Correlation matrix/means/SD – обзор корреляционной матрицы, средних, среднеквадратического отклонения.

Нажмите кнопку Correlation.

Задача оценки степени тесноты связи между показателями решается методами корреляционного анализа. Одним из наиболее часто применяемых показателей взаимозависимости двух случайных величин является парный коэффициент корреляции. Он является мерой линейной статистической зависимости между двумя величинами.
Качественные характеристики связи

Значение r

Связь

От 0 до +/-0,3

Практически отсутствует

От +/-3 до+/-0,5

Слабая

От +/-0,5 до +/-0,7

Умеренная

От +/-0,7 до +/-1

Сильная

В таблице представлены коэффициенты корреляции. Чем ближе коэффициент корреляции к 1 и дальше от 0, тем выше связь между параметрами. Взаимосвязь зависимой переменной emission от независимых параметров высокая, но высокая взаимосвязь и между самими независимыми параметрами, что негативно отразится на адекватности модели.


Выберите в окне Model Definition метод: Method – Standard, нажмите кнопку OK. Появится окно результатов множественной регрессии – Multiple Regression Results.

В верхней части окна – результаты анализа.

Наиболее важный показатель - R-square – коэффициент детерминации, показывает долю общего разброса, которая объясняется построенной регрессией. Чем ближе этот показатель к 1, тем точнее модель, чем ближе к 0, тем меньше точность.

Intercepr – оценка выборочного члена регрессии (значение коэффициента B0 в уравнении регрессии Y=B0+B1*X1+B2*X2+…+Xn).

LN_EMIS beta=1,39, SPEED beta=1,05, LN_ SPEED beta=-1,5 – стандартизованные коэффициенты независимы переменных, красным цветом выделены основные регрессоры, их коэффициенты регрессии значимы (в нашем случае – все 3 независимые переменные).

F = 187,5086, p = 0,0000 – значение F-критерия и уровень значимости гипотезы о том, что линейной зависимости между зависимой переменной и независимыми нет. Делаем вывод, что зависимость существует.
Кнопка Regression summary выводит результаты регрессии с коэффициентами регрессии.

Из таблицы видно, что уравнение регрессии имеет вид:
EMISSION=7,5496+38,5508*LN_EMIS+1,6927*SPEED-46,9030*LN_ SPEED
p-level – уровень значимости, близкий к нулю говорит о линейной связи зависимой переменной с конкретной независимой переменной (значение t-критерия представлены в таблице левее).
Анализ адекватности модели проводится с помощью анализа остатков – кнопка Residual Analysis.

В окне анализа остатков представлены различные инструменты анализа. Один из них – критерий Дарбина-Уотсона – Durbin-Watson stat. (итспользуется только для временных рядов). Чем ближе этот показатель к 2, тем ниже автокоррелляция остатков, тем выше адекватность модели, чем ближе к 0 или 4, тем модель менее адекватна.

В нашем случае D=1,632931 – это средний показатель, модель адекватна. Для повышения адекватности модели можно воспользоваться факторным анализом (методом главных компонент) и строить регрессионную модель зависимости переменной emission от полученных компонент.

4. Выявление маркетинговых макрохарактеристик



Основной задачей факторного анализа является нахождение системы существующих для исследуемого объекта факторов, влияющих на наблюдаемые характеристики сложного объекта и объяснить связи между ними. Факторный анализ позволяет существенно снизить размерность задачи.

Главными целями факторного анализа являются: сокращение числа переменных (редукция данных) и определение структуры взаимосвязей между переменными, т.е. классификация переменных. Поэтому факторный анализ используется или как метод сокращения данных или как метод классификации.

При проведении факторного анализа возникают два основных вопроса: сколько имеется факторов и что они собой представляют? При подборе числа факторов можно пользоваться различными вспомогательными техническими показателями. При интерпретации факторов очень важен набор коэффициентов, называемых факторными нагрузками, которые связывают факторы с переменными. Эти коэффициенты дают информацию относительно того, какие из факторов сильно связаны с какими из переменных.

Общим термином «факторный анализ» называют две тесно связанные техники: собственно факторный анализ и анализ главных компонент. Факторный анализ основное внимание уделяет корреляции переменных, метод главных компонент – вариациям переменных.
В переключателе модулей выберите модуль Factor Analysis – Факторный анализ.

Откройте в стартовой панели модуля файл Textile2.sta, выберите 4 первых переменных, нажмите кнопку OK.

В открывшемся окне Define Method of Factor Extraction – Определение метода выделения факторов, в блоке Extraction components – выбор метода, выберите Principal components – Метод главных компонент. В правой части окна установите максимальное количество извлекаемых факторов Maximum no. of factors, равное числу переменных 4, а минимальное значение главной компоненты Minimum eigenvalue – равное 0. В этом случае будут выведены все факторы. Для определения наиболее важных факторов часто используют критерий Кайзера, рекомендующий использовать лишь те факторы, для которых собственное значение минимального значения главной компоненты Minimum eigenvalue не менее 1. Нажмите OK.

Нажмите кнопку Eigenvalues – Собственные значения.

В таблице главные компоненты отсортированы по убыванию собственных значений (первый столбец). Второй и четвертый столбец содержат относительный вклад каждой компоненты в суммарную дисперсию и накопленный относительный вклад.

Часто для анализа используют первые главные компоненты, суммарный вклад в дисперсию которых превышает 70%, в нашем случае – это 2-е первых компоненты, суммарный вклад которых 71,3462%.


Нажмите кнопку в окне результатов анализа Factor loadings (Факторные нагрузки).

Элементы матрицы характеризуют тесноту связи между признаками и главными компонентами. Если интерпритация главных признаков затруднена, то можно произвести поворот осей, нажав кнопку Factor Rotation в окне результатов и выбрать метода, например методом Varimax raw. Значения факторных нагрузок, больше по абсолютному значению 0,7 подсвечиваются на экране. Так первая компонента связана с 1-ым и 4-ым показателем, 2-я – с 3-им, 3-я – со 2-ым.
Кнопка в окне результатов анализа Factor score coefficients – матрица собственных векторов показывает таблицу с коэффициентами перехода от системы исходных координат к координатной системе факторов.

Кнопка в окне результатов анализа Factor score – матрица собственных значений факторов показывает координаты объектов в новой системе факторов.

Кнопка в окне результатов анализа Save factor score – созхраняет матрицу собственных значений факторов.


5. Сегментирование в маркетинге (без отклика)



Кластерный анализ объединяет различные процедуры для проведения классификации. В результате применения этих процедур совокупность объектов распределяется на группы (кластеры, классы).

Обычно перед началом классификации данные стандартизируются (вычитается среднее и производится деление на корень квадратный из дисперсии). Полученные в результате стандартизации переменные имеют нулевое среднее и единичную дисперсию.

Кластерный анализ является первичным статистическим инструментом для сегментации рынка. Этот разведочный метод анализа данных может предложить полезные способы группировки потребителей. Кластерный анализ выявляет области концентрации данных.

Базисным критерием, используемым для этого, является расстояние. Объекты, расположенные близко друг к другу, должны попадать в один и тот же кластер, в то время как достаточно далекие объекты должны быть в разных кластерных группах. В идеале, объекты внутри кластера должны быть относительно однородными, но отличными от объектов из других кластеров. Кластерный анализ данных считается разведочным методом, предлагающим совокупность полезных способов группировки данных.

В переключателе модулей выберите модуль Cluster Analysis – Кластерный анализ.



Откройте в стартовой панели модуля файл Cars.sta.

5.1. Модель Joining (tree clustering) – Иерархические агломеративные методы.


При иерархической кластеризации, как только объекты попали в кластер, они остаются объединенными на всех последующих этапах кластеризации.

В стартовом окне выберите Joining (tree clustering) – Иерархические агломеративные методы.



В появившемся окне настроек выберите все переменные, значения кластеров Cases(rows) – случаи, нажмите OK.

Нажмите кнопку Vertical icicle plot для получения вертикальной дендрограммы.

На горизонтальной оси отмечены наблюдения (объекты), по вертикальной оси – значения расстояний, при которых произошло последовательное слияние кластеров.

По дендрограмме можно разделить предстваленные объекты на 3 кластера, в первых 2-х находятся по единственному объекту.


5.2. Модель K-means clustering – Метод K-средних.

Самой популярной техникой в классе неирерархичекских методов

является метод К-средних. Поскольку для выполнения этого метода аналитику необходимо указать определенное число кластеров, то, как правило, производится несколько попыток с разным числом кластеров, а полученные результаты оцениваются при помощи ранее упомянутых критриев (сепарации, размера групп, рисунка средних и верификации).

В стартовой модели выберите K-means clustering – Метод K-средних.



Укажите количество кластеров 3 – Number of clusters, нажмите OK.

Нажмите кнопку Graph of means – график средних. На графике отображены средние значения показателей каждого из кластеров. Похожие графики показывают близость кластеров между собой. В нашем примере кластеры значительно отстоят друг от друга.

Кнопка Descreptive Statistics for each cluster – Описательная статистика для каждого кластера. Выводит по одной таблице на каждый кластер, в которой по каждой характеристике указываются среднее, несмещенное среднеквадратическое отклонение, несмещенная дисперсия.
Кнопка Members of each cluster & distances – элементы каждого кластера, расстояние. Выводит по одной таблице на каждый кластер, в которой в верхней строке указывают объекты (наблюдения), строкой ниже – евклидово расстояние от центра класса до этого объекта.

6. Сегментирование в маркетинге (с откликом)



Цель дискриминантного анализа состоит в том, чтобы на основе измерения различных характеристик (признаков, параметров) объекта классифицировать его, то есть отнести к одной из нескольких групп (классов) некоторым оптимальным способом.

Дискриминантный анализ – это прогностическа модели, в которых результирующий показатель (отклик) является категориальным (купил/не купил), а независимые переменные измерены в интервальной (числовой) шкале. Как и в регрессионном анализе, основная идея – построить прогностическую модель, оценить ее и в случае успеха создать соответствующее уравнение.



В переключателе модулей выберите модуль Discriminant Analysis – Дискриминантный анализ.

Откройте в стартовой панели модуля файл Irisdat.sta, выберите группирующей переменной – Grouping variable – переменную iristype, все остальные переменные – независимыми – Independent variable. Mising data – пропущенные данные – позволяет выбрать метод заполнения пустых значений. Нажмите OK.

Выберите метод пошагового анализа Method: Forward stepwise. Нажмите OK.

В информационной части окна результатов Wilks' Lambda – Значение лямбды Уилкса. Значение лямбды Уилкса лежит в интервал [0, 1]. Значение близкое к 0 говорит о хорошей дискриминации (как в нашем примере).
Кнопка Variables in the model показывает переменные, включенные в модель и их характеристики.

Разделение групп на графике можно посмотреть с помощью кнопки Canonical analysis & graph – Канонический анализ и графики.

В появившемся окне нажмите кнопку Scatterplot of canonical scores – Диаграмма рассеяния канонических значений.

Нажмите кнопку в окне результатов дискриминантного анализа Classification functions – Функции классификации.

С помощью этих функций можно вычислить классификационные значения для вновь наблюдаемых объектов по формулам:
SETOSA = -16,43 * PETALLEN + 23,69 * SEPALWID – 17,40 * PETALWID + 23,54 * SEPALLEN – 86,31 (данные округлены до 2-го знака после запятой).
Аналогичные формулы для классов VERICOL, VIRGINIC. Новый объект относится к тому классу, для которого классификационное значение максимально.
В окне результатов анализа нажмите кнопку Squared Mahalanobis distance – Квадрат расстояния Махаланобиса.

Таблица с квадратами расстояния Махаланобиса от точек до центров групп позволяет определить к какой группе относится случай. Случай относится к группе, в до которой расстояние Махаланобиса минимально. Звездочками помечены случаи, классификация которых неверна.
Для классификации новых случаев необходимо добавить в таблицу исходных данных, не закрывая окно результатов дискриминантного анализа, новый случай. Например, такой:

Далее еще раз рассчитайте расстояния Махаланобиса.


Новое наблюдение относится к классу VERSICOL (расстояние Махаланобиса минимально = 31,1716).

7. Задачи для самостоятельной работы



Для работы с задачами необходимо файл Marketing_Ex.stw скопировать в директорию данных системы Statistica.

В каждой задаче указывается закладка файла данных и модуль статистической обработки.
Задача 1.

По данным внутренней отчетности предприятия была сделана выборка, представляющая помесячный товарооборот фирмы с 1995 по 2000 год в условных денежных единицах (Ex001).



Задание:

С помощью программного статистического пакета Statistica, модуля анализа временных рядов (Time Series Analysis), модели Авторегрессии и проинтегрированного скользящего среднего - АРПСС (ARIMA & autocorrelations functions) построить модель АРПСС и прогноз товарооборота на 2001 год.


Варианты ответов:

А. Параметры модели АРПСС и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=P=1, q=Q=0 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis;


Б. Параметры модели АРПСС и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=P=0, q=Q=0 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis;
В. Параметры модели АРПСС и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=P=0, q=Q=1 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis;
Г. Параметры модели АРПСС и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=1, P=0, q=1, Q=0 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis;
Д. Параметры модели АРПСС и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=0, P=1, q=0, Q=1 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis.
Задача 2.

По данным внутренней отчетности предприятия была сделана выборка, представляющая помесячный товарооборот фирмы с 1995 по 2000 год в условных денежных единицах (Ex001). На динамике товарооборота сказался дефолт августа 1998 года.



Задание:

С помощью программного статистического пакета Statistica, модуля анализа временных рядов (Time Series Analysis), модели прерванной АРПСС – АРПСС с интервенцией (Interrupted ARIMA) построить модель прерванной АРПСС и прогноз товарооборота на 2001 год.


Варианты ответов:

А. Параметры модели АРПСС, интервенции и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=0, P=1, q=0, Q=1 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis,

- интервенция 1 (Intervension) с наблюдения 34 (At case number),

тип (Type of intervention) – скачкообразная, устойчивая (Abrupt, Permanent);


Б. Параметры модели АРПСС, интервенции и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=1, P=0, q=1, Q=0 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis?

- интервенция 1 (Intervension) с наблюдения 24 (At case number),

тип (Type of intervention) – скачкообразная, устойчивая (Abrupt, Permanent);
В. Параметры модели АРПСС, интервенции и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=P=0, q=Q=1 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis?

- интервенция 1 (Intervension) с наблюдения 64 (At case number),

тип (Type of intervention) – скачкообразная, временная (Abrupt, Temporary);
Г. Параметры модели АРПСС, интервенции и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=P=0, q=Q=0 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis?

- интервенция 1 (Intervension) с наблюдения 54 (At case number),

тип (Type of intervention) – постепенная, устойчивая (Gradual, Permanent);
Д. Параметры модели АРПСС, интервенции и преобразования переменных:

- включать в модель константу (Estimate constant) – Да,

- сезонный лаг (Seasonal lag) – 12,

- p=P=1, q=Q=0 (Arima model constant),

- разность с лагом=1 (Lag), 1 раз (N of passes) Transform variable (series) prior to analysis,

- интервенция 1 (Intervension) с наблюдения 44 (At case number),

тип (Type of intervention) – постепенная, устойчивая (Gradual, Permanent).
Задача 3.

По данным внутренней отчетности предприятия была сделана выборка, представляющая понедельные суммы выписки и оплаты заказов фирмы за отчетный период в условных денежных единицах (Ex002).



Задание:

С помощью программного статистического пакета Statistica, модуля анализа временных рядов (Time Series Analysis), модели анализа распределенных лагов (Distributed Lags Analysis), опции Обычные лаги (Unconstrained polynomial lags) построить авторегрессионную модель по значимым лагам и прогноз оплат на несколько недель вперед по смещенным суммам выписки заказов.


Варианты ответов:

А. Регрессионные коэфф-ты модели значимы на уровне 0,1, отвечающие лагам 2 и 3;


Б. Регрессионные коэфф-ты модели значимы на уровне 0,1, отвечающие лагам 6;
В. Регрессионные коэфф-ты модели значимы на уровне 0,1, отвечающие лагам 4 и 5;
Г. Регрессионные коэфф-ты модели значимы на уровне 0,1, отвечающие лагам 4;
Д. Регрессионные коэфф-ты модели значимы на уровне 0,1, отвечающие лагам 5.
Задача 4.

По данным внутренней отчетности предприятия была сделана выборка, представляющая понедельные данные работы предприятия: количество и сумма выписанных заказов, количества наличных заказов, оплаченных сумм, оплаченных сумм наличными, отношения количества и сумм оплаченных заказов к выписанным, наличных заказов к выписанным, наличных заказов к оплаченным (Ex003).



Задание:

С помощью программного статистического пакета Statistica, модуля анализа временных рядов (Time Series Analysis), модели множественного регрессионного анализа (Multiple Regression) построить регрессионную модель значений оплаченных сумм (S_OPL) по значимым параметрам предприятия.


Варианты ответов:

А. Регрессионные коэфф-ты модели значимы для следующих переменных:

S_VIP, K_OPL, K_NAL, S_OPL, S_NAL, K_OPL_VI, S_OPL_VI, K_NAL_VI, S_NAL_VI, K_NAL_OP, S_NAL_OP;
Б. Регрессионные коэфф-ты модели значимы для следующих переменных:

S_NAL, K_OPL_VI, S_OPL_VI, K_NAL_VI, K_NAL_OP, S_NAL_OP;


В. Регрессионные коэфф-ты модели значимы для следующих переменных:

S_VIP, S_OPL, S_NAL, S_OPL_VI, K_NAL_VI, S_NAL_VI, K_NAL_OP;


Г. Регрессионные коэфф-ты модели значимы для следующих переменных:

S_VIP, K_OPL, S_NAL_VI, K_NAL_OP, S_NAL_OP;


Д. Регрессионные коэфф-ты модели значимы для следующих переменных:

K_OPL_VI, S_OPL_VI, K_NAL_VI, S_NAL_VI, K_NAL_OP, S_NAL_OP.


Задача 5.

За отчетный период представлены данные по региональным филиалам фирмы: количество оплат, количество клиентов, оплаченная сумма (у.е.), процент наличных в оплаченной сумме, процент клиентов, оплативших наличными (Ex006).



Задание:

С помощью программного статистического пакета Statistica, модуля факторного анализа (Factor Analysis), метода Главных компонт (Principal components) выделить главные компоненты, определяющие характеристики филиалов предприятия для последующего их сравнительного анализа.


Варианты ответов:

А. Количество главных компонент – 1, форма вращения факторов – отсутствует;


Б. Количество главных компонент – 2, форма вращения факторов – Varimax;
В. Количество главных компонент – 3, форма вращения факторов – Varimax normalized;
Г. Количество главных компонент – 4, форма вращения факторов – Biquatrimax;
Д. Количество главных компонент – 5, форма вращения факторов – Biquatrimax normalized.
Задача 6.

Предприятие планирует открывать новые региональные филиалы. Для этого по данным Госкомстата РФ были получены сводные данные по областям России: объем производства (млн. руб.), процент промышленного производства к предыдущему году, строительство жилых домов, тыс.кв.м, строительство жилых домов в % к предыдущему году, инвестиции, млн.р., инвестиции в % к предыдущему году (Ex007).



Задание:

С помощью программного статистического пакета Statistica, модуля факторного анализа (Factor Analysis), метода Главных компонент (Principal components) выделить главные компоненты, определяющие характеристики областей России для дальнейшей оценки их привлекательности с точки зрения региональной политики предприятия.


Варианты ответов:

А. Количество главных компонент – 1, 1-я главная компонента наиболее тесно связана со следующими признаками: ПРОИЗВ, ПРОИЗВ_%, СТРОИТ, СТРОИТ_%, ИНВЕСТ, ИНВЕСТ%;


Б. Количество главных компонент – 2, 1-я главная компонента наиболее тесно связана со следующими признаками: ПРОИЗВ, ПРОИЗВ_%;
В. Количество главных компонент – 3, 1-я главная компонента наиболее тесно связана со следующими признаками: ПРОИЗВ, СТРОИТ, ИНВЕСТ;
Г. Количество главных компонент – 4, 1-я главная компонента наиболее тесно связана со следующими признаками: ПРОИЗВ_%, СТРОИТ_%, ИНВЕСТ%;
Д. Количество главных компонент – 5 В, 1-я главная компонента наиболее тесно связана со следующими признаками: ПРОИЗВ, ИНВЕСТ.
Задача 7.

Представлены данные по суммарному товарообороту отраслевых сегментов корпоративных клиентов фирмы по отраслям (Ex004).



Задание:

С помощью программного статистического пакета Statistica, модуля кластерного анализа (Cluster Analysis), иерархических агломеративных методов (Joining (tree clustering)) выделить 3 основных класса отраслей потребителей по их доле в товарообороте фирмы, определить отрасли, принадлежащие первым двум, наиболее значимым кластерам.

Примечание: в окне настроек стартовой панели кластерного анализа в окне Cluster нужно выбрать Cases (rows) – наблюдения.
Варианты ответов:

А. В отдельном, значительно отстоящем от остальных кластере (классе) находится отрасль – Машиностроение (7);


Б. В отдельном, значительно отстоящем от остальных кластере (классе) находится отрасль – Монтажные организации (11);
В. В отдельном, значительно отстоящем от остальных кластере (классе) находится отрасль – Транспортные организации (22);
Г. В отдельном, значительно отстоящем от остальных кластере (классе) находится отрасль – Пищевая промышленность (14);
Д. В отдельном кластере, значительно отстоящем от остальных (классе) находится отрасль – Строительство(19).
Задача 8.

Представлены данные по суммарному товарообороту отраслевых сегментов корпоративных клиентов фирмы по отраслям (Ex004).



Задание:

С помощью программного статистического пакета Statistica, модуля кластерного анализа (Cluster Analysis), метода К-средних (K-means clustering) выделить 3 основных класса отраслей потребителей по их доле в товарообороте фирмы, определить отрасли, принадлежащие первым двум, наиболее значимым кластерам.

Примечание: в окне настроек стартовой панели кластерного анализа в окне Cluster нужно выбрать Cases (rows) – наблюдения.
Варианты ответов:

А. В первом кластере находятся отрасли: Машиностроение (7), Научные организации (12), Строительство (19);


Б. В первом кластере находятся отрасли: Монтажные организации (11), Полиграфия (15);
В. В первом кластере находятся отрасли: Транспортные организации (22), Монтажные организации (11), Полиграфия (15);
Г. В первом кластере находятся отрасли: Пищевая промышленность (14), Химическая промышленность (23);
Д. В первом кластере находятся отрасли: Строительство(19).
Задача 9.

По данным внутренней отчетности предприятия была сделана выборка, представляющая помесячный товарооборот фирмы за отчетный год в условных денежных единицах по ассортиментным группам (Ex005).



Задание:

С помощью программного статистического пакета Statistica, модуля кластерного анализа (Cluster Analysis), иерархических агломеративных методов (Joining (tree clustering)), метода К-средних (K-means clustering) выделить основные классы ассортиментных групп по их доле в товарообороте фирмы, определить ассортиментные группы, принадлежащие различным кластерам.

Примечание: в окне настроек стартовой панели кластерного анализа в окне Cluster нужно выбрать Variables (columns) – переменные.
Варианты ответов:

А. Ассортиментные группы необходимо разбить на 1 кластер, в первом кластере находится ассортиментная группа А;


Б. Ассортиментные группы необходимо разбить на 2 кластера, в первом кластере находится ассортиментная группа З;
В. Ассортиментные группы необходимо разбить на 3 кластера, в первом кластере находится ассортиментная группа К;
Г. Ассортиментные группы необходимо разбить на 4 кластера, в первом кластере находится ассортиментная группа Р;
Д. Ассортиментные группы необходимо разбить на 5 кластеров, в первом кластере находится ассортиментная группа С.
Задача 10.

Представлена выборка товаров фирмы, их характеристик: индекса цен (отношения цены фирмы к среднерыночной), количества оплаченных заказов, количества клиентов, количества конкурентов, процент в товарообороте фирмы. А также характеристика стратегического положения или стратегии каждого товара в товарном ассортименте: «Рыночная ниша», «Имеет конкурентные преимущества», «Уход с рынка», «Занять нишу», «Добиться преимуществ» (Ex009).



Задание:

С помощью программного статистического пакета Statistica, модуля дискриминантного анализа (Discriminant Analysis), Пошагового анализа дискриминантных функций (Stepwise Discriminant Function) создать обучающую выборку, оценить корректность данной классификации товаров по стратегиям; определить, какую характеристику можно применить к товару со следующими характеристиками:


Пример 1

ИНД_ЦЕН

КОЛ_ОПЛ

КОЛ_КЛ

КОЛ_КОНК

ПРОЦ_ОБ

120

2

7

6

0,3

Примечание: в окне настроек стартовой панели дискриминантного анализа в окне Mising Data нужно выбрать Substituted by means – замена пустых значений средними значениями, в следующем окне выбрать метод пошагового анализа Forvard Stepwise.
Варианты ответов:

А. Товар с характеристиками, приведенными в Примере 1, относится к стратегическому направлению «Рыночная ниша»;


Б. Товар с характеристиками, приведенными в Примере 1, относится к стратегическому направлению «Имеет конкурентные преимущества»;
В. Товар с характеристиками, приведенными в Примере 1, относится к стратегическому направлению «Уход с рынка»;
Г. Товар с характеристиками, приведенными в Примере 1, относится к стратегическому направлению «Занять нишу»;
Д. Товар с характеристиками, приведенными в Примере 1, относится к стратегическому направлению «Добиться преимуществ».

Список литературы и ссылки на ресурсы Интернет




Литература:
1. Айвазян С.А., Мхитарян С.В., Прикладная статистика и основы эконометрики, М., ЮНИТИ, 1998

2. Боровиков В.П., Ивченко Г.И., Прогнозирование в системе Statistica в среде Windows, М., Финансы и статистика, 1999

3. Боровиков В.П., Популярное введение в программу Statistica, М., Компьютер-Пресс, 1998

4. Боровиков В.П., Statistica искусство анализа данных на компьютере, М., Питер, 2003

5. Дуброва Т.А., Бажин А.Г., Бакуменко Л.П, Факторный анализ с использованием ППП Statistica, Учебное пособие, М., МЭСИ, 2000

6. Дуброва Т.А., Статистические методы прогнозирования, М., Юнити, 2003

7. Дуброва Т.А. , Бажин А.Г., Бакуменко Л.П, Дискриминантный анализ в системе ППП Statistica, Учебное пособие, М., МЭСИ, 2000

8. Мхитарян В.С., Дуброва Т.А., Ткачев В.А., Многомерная классификация с использованием пакета программ Statistica, Методические указания, М., МЭСИ, 1997

9. Лукашин Ю.П., Адаптивные методы краткосрочного прогнозирования временных рядов, М., финансы и статистика, 2003
Internet-ресурсы:

www.statsoft.ru





Смотрите также:
Практикум по дисциплине «Маркетинговые исследования рынка с использованием ппп statistica»
278.94kb.
1 стр.
Маркетинговые исследования рынка производителей мебели в регионе
43.66kb.
1 стр.
Уведомление №01 о проведении открытой процедуры закупки в форме конкурентного запроса предложений г. Пенза 28 Июня 2012 г. Оао «Центр коммерциализации технологий»
23.47kb.
1 стр.
Маркетинговые иследования рынка сбыта продукции мобильной связи (на примере зао
973.55kb.
5 стр.
Маркетинговые решения по ценообразованию
644.88kb.
9 стр.
Отчет по курсовой работе по дисциплине «Маркетинговые коммуникации»
482.27kb.
7 стр.
Планирование ассортимента продукции
533.76kb.
2 стр.
Маркетинговое Агентство Step by Step
113.6kb.
1 стр.
Практикум по дисциплине «Информационные технологии»
941.31kb.
10 стр.
Контрольная работа по учебной дисциплине «стратегическое планирование и прогнозирование»
171.57kb.
1 стр.
Практикум по дисциплине «Надежность электрических машин»
42.79kb.
1 стр.
Программа дисциплины Маркетинговые коммуникации
293.92kb.
1 стр.