1.64M
Category: marketingmarketing

Маркетинговые исследования. Сегментирование. Кластерный и факторный анализ в маркетинговых исследованиях

1.

ФГБОУ ВО «Уральский государственный экономический университет»
Маркетинговые
исследования
Изакова Наталья Борисовна
Кандидат экономических наук
доцент кафедры маркетинга и международного
менеджмента
+7 (343) 283 10 46
[email protected]
г. Екатеринбург, ФГБОУ ВО «УрГЭУ», ул. 8-е марта 62,
ауд. 755, Кафедра маркетинга и международного
менеджмента

2.

Сегментирование
КЛАСТЕРНЫЙ И ФАКТОРНЫЙ АНАЛИЗ В
МАРКЕТИНГОВЫХ ИССЛЕДОВАНИЯХ

3.

Кластерный анализ: применимость в маркетинговых
исследованиях
1. Кластерный анализ: понятие и назначение в маркетинговых
исследованиях
2. Иерархический кластерный анализ
2.1. Этапы кластерного анализа
2.2. Выбор способа измерения расстояния
2.3. Выбор метода кластеризации
2.4. Принятие решения о числе кластеров
2.5. Интерпретация и профилирование кластеров
2.6. Оценка качества кластеризации

4.

1. Кластерный анализ: понятие и назначение в маркетинговых
исследованиях
• Кластерный анализ предназначен для разбиения исходных
данных на группы, которые можно описать по максимально
«схожим» признакам, и максимально «отличным» от других
групп.
• Кластерный анализ – группа методов, используемых для
классификации объектов или событий в относительно
гомогенные (однородные) группы, которые называют
кластерами (clusters).
• В маркетинговых исследованиях данные кластеры могут
быть интерпретированы как сегменты целевой аудитории.

5.

Кластеризация - сегментирование
Кластеризация в
маркетинге –
сегментирование
на основе
поведения.
Это возможность
разделения
потребителей на
устойчивые группы
по особенностям
поведения и
предпочтений.

6.

Кластеризация - применение
• Определение целевых
групп потребителей
• Сегментирование на
основе отношения к
различным
характеристикам товара
• Сегментирование на
основе особенностей
потребительского
поведения

7.

Кластерный анализ в теории
Задача: Как очертить границу кластеров? Сколько их следует выделить?

8.

Виды кластерного анализа
КЛАСТЕРНЫЙ АНАЛИЗ
Двухэтапный анализ
Иерархический анализ
Метод К-средних
При малом количестве
наблюдений
При малом количестве
наблюдений
При большом количестве
наблюдений

9.

2. Иерархический кластерный анализ
Методы связи
Метод одиночной связи – метод связи,
в основе которого лежит минимальное
расстояние между объектами, или
правило ближайшего соседа.
Метод полной связи – метод связи, в
основе которого лежит максимальное
расстояние между объектами, или
правило дальнего соседа.
Метод средней связи – метод связи, в
основе которого лежит среднее
значение всех расстояний, измеренных
между объектами двух кластеров, при
этом в каждую пару входят объекты из
разных кластеров.

10.

Методы кластеризации
• Метод Варда –
дисперсионный метод, при
котором кластеры формируют
таким образом, чтобы
минимизировать квадраты
евклидовых расстояний до
значений средних
кластерных.
• Центроидный метод –
дисперсионный метод, при
котором расстояние между
двумя кластерами
представляют собой
расстояние между их
центроидами (средними для
всех переменных).

11.

2.1. Этапы кластерного анализа
Формулировка проблемы
Выбор способа измерения расстояния
определение меры сходства объектов
Выбор метода кластеризации
Принятие решения о количестве кластеров
Интерпретация и профилирование
кластеров
Оценка достоверности кластеризации

12.

2.2. Выбор способа измерения расстояния
1. Команда «Анализ» → «Классификация» → «Иерархический кластерный анализ»
Наиболее
используемыми
способами
являются:
• Евклидово расстояние (Euclidian Distance)
• Квадрат Евклидова расстояния (Squared
Euclidian distance)
Благодаря возведению в квадрат лучше учитываются большие разности.
Поэтому Квадрат Евклидова расстояния должен всегда использоваться при построении кластеров
центройдным, медианным методом или методом Варда (Уорда).

13.

2.3. Выбор метода кластеризации
Метод кластеризации – это способ вычисления расстояний между кластерами.
Существуют следующие основные методы
кластеризации:
Межгрупповая связь (Between-groups
linkage)
Внутригрупповая связь (Within-groups
linkage)
Ближайший сосед (Nearest neighbor)
Самый дальний сосед (Furthest neighbor)
Центроидная кластеризация (Centroid
clustering)
Медианная
кластеризация
(Median
clustering)
Метод Варда (Уорда)(Ward's method)
Наиболее часто применяемые – межгрупповая связь м метод Уорда (Варда)

14.

2.3. Выбор метода кластеризации
Выбор количества кластеров
Во вкладке «Статистики» можно задать
число кластеров
конкретное количество
диапазон значений

15.

2.3. Выбор метода кластеризации
Выбор количества кластеров
Во вкладке «Графики»
отметить «Дендрограмма»
для вывода древовидной
диаграммы и отменить вывод
накопительной диаграммы

16.

2.3. Выбор метода кластеризации
Фрагмент дендограммы

17.

2.4. Принятие решения о числе кластеров
Древовидную диаграмму читают слева направо.
Вертикальные линии показывают кластеры, объединяемые вместе.
Положение линии показывает расстояния, при которых объединили
кластеры.
Для определения количества кластеров можно руководствоваться
следующим:
- теоретическими и практическим соображениями.
- в качестве критерия можно использовать расстояние, при которых
объединяют кластеры.
- должны быть достаточно выразительными относительные размеры
кластеров.

18.

2.4. Принятие решения о числе кластеров
Необходимо руководствоваться практическими и
теоретическими соображениями.
Исходя из цели исследования, например, может быть необходимо
три кластера.
Когда мера расстояния между двумя кластерами увеличивается
скачкообразно, процесс объединения в новые кластеры необходимо
остановить. Иначе будут объединены кластеры, находящиеся на
большом расстоянии друг от друга.
Оптимальным считается число кластеров равное разности
количества наблюдений и количества шагов, после которого
коэффициент увеличивается скачкообразно.
Размеры кластеров должны быть значимыми.

19.

Пример
Рассмотрим кластеризацию потребителей на основе их отношения к посещению
магазинов для покупки товаров. Опираясь на опыт в прошлом, маркетологи
определили шесть переменных. Потребителей попросили выразить их степень
согласия со следующими утверждениями по семибалльной шкале (1 – не согласен,
7 – абсолютно согласен).
Fac_1 – Посещение магазинов для покупки товаров – приятный процесс.
Fac_2 – Посещение магазинов для покупки товаров плохо сказывается на нашем
бюджете.
Fac_3 – Я совмещаю посещение магазинов для покупки товаров с питанием вне
дома.
Fac_4 – Я стараюсь сделать лучшие покупки при посещение магазинов.
Fac_5 – Мне не нравится посещение магазинов для покупки товаров.
Fac_6 – Можно сэкономить много денег, сравнивая цены в разных магазинах.

20.

Пример
Дендограмма

21.

Пример
Интерпретация кластеров
Кластер 1 можно назвать так: «любители посещать магазины и делать покупки», так как
имеет высокие значения по факторам 1 и 3 (Посещение магазинов для покупки товаров –
приятный процесс и Я совмещаю посещение магазинов для покупки товаров с питанием
вне дома). Этот кластер состоит из случаев: 1, 3, 6, 7, 8, 12, 15 и 17.
Кластер 2 – прямая противоположность кластеру 1: он имеет низкие значения степени
согласия по факторам 1 и 3 (Посещение магазинов для покупки товаров – приятный
процесс и Я совмещаю посещение магазинов для покупки товаров с питанием вне дома) и
высокие по фактору 5 (Мне не нравится посещение магазинов для покупки товаров),
значит, этот кластер можно назвать «апатичные покупатели». В кластер входят случаи 2,
5, 9, 11, 13 и 20.
Кластер 3 имеет высокие значения по факторам 2 (посещение магазинов плохо
сказывается на моем бюджете), 4 (я стараюсь сделать лучшие покупки, посещая
магазины), 6 (можно сэкономить много денег, сравнивая цены в разных магазинах). Этот
кластер можно назвать экономные покупатели.

22.

Факторный анализ: применимость в маркетинговых
исследованиях
1.
2.
2.1.
2.2.
2.3.
2.4.
2.5.
2.6.
Факторный анализ: понятие и назначение
Основные этапы факторного анализа
Вычисление корреляционной матрицы
Извлечение факторов
Выбор и вращение факторов
Интерпретация факторов
Вычисление значений факторов
Оценка качества модели

23.

1. Факторный анализ: понятие и назначение
• Факторный анализ – это процедура, с помощью которой большое число
переменных, относящихся к имеющимся наблюдениям, сводят к меньшему
количеству независимых влияющих величин, называемых факторами:
• в один фактор объединяются переменные, сильно коррелирующие
между собой.
• переменные из разных факторов слабо коррелируют между собой.
• Цель факторного анализа – сокращение числа переменных на основе их
классификации и определения структуры взаимосвязей между ними.
• Благодаря сокращению числа переменных вместо исходного набора
переменных появляется возможность анализировать данные по
выделенным факторам, число которых значительно меньше исходного числа
взаимосвязанных переменных.

24.

1. Факторный анализ: понятие и назначение
В практике маркетинговых исследований с факторный
анализ применяется в следующих ситуациях:
для сегментирования рынка и выявления переменных с целью
группировки потребителей;
для определения характеристик торговой марки с целью
выявления предпочтений потребителей;
при разработке рекламной стратегии с целью выявления
особенностей восприятия потребителем рекламного продукта.

25.

1. Факторный анализ: понятие и назначение
Например:
Набор высказываний об образе жизни можно использовать
для определения основных психографических факторов,
которые затем используются как независимые переменные
для объяснения различий между лояльными и нелояльными
потребителями.
Покупателей новых автомобилей можно сгруппировать в
зависимости от того, на что они обращают внимание при
покупке нового автомобиля: экономию, удобства, рабочие
характеристики автомобиля, комфорт и респектабельность.
Конкретные марки зубных паст оценивают с точки зрения
защиты от кариеса, отбеливания зубов, вкуса, приятного
запаха и цены.

26.

1. Факторный анализ: понятие и назначение
Обязательные условия проведения факторного анализа
• Все признаки должны быть количественными переменными
(интервальными либо метрическими).
• Число наблюдений должно быть минимум в два раза больше
числа переменных.
• Выборка должна быть однородна.
• Номинальные переменные должны быть переведены в
дихотомические (переменные, имеющие только две категории).

27.

2. Основные этапы факторного анализа
Процедура факторного анализа состоит из четырех основных
стадий:
• Вычисление корреляционной матрицы для всех переменных,
участвующих в анализе.
• Извлечение факторов.
• Выбор факторов и вращение факторов для создания упрощенной
структуры.
• Интерпретация факторов.

28.

2.1 Вычисление корреляционной матрицы
Анализ» →
«Снижение размерности» →
«Факторный анализ».
•На панели нажать на
«Описательные».
В разделе «Корреляционная
матрица» отметить
«Коэффициенты».
•Нажать продолжить.

29.

2.1 Вычисление корреляционной матрицы

30.

2.2. Извлечение факторов
• Анализ» →
• «Снижение размерности»
→ «Факторный анализ».
• На панели нажать на
«Извлечение». В разделе
«Метод» выбрать метод
«Главные компоненты».
• Нажать продолжить.
• Наиболее популярным
методом является метод
главных компонент

31.

2.2. Извлечение факторов
• Метод главных компонент
(Principal Components
Analysis) основан на
определении
минимального числа
факторов, вносящих
наибольший вклад в
дисперсию данных.
• Они называются главными
компонентами.

32.

2.3. Выбор и вращение факторов
1.
Если факторов окажется столько же, сколько исходных
переменных, факторный анализ теряет смысл, поскольку его целью
является сокращение исходного набора переменных.
2.
Необходимо принять решение, какие из факторов следует
оставить для дальнейшего анализа. Для этого исследователи
пользуются следующими критериями:
формальные критерии - все факторы, чьи собственные
значения превышают единицу, сохраняются для дальнейшего
анализа
критерий «каменистой осыпи» Р. Кеттелла - состоит в
поиске точки, где убывание собственных значений замедляется
наиболее сильно.

33.

2.3. Выбор и вращение факторов
Собственные
значения
объясненная
дисперсия
Количество
выбранных
факторов
Количество
факторов

34.

2.3. Выбор и вращение факторов
Метод «каменистой осыпи»
Чтобы получить график
«каменистой осыпи»,
необходимо в «Извлечение»
выбрать «График собственных
значений».
С помощью данного графика
также можно определять
количество факторов. Там, где
начинается резкий спад – на
том количестве факторов стоит
остановиться.
24

35.

2.3. Выбор и вращение факторов
Метод «каменистой осыпи»
Далее идет
резкий спад
Останавливаемся
на 7 факторах

36.

2.3. Выбор и вращение факторов
Целью вращения является
получение простой структуры,
которой соответствует большое
значение нагрузки каждой
переменной только по одному
фактору и малое по всем
остальным факторам.
Нагрузка отражает связь между
переменной и фактором, являясь
подобием коэффициента
корреляции. Значение нагрузки
лежит в пределах (–1; 1).

37.

2.3. Выбор и вращение факторов
Необходимо объяснить отобранные
факторы. Для этого в каждой строке
повёрнутой факторной матрицы
необходимо отметить ту факторную
нагрузку, которая имеет наибольшее
абсолютное значение
Эти факторные нагрузки следует
понимать как корреляционные
коэффициенты между переменными
и факторами. Так переменная a1
сильнее всего коррелирует с фактором
6, а именно, величина корреляции
составляет 0,720, переменная а2 с
фактором 1 (0,663), переменная а3
коррелирует сильнее всего с фактором
5 (0,569) и т.д.

38.

2.4. Интерпретация факторов
1. На основании ротированной матрицы компонентов в одну
группу собираются переменные, которые наиболее тесно
взаимосвязанные между собой
2. Полученные группы интерпретируются исходя из названия
факторов, имеющих наибольшие значения коэффициентов
корреляции.
3. Величина факторной нагрузки не превышает по модулю 1, а
знак говорит о положительной/отрицательной связи признака
с фактором. Значение факторной нагрузки, близкое к нулю –
фактор практически не влияет на данный признак.

39.

2.5. Вычисление значений факторов
1. В базе данных автоматически переносятся новые переменные
построенной факторной модели. В столбце “Метка”
отображается номер компонента факторной модели.
2. Суть новых переменных сводится к следующему: наибольшее
отрицательное значение говорит о большей значимости
переменной, и наоборот, наибольшее положительное
значение говорит о наименьшей значимости переменной.
3. Названия новых компонент необходимо занести в исходную
базу данных в столбец “Метка” таблицы “Переменные”,
компьютер автоматически вычисляет значения новых
переменных.

40.

2.6 Оценка качества модели
Критерий адекватности выборки
Кайзера-Мейера-Олкина- КМО−
величина, характеризующая степень
применимости факторного анализа к
данной выборке.
Правило интерпретации этого
критерия:
≥ 0,9 - безусловная адекватность
[0,8; 0,9) - высокая адекватность
[0,7; 0,8) - приемлемая адекватность
[0,6; 0,7) - удовлетворительная
адекватность
[0,5; 0,6) - низкая адекватность
< 0,5 - факторный анализ неприменим к
выборке.

41.

2.6 Оценка качества модели
Критерий сферичности Бартлетта
− критерий многомерной
нормальности для распределения
переменных.
Помимо нормальности критерий
проверяет, отличаются ли
корреляции от 0.
Уровень значимости p<0,05
указывает на то, что данные
вполне приемлемы для
проведения факторного анализа.

42.

Пример
Проведем факторный анализ с целью сокращения массива данных и выделения
сегментов туристов на основе их мотивов, при выборе места отдыха за городом.
Мотивы туристов, при выборе места отдыха за городом, которые были
предложены в опросе:
близость к городу
приемлемые цены
близость водоема, леса
уровень комфорта
тишина, уединение
хорошее питание
наличие развлечений
комфорт отдыха с детьми
возможность лечения, ухода за здоровьем

43.

Основные задачи:
оценить пригодность сходных данных для проведения факторного
анализа;
выявить корреляционные взаимосвязи между переменными
исходного массива;
определить оптимальное число факторов, т.е. групп, на которые
может быть разделен существующий массив переменных;
разделить существующий массив переменных на группы на
основании значений коэффициентов корреляции;
подобрать названия созданным переменным.

44.

Результаты:
Фрагмент корреляционной матрицы
Кор близость
рел к городу
яци приемле
я
мые
цены
близость
водоема,
леса
комф
налич
орт
ие
отды
развл
ха с
ечени деть
й
ми
возмо
жност
ь
лечен органи
ия,
зация
ухода детск
за
ого
здоро отдых
вьем
а
близос урове тиши
близос
ть
нь
на,
ть к приемл водое ком уеди
город
емые
ма,
форт нени
у
цены
леса
а
е
хоро
шее
пита
ние
1,000
-,060
,009
,149
,322
,075
-,166
,241
-,060
1,000
-,064 -,341
,270 -,247
-,121
,232
,273
-,407
,009
-,064
1,000 -,056
,017 -,083
,107
,114
,027
,030
,519 -,172

45.

Определение оптимального числа компонентов факторной
модели
Начальные собственные значения
Ко
мта
Всего
% дисперсии
Кумулятивны
й%
Суммы квадратов нагрузок вращения
Всего
% дисперсии
Кумулятивный
%
1
2,570
25,704
25,704
2,076
20,762
20,762
2
1,796
17,956
43,660
1,848
18,476
39,238
3
1,402
14,020
57,680
1,563
15,628
54,867
4
1,230
12,296
69,977
1,342
13,422
68,289
5
1,079
10,794
80,771
1,248
12,482
80,771
6
,870
8,699
89,470
7
,431
4,310
93,780
8
,343
3,434
97,214
9
,270
2,702
99,916
10
,008
,084
100,000

46.

График каменистой осыпи

47.

Ротированная матрица компонентов
Компонента
1
2
3
4
5
близость к городу
-,088
,852
-,198
-,009
,147
приемлемые цены
,278
-,190
-,221
-,561
,622
близость водоема, леса
,074
-,240
-,210
,664
,215
уровень комфорта
-,062
,793
,241
,093
-,148
тишина, уединение
,988
-,074
,082
-,040
-9,640E-6
хорошее питание
,059
,331
,831
,158
,054
наличие развлечений
-,075
,335
-,797
,261
-,070
комфорт отдыха с детьми
-,086
,078
,179
,221
,874
возможность лечения, ухода за
здоровьем
,991
-,071
,026
-,021
,006
организация детского отдыха
-,084
,400
,087
,659
-,004

48.

Группировка переменных
Фактор
Переменные исходного массива
Коэффициенты
корреляции
1
Тишина, уединение
возможность лечения, ухода за
здоровьем
,988
,991
2
близость к городу
уровень комфорта
,852
,793
3
хорошее питание
наличие развлечений
,831
-,797
4
близость водоема, леса
организация детского отдыха
,664
,659
5
приемлемые цены
комфорт отдыха с детьми
,622
,874

49.

Новые переменные

50.

Новые переменные:
Значения новых переменных (факторов), представленные не совпадают с
кодировкой переменных исходного массива.
Ответы респондентов на вопрос анкеты «Что для Вас самое важное во время
отдыха?» варьировались от «1» («очень важно») до «5» («совсем не важно»).
При вычислении средних балльных оценок значения компонента факторной
модели производится трансформация балльных оценок данных из интервала «от
1 до 5» в интервал «от -2 до 2».
Значение новых переменных следует интерпретировать таким образом: чем
больше отрицательное значение новой переменной, тем она важнее; чем больше
положительное значение новой переменной, тем она менее важна.
Новые переменные могут быть использованы для дальнейших исследований. В
рассматриваемом примере факторный анализ произведен с целью сокращения
исходного массива данных для дальнейшего проведения кластерного анализа.

51.

Список рекомендуемой литературы
1. Изакова Н. Б.. Маркетинговые исследования с применением
пакета SPSS [Электронный ресурс]:учебное пособие. Екатеринбург: [2018]. Режим доступа:
http://meu.usue.ru/lessons/index.html
2. Солосиченко Т. Ж.. Маркетинговые исследования [Электронный
ресурс]:учебное пособие. - Екатеринбург: [Издательство УрГЭУ],
2017. - 121 с. Режим доступа:
http://lib.usue.ru/resource/limit/ump/17/p488707.pdf
3. Басовский Л. Е., Басовская Е. Н.. Маркетинг [Электронный
ресурс]:учебное пособие для студентов вузов, обучающихся по
направлению 38.03.02 "Менеджмент". - Москва: ИНФРА-М, 2016. 300 с. – Режим доступа: http://znanium.com/go.php?id=544241
English     Русский Rules