Similar presentations:
Анализ товарного предложения персональных компьютеров в онлайн - магазинах
1.
Итоговый проект по программе«Data-аналитик: старт карьеры»
Поток № ДА-102 / 2023
Кривченко И.В.
data-diving
академия аналитики данных
при Томском государственном
университете
2.
Анализ товарного предложенияперсональных компьютеров
в онлайн-магазинах
Бизнес-цель заказчика:
выйти на онлайн-рынок розничных продаж
с товаром и услугой «Продажа персональных компьютеров плюс их
постпродажное сопровождение»
Объект исследования: онлайн-рынок розничных продаж в
категории «Персональные компьютеры»
Предмет исследования: влияние характеристик персональных
компьютеров на их цену и популярность
3.
Анализ товарного предложенияперсональных компьютеров
в онлайн-магазинах
Цели анализа:
•Понимание актуальности, полноты и репрезентативности данных
из открытых источников по товарному предложению для
последующего анализа и выработки рекомендаций
•Выявление возможных взаимосвязей между характеристиками
различных товарных предложений и их розничной ценой, а также
популярностью
•Формулирование рекомендаций по выходу на онлайн-рынок
4.
1 этап исследованияРазработка аналитического решения (CRISP-DM)
1. Понимание бизнеса
классический магазин – онлайн магазин маркетплейса
товар: персональные компьютеры (системные блоки)
услуги: доставка и постпродажное сопровождение
2. Понимание данных
входные данные: полнота, актуальность, репрезентативность
выходные данные: интерпретируемость, практическая значимость
3. Подготовка данных
входные данные для анализа: зона ответственности заказчика
выходные данные анализа: зона ответственности аналитика
Моделирование и оценка результатов, внедрение и контроль
зона ответственности заказчика
5.
2 этап исследованияОбсуждение входных данных
Актуальность (на данный момент и процессуальная)
• Дата появления товарного предложения
• Отсутствие «истории цены» за период предложения /или/
• Присутствие дат в «истории цены» за период предложения
Полнота данных и репрезентативность выборки
• Технические характеристики и постпродажное обслуживание
• Динамика цены (в т.ч. накопительных скидок) и динамика продаж
• Репрезентативность выборки для статистически значимых выводов
6.
3 этап исследованияРезультаты предобработки и разведки
Процентные доли от объема начальной выборки
Характеристики выборки
• До предобработки: 4500 наблюдений
• После: 790 наблюдений, то есть 18%
• Вопрос о репрезентативности?
• По 82% предложений нет продаж
• По 97% – продаж было 5 и менее...
• Почему: цена и/или экспозиция?
120%
100%
100%
77%
80%
60%
40%
18%
20%
3%
0%
Начальная выборка
Принято к анализу
Ненулевые продажи
Продано более 5 раз
• Хорошая новость – есть 10 признаков, пригодных для статистического анализа
• Плохая новость – без дат невозможна идентификация: цена и/или экспозиция.
7.
3 этап исследованияРезультаты предобработки и разведки
Если без дат/периодов, то:
8.
4 этап исследованияОбсуждение целевых показателей
1. Целевой показатель: популярность
• Популярность товара = Количество продаж этого товара (в штуках)
• Периоды экспозиции сравниваемых товаров (в днях или неделях)
Скорректированная
популярность товара
Количество продаж товара
= ----------------------------------------------Время экспозиции товара
2. Целевой показатель: цена
• Цена товара = Двухмерный массив [ Даты, Цены ]
9.
Результаты исследования(продолжение следует)
1. Популярная ценовая категория: 25-30 тыс рублей
• Товары в этой категории продаются сотнями (более 300-400)
• Это, как правило, в десятки раз больше, чем в других категориях
• Примечание: количества подсчитаны за неизвестные периоды экспозиции
2. Явные лидеры продаж (в «исторических» пределах выборки)
• Игровой компьютер i7-2600 16Gb SSD 512Gb GT 730 4Gb, цена 32900 руб
• Компьютер Raskat Pentium G6400/4Gb/120Gb SSD/DP,HDMI,LAN/UMA, 36990 руб
• Примечание: периоды экспозиции неизвестны; продаж более 800
3. Продолжение исследования возможно после досбора информации
• Для корректного изучения целевых показателей нужны даты/интервалы
10.
Результаты исследования(рекомендации заказчику)
1. Организовать досбор информации о датировках
• Цель-минимум: дата начала экспозиции каждого товара
• Цель-оптимум: кроме даты начала экспозиции, нужны даты переоценок
• Цель-максимум: недельные/месячные лаги сбора информации
2. По возможности выяснить из доступных источников
• Отсутствие информации о количестве продаж – это ноль продаж?
• Исходные данные – из одного магазина или одного маркетплейса?
3. Сформулировать пожелания для кластеризации
• Например, группировать компоненты по брендам, по объему памяти, и т.п.