745.04K
Category: mathematicsmathematics

Основы регрессионного анализа

1.

ОСНОВЫ РЕГРЕССИОННОГО АНАЛИЗА
• Регрессионный анализ заключается в нахождении наиболее важных факторов, которые влияют
на зависимую переменную.
• Примеры:
• 1. Моделирование числа поступивших в университет для лучшего понимания факторов,
удерживающих детей в том же учебном заведении.
• 2. Моделирование потоков миграции в зависимости от таких факторов как средний уровень
зарплат, наличие медицинских, школьных учреждений, географическое положение…
• 3. Моделирование дорожных аварий как функции скорости, дорожных условий, погоды и т.д.,
• 4. Моделирование потерь от пожаров как функции от таких переменных как количество
пожарных станций, время обработки вызова, или цена собственности.

2.

УРАВНЕНИЕ РЕГРЕССИИ - ЭТО МАТЕМАТИЧЕСКАЯ ФОРМУЛА, ПРИМЕНЯЕМАЯ К НЕЗАВИСИМЫМ
ПЕРЕМЕННЫМ, ЧТОБЫ ЛУЧШЕ СПРОГНОЗИРОВАТЬ ЗАВИСИМУЮ ПЕРЕМЕННУЮ, КОТОРУЮ
НЕОБХОДИМО СМОДЕЛИРОВАТЬ
• Зависимая переменная (ЗП) — это переменная, описывающая процесс, который мы пытаемся
предсказать или понять. Зависимая переменная - это функция независимых переменных.
• Независимые переменные (НЗ) это переменные, используемые для моделирования или
прогнозирования значений зависимых переменных. В уравнении регрессии они располагаются
справа от знака равенства и часто называются объяснительными переменными.
• Коэффициенты регрессии (β) — это коэффициенты, которые рассчитываются в результате
выполнения регрессионного анализа. Вычисляются величины для каждой независимой
переменной, которые представляют силу и тип взаимосвязи независимой переменной по
отношению к зависимой.
• Невязки. Существует необъяснимое количество зависимых величин, представленных в уравнении
регрессии как случайные ошибки ε.

3.

ДОПУЩЕНИЯ РЕГРЕССИОННОГО АНАЛИЗА
• 1. Переменные модели должны иметь распределение, близкое к нормальному.
• 2. Зависимая и независимые переменные должны быть измерены в метрической
шкале.
• 3. Для построения линейных регрессий, зависима и независимые переменные
должны иметь линейную связь.

4.

АНАЛИЗ РЕЗУЛЬТАТОВ:
• 1. Основные результаты применения МРА:
• R – КМК (таблица «Сводка для модели»);
• F – критерий Фишера и p статистической значимости КМК (таблица
«Дисперсионный анализ»);
• R2 - КМД (таблица «Сводка для модели»);
• β (Beta) – стандартизированные коэффициенты регрессии и р (таблица
«Коэффициенты»);
• B – коэффициенты регрессии (регрессионного уравнения) (таблица
«Коэффициенты»);

5.

ОБЩИЙ ВИД УРАВНЕНИЯ РЕГРЕССИИ:
У = B + B1X1 + B2X2 + … + BPXP + E, ГДЕ
У – ЗП,
X1, X2 …– НАИМЕНОВАНИЯ НП,
B – КОНСТАНТА, B1, B2 И Т.Д. – КОЭФФИЦИЕНТЫ РЕГРЕССИИ (НЕСТАНДАРТИЗОВАННЫЕ),
Е – ОШИБКА ОЦЕНКИ.
• Коэффициент множественной корреляции (КМК)– мера линейной связи одной
переменной с множеством других переменных (основной показатель
состоятельности модели МРА)
• Коэффициент множественной детерминации R-квадрат (КМД) – часть
дисперсии «зависимой переменной», обусловленной влиянием «независимых»
переменных (равен квадрату значения КМК). R-квадрат показывает, какую долю
изменчивости (можно выразить в процентах) зависимой переменной (Y)
объясняет независимая переменная (регрессионная модель).

6.

ЭТАПЫ РЕГРЕССИОННОГО
АНАЛИЗА
(ПОШАГОВО НАЗАДОБРАТНАЯ ПОШАГОВАЯ
РЕГРЕССИЯПОСЛЕДОВАТЕЛЬНО
ИСКЛЮЧАЮТСЯ НАИМЕНЕЕ
ЗНАЧИМЫЕ ФАКТОРЫ)

7.

ЭТАПЫ РЕГРЕССИОННОГО АНАЛИЗА (ПРОДОЛЖЕНИЕ)

8.

ЭТАПЫ РЕГРЕССИОННОГО
АНАЛИЗА (ПРОДОЛЖЕНИЕ)

9.

ЭТАПЫ РЕГРЕССИОННОГО АНАЛИЗА (ПРОДОЛЖЕНИЕ)

10.

АНАЛИЗ РЕЗУЛЬТАТОВ:
• Таблица Включенные/Исключенные переменные : общее число моделей –
исключенные модели (определяется число моделей)
• Таблица Сводка для модели (определяется % дисперсии по R-квадрату в долях от 1)
В примере «Имеющаяся регрессионная модель объясняет 32,6% дисперсии зависимой
переменной,
• Таблица Дисперсионный анализ: смотреть критерий Фишера и уровень значимости является незначимой по критерию Фишера (р >0,05)
• Таблица Коэффициенты – коэффициенты регрессии перед НП (независимыми
переменными)

11.

ПРИМЕР ОПИСАНИЯ:
• Уравнение регрессии имеет следующий вид у = b + b1x1 + b2x2 + … + bpxp + e,
где у – ЗП, x1, x2 …– наименования НП, b – константа, b1, b2 и т.д. – коэффициенты
регрессии (нестандартизованные), е – ошибка оценки.
• В нашем случае:
П (ЗП)=1,257П+1,168А+1,033С (по степени убывания)

12.

СПАСИБО
English     Русский Rules