Лекция 9
План лекции:
Средства, используемые для описания корреляционных связей, составляющие содержание регрессионного анализа:
Уравнение линейной регрессии:
Уравнение линейной регрессии:
Схема линий регрессии Y по Х, и Х по Y в системе прямоугольных координат
Интерпретация параметров регрессии
Применение регрессионного анализа
Расчет коэффициентов регрессии, через коэффициент корреляции
Расчет коэффициентов регрессии
Для группирируемых выборок
Параметры уравнения линейной регрессии:
Параметры уравнения линейной регрессии:
Эмпирические и выравненные линии регрессии
Способы выравнивания эмпирических рядов регрессии:
Графический способ выравнивания
Способ скользящей средней
способ наименьших квадратов
Метод наименьших квадратов сводится к решению следующих задач:
Оценка достоверности показателей регрессии осуществляется по формулам:
Тест по теме:
Уравнение линейной регрессии имеет вид:
Изменение функции в зависимости от изменения одного или нескольких аргументов называется …
Укажите неправильный вариант ответа. Замена ломаных линий регрессии на плавно идущие в системе прямоугольных координат может
Что показывают коэффициенты регрессии в уравнении множественной регрессии?
Ряды регрессии – это …
Формула описывающая коэффициент корреляции в генеральных совокупностях X и Y
Формула для расчета оценки непараметрического коэффициента корреляции Спирмена
Как оценивается статистическая значимость коэффициента корреляции?
С каким знаком может быть коэффициент корреляции между переменными X и Y?
СПАСИБО ЗА ВНИМАНИЕ!
1.29M
Category: mathematicsmathematics

Регрессионный анализ. Эмпирические модели. Понятия регрессии. Уравнение линейной регрессии. (Лекция 9)

1. Лекция 9

Регрессионный анализ

2. План лекции:

Эмпирические модели. Понятия регрессии.
Уравнение линейной регрессии. Интерпретация
коэффициентов уравнения линейной регрессии.
Эмпирическая линия регрессии: графический,
скользящего среднего. Метод наименьших
квадратов.
Нелинейная
регрессия.
Выбор
формы
функциональной зависимости.

3.

Корреляционную зависимость между
признаками можно описывать разными
способами. В частности, любая форма связи
может быть выражена уравнением общего вида
y=f(x),
где признак у — зависимая переменная, или
функция от независимой временной X,
называемой аргументом.

4.

Регрессией
- называется изменение функции в
зависимости от изменений
одного и нескольких
аргументов

5.

Термин «регрессия»
(от лат. regressio—движение назад)
ввел Гальтон.
Изучая статистическим методом наследование количественных
признаков, он обнаружил, что потомство высокорослых и
низкорослых родителей отклоняется регрессирует) от них на 1/3 в
сторону среднего уровня этого признака в данной популяции.

6. Средства, используемые для описания корреляционных связей, составляющие содержание регрессионного анализа:

-
Таблицы;
-
Формула;
-
Графики.

7.

Для выражения регрессии служат эмпирические и
теоретические ряды, их графики — линии
регрессии, а также корреляционные
уравнения (уравнения регрессии) и коэффициент
линейной регрессии.

8.

Показатели регрессии выражают корреляционную
связь двусторонне, учитывая изменение средней
величины ух признака Y при
изменении значений xi признака X, и, наоборот,
показывают изменение средней величины ху признака X
по измененным значениям yi
признака Y.

9.

10. Уравнение линейной регрессии:

y a bx1 cx2 dx3 .......,
где: a, b, с и d — параметры уравнения,
определяющие соотношение между
аргументами и функцией.

11. Уравнение линейной регрессии:

y a bx
Где:
а — свободный член;
b – коэффициент регрессии.

12. Схема линий регрессии Y по Х, и Х по Y в системе прямоугольных координат

13.

Параметр а (свободный член регрессии) —
графически
представляет
отрезок
ординаты (у) в системе прямоугольных
координат.
Параметр b (коэффициент регрессии) —
угловой
коэффициент,
определяющий
наклон линии регрессии по отношению к
осям координат.

14. Интерпретация параметров регрессии

Параметры bi являются частными коэффициентами
корреляции; (bi)2 интерпретируется как доля
дисперсии Y, объясненная Xi, при закреплении
влияния остальных предикторов, т.е. измеряет
индивидуальный вклад в объяснение Y.
В случае коррелирующих предикторов возникает проблема неопределенности в
оценках, которые становятся зависимыми от порядка включения
предикторов в модель. В таких случаях необходимо применение методов
анализа корреляционного и пошагового регрессионного анализа.

15. Применение регрессионного анализа

Определение
наличия
и
характера
(математического уравнения, описывающего
зависимость) связи между переменными
Определение степени детерминированности
вариации
критеральной
переменной
предикторами
Предсказать значение зависимой переменной с
помощью независимой
Определить вклад независимых переменных в
вариацию зависимой

16. Расчет коэффициентов регрессии, через коэффициент корреляции

byõ r
(y
(x
i
i
y)
x)
2
2
bxy r
(x
(y
i
i
x)
2
y)
2

17. Расчет коэффициентов регрессии

byx
( y y)( x x)
( x x)
i
i
2
i
byx r
S y iy
S x ix
bxy
( y y)( x x)
( y y)
i
i
2
i
S xix
bxy r
S yiy

18. Для группирируемых выборок

byx
p
xy
xy
( px x)( p y y )
n
2
(
p
x
)
x
2
p
x
x
n
bxy
p
xy
xy
( px x)( p y y )
2
p
y
y
n
( p y y ) 2
n

19. Параметры уравнения линейной регрессии:

Определение параметров линейной регрессии —
одна из задач регрессионного анализа. Она
решается способом наименьших квадратов,
основанным на требовании, чтобы сумма
квадратов отклонений вариант от линии
регрессии была наименьшей. Этому требованию
удовлетворяет следующая система
нормальных уравнений:

20. Параметры уравнения линейной регрессии:

21.

Ряды регрессии — это ряды усредненных значений
(ух и ху) варьирующих признаков Y и X,
соответствующих значениям аргументов yi и xi

22.

Выравниванием эмпирических линии регрессии называется замена ломаных линий регрессии
на плавно идущие в системе
прямоугольных координат.

23. Эмпирические и выравненные линии регрессии

24. Способы выравнивания эмпирических рядов регрессии:

Графический
Способ скользящей средней
Способ наименьших квадратов

25. Графический способ выравнивания

Наиболее простой способ, не требующий
вычислительной работы.
Эмпирический ряд регрессии изображается в виде
линейного графика в системе прямоугольных
координат. Затем на глаз определяются
серединные точки регрессии, но которым с
помощью линейки или лекала проводится
сплошная линия.
Недостаток способа: он не исключает влияние на результаты выравнивания
регрессии индивидуальных свойств исследователя. Поэтому в тех
случаях, когда необходима более высокая точность при замене
ломаных линий регрессии на плавно идущие, пользуются другими
способами выравнивания эмпирических рядов.

26. Способ скользящей средней

Сводится к последовательному вычислению ряда
средних
арифметических
из двух, трех
соседних членов эмпирического ряда регрессии.
Он удобен особенно в тех случаях, когда эмпирический ряд представлен
достаточно большим числом членов, так что потеря двух из них
(крайних), что неизбежно при этом способе выравнивания, заметно не
отразится на его структуре.

27. способ наименьших квадратов

Предложен в 1806 году К. Гауссом и независимо от него
А. Лежандром.
Наиболее точный из всех способов выравнивания
эмпирических рядов.
В основу положена теорема, согласно которой сумма
квадратов отклонений вариант (xi) от средней
арифметической (х) есть величина наименьшая, т.е.
∑(хi-x)=min.
Метод нашел широкое применение не только в
биологии, но и в технике.

28. Метод наименьших квадратов сводится к решению следующих задач:

ПО ГЕОМЕТРИЧЕСКОМУ МЕСТУ ТОЧЕК ДВУХ ПЕРЕМЕННЫХ В СИСТЕМЕ ПРЯМОУГОЛЬНЫХ
КООРДИНАТ ПОДБИРАЮТ МАТЕМАТИЧЕСКИЕ УРАВНЕНИЕ, НАИЛУЧШИМ ОБРАЗОМ ОТОБРАЖАЮЩЕЕ
ФОРМУ СВЯЗИ МЕЖДУ ЭТИМИ ВЕЛИЧИНАМИ.
ПОДСТАВЛЯЯ В ИСКОМОЕ УРАВНЕНИЕ СООТВЕТСТВУЮЩИЕ ЭМПИРИЧЕСКИЕ ДАННЫЕ, ОБРАЗУЮТ
СИСТЕМУ НОРМАЛЬНЫХ УРАВНЕНИЙ, РЕШАЯ КОТОРУЮ НАХОДЯТ ПАРАМЕТРЫ ЭТОГО УРАВНЕНИЯ.
ПОДСТАВЛЯЯ ПАРАМЕТРЫ В ОБЩЕЕ УРАВНЕНИЕ, ПОЛУЧАЮТ ЭМПИРИЧЕСКОЕ УРАВНЕНИЕ РЕГРЕССИИ,
ВЫРАЖАЮЩЕЕ ЗАВИСИМОСТЬ МЕЖДУ ПЕРЕМЕННЫМИ ВЕЛИЧИНАМИ Y И X.
ПОДСТАВЛЯЯ В ЭМПИРИЧЕСКОЕ УРАВНЕНИЕ ЗНАЧЕНИЕ ОДНОЙ ПЕРЕМЕННОЙ (X), НАХОДЯТ
СООТВЕТСТВУЮЩИЕ СРЕДНИЕ ЗНАЧЕНИЯ ДРУГОЙ ПЕРЕМЕННОЙ (УХ). ПОЛУЧАЕТСЯ РЯД ТЕОРЕТИЧЕСКИ
ОЖИДАЕМЫХ (ВЫРАВНЕННЫХ) ЗНАЧЕНИЙ ФУНКЦИИ ПО ИЗВЕСТНЫМ ЗНАЧЕНИЯМ АРГУМЕНТА.
РАССЧИТАННЫЕ ПО ЭТИМ УРАВНЕНИЯМ ЗНАЧЕНИЯ УХ И ХУ ИЗОБРАЖАЮТ В ВИДЕ ВЫРАВНЕННЫХ ЛИНИЙ
РЕГРЕССИИ Y ПО X И X ПО Y.

29. Оценка достоверности показателей регрессии осуществляется по формулам:

sbyx
( yi y )( xi x)
2
(
y
y
)
i
2
(
x
x
)
i
2
(n 2) ( xi x) 2
sbxy
( yi y )( xi x)
2
(
y
y
)
i
2
(
y
y
)
i
(n 2) ( yi y ) 2
2

30.

Временные ряды, или ряды динамики,
показывающие изменение признаков во времени.
Регрессия таких рядов является односторонней.

31. Тест по теме:

«Регрессионный
анализ»

32. Уравнение линейной регрессии имеет вид:

y
a
bx
y a bx
y ab x
y
a b
x

33. Изменение функции в зависимости от изменения одного или нескольких аргументов называется …

дисперсией
сессией
регрессией
дипрессией

34. Укажите неправильный вариант ответа. Замена ломаных линий регрессии на плавно идущие в системе прямоугольных координат может

способом
прямоугольника
латинского
графическим способом
способом
наименьших
квадратов
способом скользящей средней

35. Что показывают коэффициенты регрессии в уравнении множественной регрессии?

зависимость между переменными случайной величины
зависимость переменной y от одного из признаков x1, x2
размерность независимых переменных
нет правильного варианта

36. Ряды регрессии – это …

ряды усредненных значений (yx и xy)
варьирующих признаков y и x
соответствующих значениям аргументов yi и xi
система уравнений для определения значений
у и х при составлении уравнения регрессии
ряды динамики переменных х и y
другой вариант ответа

37.

38. Формула описывающая коэффициент корреляции в генеральных совокупностях X и Y

а)
r
б)
в)
x
i
x ( yi y )
( n 1) S x S y
cov x, y
x
y
r
г) другой вариант ответа

39. Формула для расчета оценки непараметрического коэффициента корреляции Спирмена

6 d i 2
а)
rs 1
б)
в)
r
N ( N 2 1)
Cxy
C2 x C2 y
другой вариант ответа
г)

r
N 2
1 r2

40. Как оценивается статистическая значимость коэффициента корреляции?

а)
б)
в)
г)
H0 : 0
H0 : 0
H0 : 0
H0 : 0
English     Русский Rules