Similar presentations:
Модель парной линейной регрессии
1. МОДЕЛЬ ПАРНОЙ ЛИНЕЙНОЙ РЕГРЕССИИ
№домохозяйства
Среднедушевой доход
домохозяйства, д.е.
Объем спроса, ед.
1
100
24
2
200
42
3
150
35
4
80
24
5
160
39
2.
Сервис – Анализ данныхКоэффицие Стандарт
нты
ная ошибка
tстатисти
ка
P-Значение
Y-пересечение
9,334052
3,296116
2,831833
0,06609
Переменная X 1
0,170043
0,0228
7,458124
0,004991
y=0,17x+9,33 - функция спроса в зависимости
от дохода.
С ростом дохода на 1 ден.ед. спрос на товар
растет на 0,17 ед.
3. ПОКАЗАТЕЛИ КАЧЕСТВА УРАВНЕНИЯ РЕГРЕССИИ
Все показатели качества используют остатки:Y
y ax b
y3
e3
e4
y4
y1
e1
e2
y2
x1
x2
ei yi yi yi axi b
x3
x4
называется остатком
4. Как оценить качество построенной модели?
Построим прогноз по модели по формулеy 0,17x+9,33
5. Как оценить качество построенной модели?
Вычисляем остаткиe y y
6. Как оценить качество построенной модели?
Находим относительную ошибку аппроксимацииA
y y
y
Процентный формат
7. Как оценить качество построенной модели?
Находим среднюю относительную ошибку аппроксимациисреднее по столбцу
В среднем прогноз отличается от наблюдаемого значения на 4,83%
8. Как оценить качество построенной модели?
Еще один показатель качества – коэффициент детерминацииДля его вычисления вычисляем сумму квадратов остатков ESS
(Error Sum of Squares)
Сумма по столбцу
9. Вычисляем суммы квадратов - остаточную, регрессионную и общую
nESS yi yi
i 1
n
2
– error sum of squares, остаточная сумма квадратов
отклонений
TSS yi y ns y2
2
i 1
n
RSS yi y
i 1
2
– total sum of squares, общая сумма квадратов
отклонений
– regression sum of squares, регрессионная сумма
квадратов отклонений
Теорема TSS=RSS+ESS
10. Коэффициент детерминации R2
Коэффициентом детерминации называют числоRSS
R
TSS
2
TSS ESS
ESS
R
1
TSS
TSS
2
Коэффициентом детерминации - это доля дисперсии признака y, объясненная
регрессией в общей дисперсии признака y
11. Свойства коэффициента детерминации R2
RSSR
TSS
2
1)
0 R2 1
12. Свойства коэффициента детерминации R2
RSSESS
R
1
TSS
TSS
2
2) Если
R 2 1 , то линия регрессии точно соответствует всем наблюдениям
и между x и y существует линейная функциональная зависимость.
y = 3-2*x
5
45
0
40
-5
35
-10
30
-15
25
-20
y
y
y = 3+2*x
50
20
-25
15
-30
10
-35
5
-40
0
-45
0
2
4
6
8
10
12
x
14
16
18
20
22
0
2
4
6
8
10
12
x
14
16
18
20
22
13. Свойства коэффициента детерминации R2
RSSESS
R
1
TSS
TSS
2
3) Если
R 2 0 , то линия регрессии параллельна оси абсцисс и переменная y
не зависит от переменной x.
y = -0,086+0,0002*x
4
3
2
1
y
0
-1
-2
-3
-4
-20
0
20
40
60
80
100
120
x
140
160
180
200
220
240
260
14. Свойства коэффициента детерминации R2
RSSESS
R
1
TSS
TSS
2
4) В случае парной линейной регрессии
R cor ( x, y )
2
2
15.
ДИСПР(y)ESS
R 1
2
n sy
2
94,9% вариации спроса на продукт объясняется доходом и остальные 5,1%
прочими факторами, не включенными в модель
16.
50y = 0,17x + 9,3341
45
R2 = 0,9488
40
35
30
25
20
15
10
5
0
0
50
100
150
200
250
17. Стандартная ошибка регрессии (средняя квадратическая ошибка) s
11 n
s
ESS
yi axi b
n 2
n 2 i 1
2
18. Пример построения уравнения регрессии
При анализе зависимости объема потребления Y (у.е.)домохозяйства от располагаемого дохода X (у.е.) отобрана
выборка объема n = 12 (помесячно в течение года), результаты
которой приведены в таблице:
18
19. Пример построения уравнения регрессии
Т.о., уравнение парной линейной регрессии имеет вид:Y 0,9361X 3, 423
150
y = 0,9361x + 3,4226
140
y
130
120
110
100
90
100
110
120
130
140
150
160
x
19
20. Пример построения уравнения регрессии
R 2 0,981 n
s
yi axi b
n 2 i 1
2
RSS
ESS
TSS
Y 0,9361X 3, 423
20
21.
Y 0,9361X 3, 423e Y Y
a=abs(e)/y
A 1, 08%
22.
ПРИМЕР УРАВНЕНИЯ ПАРНОЙ РЕГРЕССИИ140
120
zpl
100
80
60
40
20
0
0
5
10
15
20
25
n
Данные 2002 г. о часовой заработной плате ($ США) и уровне образования (лет) по 540
респондентам из национального опроса в США.
12 лет – средняя школа
13-16 лет – колледж (бакалавриат)
17-18 лет – университет ( магистратура)
19-20 лет - PhD
23.
ПРИМЕР УРАВНЕНИЯ ПАРНОЙ РЕГРЕССИИZpl=-12,6188+2,3651N
140
y = 2,3651x - 12,617
R2 = 0,1714
120
zpl
100
80
60
40
20
0
0
5
15
10
20
25
n
Увеличении уровня образования на один год приведет в среднем к увеличению
почасовой заработной платы на $2.37
24.
ПРИМЕР УРАВНЕНИЯ ПАРНОЙ РЕГРЕССИИR 2 0,17
1 n
s
yi axi b
n 2 i 1
Zpl=-12,6168+2,3651N
2
25.
Zpl=-12,6188+2,3651Ne=zpl-прогноз
a=abs(e)/zpl*100
A 56,51%