475.00K
Category: mathematicsmathematics

Оценка статистической значимости уравнения линейной регрессии с помощью F-критерия Фишера

1.

Оценка статистической
значимости уравнения линейной
регрессии с помощью
F-критерия Фишера

2.

• F-критерий Фишера заключается в
проверке гипотезы Н0 о статистической
незначимости уравнения регрессии.
• Для оценки статистической значимости
линейной регрессии выполняется
сравнение фактического значений
F-критерия (Fфакт) и критического
(табличного) значения F-критерия (Fтабл)

3.

• Формулы для вычислений Fфакт
Dфакторная
2
R
Fфакт
(n 2)
2
Dостаточная 1 R
Dфакторная
Dостаточная
2
ˆ
( yix y )
m
2
ˆ
( yix yi )
n m 1
m число параметров при переменных x
n число признаков в совокупности

4.

Для линейной парной регрессии
Dфакторная ( yˆ ix y )
Dостаточная
2
( yˆ y )
ix
n 2
i
2

5.

• В регрессионном анализе часто
используется понятие числа степеней
свободы

6.

Количество степеней свободы
для дисперсий:
Линейная регрессиия
Dфакторная m
Dостаточная n - m - 1
Парная линейная регрессиия
Dфакторная 1
Dостаточная n - 2

7.

• Fтабл - это максимально возможное
значение F-критерия под влиянием
случайных факторов, при данных
степенях свободы и уровне
значимости α.
Уровень значимости α – это
вероятность отвергнуть правильную
гипотезу при условии, что она верна.
• Для расчетов обычно берут α=0,05 или
α=0,01

8.

Fтабл находят по статистическим
таблицам в виде: Fα,k1,k2 ( α – уровень
значимости, k1 – количество степеней
свободы Dфакт, k2 – количество
степеней свободы Dост).

9.

1) Fтабл<Fфакт, то гипотеза H0 о
статистической незначимости
уравнения регрессии отклоняется и
признается надежность регрессионной
модели.

10.

2) Fтабл>Fфакт, то гипотеза о
статистической незначимости
уравнения регрессии принимается и
признается влияние случайных
факторов и как следствие
ненадежность регрессионной модели.

11.

• В линейной регрессии обычно
оценивается не только значимость
уравнения регрессии, но и отдельных
её показателей.

12.

Оценка статистической
значимости параметров
линейной регрессии (a и b) и
коэффициента корреляции (rxy)
с помощью
t-критерия Стьюдента

13.

• t-критерий Стьюдента заключается в проверке
гипотезы Н0 о случайной природе показателей, т.е.
о статистической незначимости параметров.
• Для оценки статистической значимости
параметров выполняется сравнение фактического
значений t-критерия Стьюдента (tфакт) и
критического (табличного) значения t-критерия
Стьюдента (tтабл).

14.

1) tтабл < tфакт , то гипотеза H0 о
статистической незначимости
параметров отклоняется и признается
его надежность.

15.

2) tтабл > tфакт, то гипотеза о
статистической незначимости
параметров принимается и признается
влияние случайных факторов и как
следствие его ненадежность.

16.

Для расчета фактического значения t-критерия
Стьюдента (tфакт) используются следующие
формулы:
1) Параметр регрессии b:
b
tb
mb
mb стандартная ошибка параметра b
Dост
mb
2
( xi x )
( y ŷ ) /( n 2 )
( x x )
2
i
ix
2
i

17.

Примечание :
Для линейной регрессии
tb Fфакт

18.

2) Параметр регрессии а:
а


mа стандартная ошибка параметра а
x
m D
n ( x x )
( y ŷ ) x
(n 2)
n ( x x )
2
а
ост
2
i
2
i
2
ix
i
2

19.

3) Коэффициент корреляции rxy:
rxy
tr
mr
mr стандартная ошибка rxy
1 ( rxy ) 2
mr
n 2

20.

Примечание :
Для линейной регрессии
tr tb Fфакт

21.

tтабл находят по статистическим таблицам в
виде: tα,k ( α – уровень значимости,
k – количество степеней свободы Dост).

22.

Интервальные оценки параметров
линейного уравнения регрессии
Опр.: Интервальная оценка параметра А
называется числовой интервал (a,b), который
с заданной вероятностью α накрывает
неизвестное значение параметра.
Такой интервал называют доверительным, а
вероятность α - доверительной
вероятностью или надежностью оценки.
a
A
b

23.

• Для расчета доверительных интервалов
определяют предельную ошибку для
каждого показателя:
а tтабл ma
b tтабл mb

24.

Доверительный интервал
для параметра а
а ( а а ,а а )
Доверительный интервал
для параметра b
b ( b b ,b b )

25.

Примечание: Если в границы
доверительного интервала попадает 0
(т.е. нижняя граница отрицательна, а
верхняя положительна), то
оцениваемый параметр принимается
равным 0, т.к. он одновременно не
может принимать положительные и
отрицательные значения.

26.

Интервалы прогноза по линейному
уравнению регрессии
Обозначения :
x независимая переменная
y фактическое значение
зависимой переменной
yˆ x теоретическое ( расчетное)
значение y
yˆ p предсказывемое или прогнозное значение y

27.

Прогнозное значение ŷ p получается
путем подстановки независимой
переменной х р в уравнение регрессии :
ŷ p а b x p

28.

• В результате получается точечный
прогноз, однако, он не может быть
точным, поэтому дополняется расчетом
стандартной ошибки прогноза и
построением доверительного
интервала прогноза.

29.

Стандартная ошибка прогноза :
1 ( xp x )
m ŷ p Dост 1
2
n ( xi x )
2
Предельная ошибка прогноза :
ŷ p t табл m ŷ p
Доверительный интервал прогноза :
ŷ p ( ŷ p ŷ p , ŷ p ŷ p )
English     Русский Rules