ЛЕКЦИЯ 9
9.1. Зависимости, встречающиеся в природе
Основные типы зависимостей между переменными:
Корреляционные зависимости
Задача корреляционного анализа:
9.2. Коэффициент корреляции
Показатель ковариации:
Коэффициент корреляции Пирсона:
Пределы колебаний коэффициента корреляции:
Интерпретация коэффициента корреляции:
Недостаток коэффициента корреляции Пирсона:
9.3. Статистическая значимость коэффициента корреляции
Стандартная ошибка коэффициента корреляции при больших n:
Стандартная ошибка коэффициента корреляции при n < 100:
Связь между признаками отсутствует:
Случайная выборка может показать наличие связи:
Оценка значимости коэффициента корреляции на основе t-критерия:
Подставляем формулу для вычисления sr:
Интерпретация t-теста:
9.4. z-преобразование Фишера
z-преобразование коэффициента корреляции по Фишеру:
Пределы колебаний величины z:
Оценка значимости z по t-критерию:
z-преобразование по Фишеру:
9.5. Минимальное число наблюдений для планируемой точности коэффициента корреляции
Необходимый объем выборки для заданной точности коэффициента корреляции:
Пример:
9.6. Сравнение двух коэффициентов корреляции
Оценка значимости разницы между коэффициентами корреляции:
9.7. Коэффициент корреляции Спирмена
Ранговый коэффициент корреляции Спирмена (Spearman):
9.8. Корреляция между качественными признаками
Коэффициент ассоциации:
Оценка значимости коэффициента ассоциации:
309.50K
Category: mathematicsmathematics

Корреляционный анализ. Лекция 9

1. ЛЕКЦИЯ 9

КОРРЕЛЯЦИОННЫЙ
АНАЛИЗ

2. 9.1. Зависимости, встречающиеся в природе

3. Основные типы зависимостей между переменными:

• Функциональные
2
(например, S = πr );
• Корреляционные
(=статистические)

4. Корреляционные зависимости

значению одного признака соответствует
целая гамма значений другого признака
выявляются только на групповых объектах
с применением методов статистики

5. Задача корреляционного анализа:

…установить форму,
направление
и тесноту связи, а также
оценить ее статистическую
значимость.

6. 9.2. Коэффициент корреляции

7. Показатель ковариации:

1
Cov [ ( xi x )( yi y )]
n
Недостаток: предполагается,
что оба признака выражаются
в одинаковых единицах.

8. Коэффициент корреляции Пирсона:

n
1
( xi x )( yi y )
n i 1
r
sx s y
n
( x x )( y y )
r
(x x) ( y y)
i
i 1
i
2
i
i
2

9. Пределы колебаний коэффициента корреляции:

-1 ≤ r ≤ +1

10.

11. Интерпретация коэффициента корреляции:

|r| > 0.7 - тесная связь;
|r| = 0.5 – 0.6 - зависимость
средней степени;
|r| < 0,4 – слабая связь.

12. Недостаток коэффициента корреляции Пирсона:

характеризует лишь линейные
зависимости между нормально
распределенными признаками…

13. 9.3. Статистическая значимость коэффициента корреляции

14. Стандартная ошибка коэффициента корреляции при больших n:

1 r
sr
n
2

15. Стандартная ошибка коэффициента корреляции при n < 100:

Стандартная ошибка
коэффициента корреляции
при n < 100:
1 r
sr
n 2
2

16. Связь между признаками отсутствует:

y
ρ=0
x

17. Случайная выборка может показать наличие связи:

y
H0 : ρ = 0
x

18. Оценка значимости коэффициента корреляции на основе t-критерия:

r
t
sr
r
t
sr

19. Подставляем формулу для вычисления sr:

n 2
r n
t
r
t
2
2
1 r
1 r
n > 100
n < 100

20. Интерпретация t-теста:

При t > tα → НА
df = n – 2

21. 9.4. z-преобразование Фишера

22. z-преобразование коэффициента корреляции по Фишеру:

1 1 r
z ln
2 1 r
1 r
z 1,15129 lg
1 r

23. Пределы колебаний величины z:

z ( ; )
распределение близко к нормальному

24. Оценка значимости z по t-критерию:

z
tz z n 3
sz

25. z-преобразование по Фишеру:

этот критерий пригоден для выборки
любого объема!
позволяет с большей уверенностью
оценивать значимость r, а также
разность r1-r2

26. 9.5. Минимальное число наблюдений для планируемой точности коэффициента корреляции

27. Необходимый объем выборки для заданной точности коэффициента корреляции:

2
t
n 2 3
z

28. Пример:

n = 14, r = 0,428 z = 0,523
tz = 0.523√(14-3) = 1.73
1.73 < 2.18 (α = 0.05, df = 12)
Н0
2
(2.58)
6.656
n
3
3 24 3 27
2
(0.523)
0.274

29. 9.6. Сравнение двух коэффициентов корреляции

30. Оценка значимости разницы между коэффициентами корреляции:

t
r1 r2
s s
2
r1
t
2
r2
z1 z2
1
1
n1 3 n2 3
для малых
выборок

31. 9.7. Коэффициент корреляции Спирмена

32. Ранговый коэффициент корреляции Спирмена (Spearman):

6 d
rs 1
2
n(n 1)
2
d – разность между рангами
сопряженных значений
признаков X и Y

33.

X
Y
ранг X
ранг Y
d2
1.3
1.8
2.4
3.4
4.8

6.3
54.8
300
1335
250
946
670
1
2
3
4
5
2
12
1
8
7
1
100
4
16
4
380
1700
7
20
3
17
16
9
364
6 * 364
rs 1 3
0.73
20 20

34. 9.8. Корреляция между качественными признаками

35. Коэффициент ассоциации:

ad bc
(a b)(c d )( a c)(b d )
пределы изменений:
от -1 до +1

36. Оценка значимости коэффициента ассоциации:

n
2
2
df = (2-1)(2-1) = 1
English     Русский Rules