Коэффициент корреляции
Связи: функциональные …
… и вероятностные
Коэффициент корреляции r это количественная мера
Регрессия
Коэффициент детерминации
Ранговые корреляции
r-Спирмена
-Кендалла
Корреляция бинарных данных
Последовательность интерпретации корреляций
Корреляционная матрица
361.50K
Category: mathematicsmathematics

Коэффициент корреляции

1. Коэффициент корреляции

r - мера вероятностной связи двух
количественных переменных

2. Связи: функциональные …

3. … и вероятностные

Режем колбасу на куски (точки)
разной толщины (переменная Х)
и взвешиваем их (переменная Y)
Диаграмма
рассеяния
(точечный график)
Точки не лежат на одной прямой. Почему?
Вес Y зависит не только от толщины X…
В природе связь двух явлений всегда носит вероятностный характер.

4. Коэффициент корреляции r это количественная мера

силы (абсолютное значение) и направления (знак)
вероятностной взаимосвязи двух переменных.
-1 r +1

5. Регрессия

Уравнение регрессии:
yˆ i bx i a
Коэффициент регрессии:
b rxy
y
x
Свободный член:
a M y bM x
yi — истинное i-значение Y,
yˆ i — оценка i-значения Y по значению xi при помощи
линии (уравнения) регрессии,
ei = y i yˆ i – ошибка оценки
Линия регрессии (прямая) аппроксимирует точки методом
наименьших квадратов: ( y i yˆ i ) 2 ei2 min
i
i

6. Коэффициент детерминации

Дисперсия оценок зависимой переменной Y

2
часть её дисперсии
, обусловленная влиянием
y
2
2
независимой переменной X:
0

y2ˆi bx2 i a bx2 i b 2 x2i rxy 2

2
y
2
rxy
2
i
i
2

y
y2
i
x2
x2 rxy 2 y
i
2
i
i
- коэффициент детерминации,
доля дисперсии переменной Y (от 1),
«объясняемая» влиянием переменной X.

7. Ранговые корреляции

Вычисляются после замены исходных
значений рангами.
r-Спирмена, аналог r-Пирсона, основан на
разности рангов
-Кендалла, вероятностный, основан на подсчете
совпадений и инверсий в парах наблюдений.

8. r-Спирмена

X – время решения задачи (сек.), Y – средний балл по математике.
rs 1
6 d
2
i
i
N ( N 2 1)
6 474
rs 1
0,657
12(144 1)

9. -Кендалла

-Кендалла
P( p ) P( q )
( P( p ) P( q) 1)
P Q
N ( N 1) / 2
P Q
4P
1
P Q N ( N 1)
1
2
1
P(q) 1 P( p)
2
Вероятность совпадений: P( p)
Вероятность инверсий:
18 48
0,455
66

10. Корреляция бинарных данных

X: 0 — холостая, 1 — замужем; Y: 0 — закончила вуз, 1 — отчислена.
ad bc
(a b)(c d )( a c)(b d )
5 4 1 2
0,507
6 6 7 5

11. Последовательность интерпретации корреляций

1. Статистическая значимость (p-уровень).
2. Знак (направление).
3. Величина (по r-квадрат).
Числовые показатели: r = …; N = …; p = … .
ПРИМЕР. Для проверки гипотезы … применялась корреляция Пирсона.
Обнаружена статистически достоверная отрицательная корреляция
показателей тревожности и креативности (r = -0,435; N = 32; p = 0,035):
чем выше тревожность, тем ниже креативность.

12. Корреляционная матрица

English     Русский Rules