Similar presentations:
Коэффициент корреляции
1. Коэффициент корреляции
r - мера вероятностной связи двухколичественных переменных
2. Связи: функциональные …
3. … и вероятностные
Режем колбасу на куски (точки)разной толщины (переменная Х)
и взвешиваем их (переменная Y)
Диаграмма
рассеяния
(точечный график)
Точки не лежат на одной прямой. Почему?
Вес Y зависит не только от толщины X…
В природе связь двух явлений всегда носит вероятностный характер.
4. Коэффициент корреляции r это количественная мера
силы (абсолютное значение) и направления (знак)вероятностной взаимосвязи двух переменных.
-1 r +1
5. Регрессия
Уравнение регрессии:yˆ i bx i a
Коэффициент регрессии:
b rxy
y
x
Свободный член:
a M y bM x
yi — истинное i-значение Y,
yˆ i — оценка i-значения Y по значению xi при помощи
линии (уравнения) регрессии,
ei = y i yˆ i – ошибка оценки
Линия регрессии (прямая) аппроксимирует точки методом
наименьших квадратов: ( y i yˆ i ) 2 ei2 min
i
i
6. Коэффициент детерминации
Дисперсия оценок зависимой переменной Y–
2
часть её дисперсии
, обусловленная влиянием
y
2
2
независимой переменной X:
0
yˆ
y2ˆi bx2 i a bx2 i b 2 x2i rxy 2
yˆ
2
y
2
rxy
2
i
i
2
yˆ
y
y2
i
x2
x2 rxy 2 y
i
2
i
i
- коэффициент детерминации,
доля дисперсии переменной Y (от 1),
«объясняемая» влиянием переменной X.
7. Ранговые корреляции
Вычисляются после замены исходныхзначений рангами.
r-Спирмена, аналог r-Пирсона, основан на
разности рангов
-Кендалла, вероятностный, основан на подсчете
совпадений и инверсий в парах наблюдений.
8. r-Спирмена
X – время решения задачи (сек.), Y – средний балл по математике.rs 1
6 d
2
i
i
N ( N 2 1)
6 474
rs 1
0,657
12(144 1)
9. -Кендалла
-КендаллаP( p ) P( q )
( P( p ) P( q) 1)
P Q
N ( N 1) / 2
P Q
4P
1
P Q N ( N 1)
1
2
1
P(q) 1 P( p)
2
Вероятность совпадений: P( p)
Вероятность инверсий:
18 48
0,455
66
10. Корреляция бинарных данных
X: 0 — холостая, 1 — замужем; Y: 0 — закончила вуз, 1 — отчислена.ad bc
(a b)(c d )( a c)(b d )
5 4 1 2
0,507
6 6 7 5
11. Последовательность интерпретации корреляций
1. Статистическая значимость (p-уровень).2. Знак (направление).
3. Величина (по r-квадрат).
Числовые показатели: r = …; N = …; p = … .
ПРИМЕР. Для проверки гипотезы … применялась корреляция Пирсона.
Обнаружена статистически достоверная отрицательная корреляция
показателей тревожности и креативности (r = -0,435; N = 32; p = 0,035):
чем выше тревожность, тем ниже креативность.