Similar presentations:
Статистика в фармации. Корреляционный анализ
1. Корреляционный анализ
План лекции:1. Непараметрические
методы измерения
тесноты связи.
2. Параметрические
методы.
2. Непараметрические методы измерения тесноты связи
Карл Пирсон (27.03.1857-27.04.1936)Джордж Юл (18.02.1871- 26.06.1951)
3. Методы измерения тесноты взаимосвязи
параметрические и непараметрическиеНепараметрические методы применяются для
измерения тесноты связи качественных и
альтернативных признаков, а так же
количественных признаков, распределение
которых отличается от нормального.
4. Измерение связи альтернативных признаков
коэффициент ассоциации Д. Юлаa d b c
Ka
a d b c
коэффициент контингенции К. Пирсона.
a d b c
Kк
(a b)( d c)( a c)(b d )
таблица сопряжённости (Таблица 1).
5.
|Ka| ≥ 0,5|Kк| ≥ 0,3
a d b c
Ka
a d b c
a d b c
Kк
(a b)( d c)( a c)(b d )
86 28 14 22
Ka
0,773
86 28 14 22
86 28 14 22
Kк
0,441
100 50 108 42
6.
коэффициенты взаимной сопряжённости признаковК. Пирсона или А.А. Чупрова:
2
KП
1 2
KЧ
2
( K1 1)( K 2 1)
(1874-1926)
K1 и K2 – число групп первого и второго признака,
соответственно
2
2
nxy
nx n y
1
7.
10 222
42
42
12
92
1 1,163
...
12 16
11 20 40 20 71 20 76 20 11 52
2
KП
1,163
0,733
1 1,163
KЧ
KП > KЧ
1,163
0,510
( 5 1 )( 6 1 )
8. Методы оценки силы взаимодействия
Ранжирование (от английского rank – ранг, класс, звание)) –это упорядочение объектов в порядке убывания
(возрастания) степени проявления в них изучаемого
свойства. Ранг равен порядковому месту значений
признака в упорядоченном таким образом ряду.
коэффициенты корреляции рангов Спирмена и Кендалла
Чарльз Эдвард Спирмен
Моррис Джордж Кендалл
(10.09.1863 – 17.09.1945)
(06.09.1907 – 29.03.1983)
9. Коэффициент Спирмена
6 di21
n(n 2 1)
di – разность рангов двух показателей,
n – число наблюдаемых пар значений.
ρ может принимать значения от -1 до +1.
x
1
2
3
4
5
6
7
8
9
y
4
3
8
1
9
7
5
2
6
d
-3
-1
-5
3
-4
-1
2
6
3
d2
9
1
25
9
16
1
4
36
9
110
6 d i2
6 110
1
1
0,083
2
2
n(n 1)
9(9 1)
10. Коэффициент корреляции рангов Кендалла
PQ
S=P+Q:
n(n 1)
Pmax (n 1) (n 2) ... 3 2 1
2
S
2S
n(n 1) / 2 n(n 1)
11.
М. Кендалл и Б. Смит: коэффициент конкордации(множественный коэффициент ранговой
корреляции)
12 S
W 2 3
m ( n n)
где S – сумма квадратов отклонений суммы т
рангов от их средней величины; т – число
ранжируемых признаков; п – число ранжируемых
единиц (число наблюдений).
Коэффициент конкордации W принимает значения
от 0 до 1.
12. Параметрические методы
коэффициент корреляцииx x y y
x y ( x x)( y y ) xy x y
r
n
x y
x y
ковариация
cov ( x x)( y y) xy x y
13.
yx
r yx
xy
x
y
r = 0 между признаками отсутствует линейная
зависимость, при r = 1 –зависимость между
ними функциональная
r2 - коэффициент детерминации
14.
1y
(11 452 40 55 2 71 65 2 76 752
250
40 85 2 12 952 ) 5072 ,2
2
y2 y 2 y 2 5072 ,2 70,22 102 ,0; y 102 ,0 10,10
x 144,16 12,01
r
xy x y
x y
12355 ,6 174 ,96 70 ,2
0,605
12 ,01 10 ,10
15. Шкала Чеддока
Таблица 3. Шкала ЧеддокаКоэффициент 0,1-0,3
корреляции |r|
0,3-0,5
0,5-0,7
0,7-0,9 0,9-0,99
Характеристи- Слабая Умеренная Заметная Тесная
ка связи
Очень
тесная
1,0
Функциональная
16.
корреляционное отношение (коэффициенткорреляции по Пирсону)
эмпирическое
теоретическое
yx
эмп
y2
y2
y2
y2
– общая
дисперсия,
межгрупповая
дисперсия.
–
теор
y2
y2
2
(
y
y
)
y2 x
n