Similar presentations:
Анализ взаимосвязи превышений геодезических знаков и количества атмосферных осадков на опытной площадке
1.
Сибирский государственныйуниверситет геосистем и технологий
МЕТОДИЧЕСКИЕ УКАЗАНИЯ К КОНТРОЛЬНОЙ РАБОТЕ
Анализ взаимосвязи превышений геодезических знаков
и количества атмосферных осадков на опытной
площадке
И.Е. Дорогова,
к.т.н., старший
преподаватель
каф. ФГиДЗ
Новосибирск, 2013
2.
Методы анализаКорреляция – статистический метод,
позволяющий определить, существует ли
зависимость между переменными и на
сколько она сильна.
Регрессия – статистический метод,
который используется для описания
характера связи между переменными.
2
3.
Проблемы, решаемые с помощьюкорреляционно-регрессивного анализа
Корреляционно-регрессивный анализ
позволяет ответить на следующие вопросы:
Существует ли связь между двумя или более
переменными?
Какой тип имеет эта связь?
Насколько она сильна?
Какой можно сделать прогноз, основываясь на
этой связи?
3
4.
Постановка задачиРассматриваем
две
переменные:
«количество
выпавших атмосферных осадков» и «вертикальное
смещение репера».
Необходимо определить существует ли связь между
количеством выпавших осадков и величиной
смещения репера.
Независимая переменная – «количество выпавших
осадков» (обозначается х).
Зависимая переменная – «величина смещения
репера» (обозначается у).
.
4
5.
Определение характера зависимостиДля визуальной оценки зависимости по исходным
данным, приведенным в таблице построим график
рассеяния
Месяц
Количество
Смещение
20
осадков, мм
пункта, мм
(х)
(у)
Январь
50
15
Февраль
36
11
12
Март
42
13
10
Апрель
44
13
8
Май
63
17
Июнь
88
19
18
16
14
20
40
60
80
По характеру рассеяния точек видно, что имеет место
положительная линейная зависимость,
Это означает, что увеличение переменной x приводит к
увеличению переменной y.
100
5
6.
Виды зависимостейПоле рассеяния может
указывать на то, что
зависимость
между
переменными
линейная(А, В),
нелинейная (D)
или зависимость
отсутствует (С).
В случае монотонной
зависимости, она может
быть
положительной (А)
или отрицательной (В).
6
7.
Определение коэффициента корреляцииКоэффициент корреляции измеряет силу и
направление связи между двумя переменными.
Коэффициент корреляции Пирсона равен
произведению моментов и может быть определен
по формуле
(1)
7
8.
Значение коэффициента корреляцииКоэффициент корреляции изменяется на отрезке от –1
до +1.
Если между переменными существует сильная связь, то
значение r будет близко к ±1.
Когда между переменными нет линейной зависимости
или она очень слабая, значение r будет близко к 0.
Значение r
0,75 – 1.00
0,50 – 0.74
0,25 – 0.49
0,00 – 0.24
0,00 – -0.24
-0,25 – -0.49
-0,50 – -0.74
-0,75 – -1.00
Уровень связи между переменными
Очень высокая положительная
Высокая положительная
Средняя положительная
Слабая положительная
Слабая отрицательная
Средняя отрицательная
Высокая отрицательная
Очень высокая отрицательная
8
9.
Пример вычисления коэффициента корреляцииВычислим коэффициент корреляции для выбранного примера. Для
этого достраиваем таблицу тремя столбцами и итоговой строкой и
проводим необходимые вычисления.
Месяц
Количеств
Смещение
х*у
х2
у2
о осадков, пункта, мм
мм (х)
(у)
Январь
50
15
750
2500
225
Февраль
36
11
396
1296
121
Март
42
13
546
1764
169
Апрель
44
13
572
1936
169
Май
63
17
1071
3969
289
Июнь
88
19
1672
7744
361
∑
323
88
5007
19209
1334
Значение коэффициента корреляции составило 0,960. Это означает,
что существует сильная положительная связь между переменными.
9
10.
Значимость коэффициента корреляцииТребуется оценить коэффициент корреляции
генеральной совокупности ρ на основе значения
коэффициента корреляции выборки r.
Основная гипотеза утверждает, что не существует
корреляции между признаками х и у в генеральной
совокупности.
Альтернативная
гипотеза
утверждает,
что
корреляция между признаками х и у в генеральной
совокупности значима.
Для проверки гипотезы используем t-критерий с
df = n – 2 степенями свободы:
(2)
10
11.
Проверка гипотезыРассчитан коэффициент корреляции и его значение
оказалось равно 0,960. Выборка содержала 6 пар.
Необходимо на уровне значимости 0,05 проверить
гипотезу о значимости коэффициента корреляции.
Границы двусторонней критической области
находятся при помощи таблиц значений tраспределения.
Критическая область: α = 0,05, df = 6 – 2 = 4.
Критические значения по таблице равны ±2,776.
Сравниваем значение t-критерия, вычисленное по
формуле (2) с критической областью. Нулевую гипотезу
отвергаем, так как значение критерия превышает
критические значения (t=6,859). Делаем вывод о том,
что существует значимая связь между признаками.
11
12.
Линия регрессииМы убедились, что с увеличением числа атмосферных
осадков увеличивается величина смещения репера.
Зависимость имеет приближенно линейный характер.
Значения переменных колеблются вокруг некоей
гипотетической прямой линии, которая называется
линией регрессии.
Рассмотрим один из способов описания и построения
линии регрессии.
12
13.
Уравнение регрессииУравнение прямой в общем виде можно записать как
y=ax+b
Выполним поиск коэффициентов этого уравнения по
формулам, полученным с использованием метода
наименьших квадратов
(3)
Для нашего примера получились следующие значения:
a =0,148; b=6,694.
13
14.
Уравнение регрессииТаким
образом
уравнение
регрессии
рассматриваемого примера принимает вид
y=0,148x+6,694
для
можно построить эту линию на поле рассеяния и
убедиться, что линия соответствует искомой
зависимости.
20
18
16
14
12
10
8
20
30
40
50
60
70
80
90
100
14
15.
ВыводыПроанализируем уравнение регрессии. Полученная
линейная зависимость позволяет сделать следующие
выводы:
- увеличение числа атмосферных осадков на 1 мм может
привести к увеличению смещения репера на 0,2 мм.
- чтобы смещение репера увеличилось на 1 мм
количество выпавших атмосферных осадков должно
увеличиться на 6,8 мм.
15