2.13M
Category: geographygeography

Анализ взаимосвязи превышений геодезических знаков и количества атмосферных осадков на опытной площадке

1.

Сибирский государственный
университет геосистем и технологий
МЕТОДИЧЕСКИЕ УКАЗАНИЯ К КОНТРОЛЬНОЙ РАБОТЕ
Анализ взаимосвязи превышений геодезических знаков
и количества атмосферных осадков на опытной
площадке
И.Е. Дорогова,
к.т.н., старший
преподаватель
каф. ФГиДЗ
Новосибирск, 2013

2.

Методы анализа
Корреляция – статистический метод,
позволяющий определить, существует ли
зависимость между переменными и на
сколько она сильна.
Регрессия – статистический метод,
который используется для описания
характера связи между переменными.
2

3.

Проблемы, решаемые с помощью
корреляционно-регрессивного анализа
Корреляционно-регрессивный анализ
позволяет ответить на следующие вопросы:
Существует ли связь между двумя или более
переменными?
Какой тип имеет эта связь?
Насколько она сильна?
Какой можно сделать прогноз, основываясь на
этой связи?
3

4.

Постановка задачи
Рассматриваем
две
переменные:
«количество
выпавших атмосферных осадков» и «вертикальное
смещение репера».
Необходимо определить существует ли связь между
количеством выпавших осадков и величиной
смещения репера.
Независимая переменная – «количество выпавших
осадков» (обозначается х).
Зависимая переменная – «величина смещения
репера» (обозначается у).
.
4

5.

Определение характера зависимости
Для визуальной оценки зависимости по исходным
данным, приведенным в таблице построим график
рассеяния
Месяц
Количество
Смещение
20
осадков, мм
пункта, мм
(х)
(у)
Январь
50
15
Февраль
36
11
12
Март
42
13
10
Апрель
44
13
8
Май
63
17
Июнь
88
19
18
16
14
20
40
60
80
По характеру рассеяния точек видно, что имеет место
положительная линейная зависимость,
Это означает, что увеличение переменной x приводит к
увеличению переменной y.
100
5

6.

Виды зависимостей
Поле рассеяния может
указывать на то, что
зависимость
между
переменными
линейная(А, В),
нелинейная (D)
или зависимость
отсутствует (С).
В случае монотонной
зависимости, она может
быть
положительной (А)
или отрицательной (В).
6

7.

Определение коэффициента корреляции
Коэффициент корреляции измеряет силу и
направление связи между двумя переменными.
Коэффициент корреляции Пирсона равен
произведению моментов и может быть определен
по формуле
(1)
7

8.

Значение коэффициента корреляции
Коэффициент корреляции изменяется на отрезке от –1
до +1.
Если между переменными существует сильная связь, то
значение r будет близко к ±1.
Когда между переменными нет линейной зависимости
или она очень слабая, значение r будет близко к 0.
Значение r
0,75 – 1.00
0,50 – 0.74
0,25 – 0.49
0,00 – 0.24
0,00 – -0.24
-0,25 – -0.49
-0,50 – -0.74
-0,75 – -1.00
Уровень связи между переменными
Очень высокая положительная
Высокая положительная
Средняя положительная
Слабая положительная
Слабая отрицательная
Средняя отрицательная
Высокая отрицательная
Очень высокая отрицательная
8

9.

Пример вычисления коэффициента корреляции
Вычислим коэффициент корреляции для выбранного примера. Для
этого достраиваем таблицу тремя столбцами и итоговой строкой и
проводим необходимые вычисления.
Месяц
Количеств
Смещение
х*у
х2
у2
о осадков, пункта, мм
мм (х)
(у)
Январь
50
15
750
2500
225
Февраль
36
11
396
1296
121
Март
42
13
546
1764
169
Апрель
44
13
572
1936
169
Май
63
17
1071
3969
289
Июнь
88
19
1672
7744
361

323
88
5007
19209
1334
Значение коэффициента корреляции составило 0,960. Это означает,
что существует сильная положительная связь между переменными.
9

10.

Значимость коэффициента корреляции
Требуется оценить коэффициент корреляции
генеральной совокупности ρ на основе значения
коэффициента корреляции выборки r.
Основная гипотеза утверждает, что не существует
корреляции между признаками х и у в генеральной
совокупности.
Альтернативная
гипотеза
утверждает,
что
корреляция между признаками х и у в генеральной
совокупности значима.
Для проверки гипотезы используем t-критерий с
df = n – 2 степенями свободы:
(2)
10

11.

Проверка гипотезы
Рассчитан коэффициент корреляции и его значение
оказалось равно 0,960. Выборка содержала 6 пар.
Необходимо на уровне значимости 0,05 проверить
гипотезу о значимости коэффициента корреляции.
Границы двусторонней критической области
находятся при помощи таблиц значений tраспределения.
Критическая область: α = 0,05, df = 6 – 2 = 4.
Критические значения по таблице равны ±2,776.
Сравниваем значение t-критерия, вычисленное по
формуле (2) с критической областью. Нулевую гипотезу
отвергаем, так как значение критерия превышает
критические значения (t=6,859). Делаем вывод о том,
что существует значимая связь между признаками.
11

12.

Линия регрессии
Мы убедились, что с увеличением числа атмосферных
осадков увеличивается величина смещения репера.
Зависимость имеет приближенно линейный характер.
Значения переменных колеблются вокруг некоей
гипотетической прямой линии, которая называется
линией регрессии.
Рассмотрим один из способов описания и построения
линии регрессии.
12

13.

Уравнение регрессии
Уравнение прямой в общем виде можно записать как
y=ax+b
Выполним поиск коэффициентов этого уравнения по
формулам, полученным с использованием метода
наименьших квадратов
(3)
Для нашего примера получились следующие значения:
a =0,148; b=6,694.
13

14.

Уравнение регрессии
Таким
образом
уравнение
регрессии
рассматриваемого примера принимает вид
y=0,148x+6,694
для
можно построить эту линию на поле рассеяния и
убедиться, что линия соответствует искомой
зависимости.
20
18
16
14
12
10
8
20
30
40
50
60
70
80
90
100
14

15.

Выводы
Проанализируем уравнение регрессии. Полученная
линейная зависимость позволяет сделать следующие
выводы:
- увеличение числа атмосферных осадков на 1 мм может
привести к увеличению смещения репера на 0,2 мм.
- чтобы смещение репера увеличилось на 1 мм
количество выпавших атмосферных осадков должно
увеличиться на 6,8 мм.
15
English     Русский Rules