ПРИМЕНЕНИЕ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ В ЗАДАЧАХ ЭЛЕКТРОЭНЕРГЕТИКИ
Содержание
Проверка статистических гипотез
Проверка гипотез о нормальности выборки
Проверка гипотез о нормальности выборки
Проверка гипотез о нормальности выборки
Проверка гипотез о нормальности выборки
Расчётный пример
Критерии согласия
Расчётный пример
Расчётный пример
Расчётный пример
Расчётный пример
Критерии однородности
Критерии однородности
Расчётный пример
Расчётный пример
Критерии однородности
Отсев грубых ошибок
Расчётный пример
Расчётный пример
Отсев грубых ошибок
Отсев грубых ошибок
Расчётный пример
Занимательная наука
3.79M
Category: mathematicsmathematics

Применение математической статистики в задачах электроэнергетики

1. ПРИМЕНЕНИЕ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ В ЗАДАЧАХ ЭЛЕКТРОЭНЕРГЕТИКИ

Практическое занятие 3
к.т.н., доцент кафедры, Томин Н.В.

2. Содержание

1. Проверка статистических гипотез
2. Отсев грубых нарушений
3. Доверительные интервалы

3. Проверка статистических гипотез

1. Проверка гипотез о нормальности выборки


Критерий Шапира-Уилка
Критерий хи-квадрат Пирсона и др.
2. Критерии согласия - это критерии проверки гипотез о
соответствии эмпирического распределения теоретическому
распределению вероятностей.



Критерий Колмогорова-Смирнова
Критерий согласия хи-квадрат Пирсона
и др.
3. Критерии однородности - это критерии проверки гипотез
о том, что две (или более) выборки взяты из одного
распределения вероятностей.



Критерий Стьюдента
Критерий Фишера-Снедекора
Критерий Кохрена и др.

4. Проверка гипотез о нормальности выборки

• Большая часть инструментов статистического вывода
работает в предположении о том, что выборка получена из
нормальной совокупности.
• Нормальное
распределение
естественным
образом
возникает практически везде, где речь идёт об измерении с
ошибками.
• Более того, в силу центральной предельной теоремы,
распределение многих выборочных величин при достаточно
больших объёмах выборки хорошо аппроксимируется
нормальным распределением вне зависимости от того,
какое распределение было у выборки исходно.

5. Проверка гипотез о нормальности выборки

Существует целый ряд статистических тестов, специально
разработанных для проверки нормальности распределения
данных. В общем виде проверяемую при помощи этих тестов
нулевую гипотезу можно сформулировать так:
"Анализируемая выборка происходит из генеральной
совокупности, имеющей нормальное распределение".
Если получаемая при помощи того или иного теста
вероятность ошибки Р
оказывается меньше некоторого
заранее принятого уровня значимости (например, 0.05), нулевая
гипотеза отклоняется.

6. Проверка гипотез о нормальности выборки

Пример 3.1. Даны результаты трёхминутных замеров
электрической нагрузки вводов (активная и реактивная
мощность) в многоквартирный жилой дом за сутки.
Необходимо проверить гипотезу о нормальности выборки
электрической нагрузки с помощью тестов Шапира-Уилка и
критерия хи-квадрат Пирсона. Расчёты провести в R.
Решение
1. Функция shapiro.test(x) выполняет тест Шапиро–Уилка.
2. Функция pearson.test(x) реализует критерий хи-квадрат Пирсона
Нуль-гипотеза заключается в том, что случайная величина, выборка
x которой известна, распределена по нормальному закону.

7. Проверка гипотез о нормальности выборки

140
130
Нагрузка, кВт
120
110
100
90
#Загрузка пакетов
install.packages("nortest")
library("nortest")
#Построение графиков
plot(load$V1, type="l")
hist(load$V1)
150
Проверка гипотез о нормальности выборки
0
50
100
150
200
250
Время
#Тест Шапира-Уилка
shapiro.test(flow$V1)
40
20
0
Shapiro-Wilk normality test
data: load$V1
W = 0.98528, p-value = 0.01222
Frequency
60
80
Histogram of load$V1
# P > 0.05 - нулевая гипотеза
не отвергается
80
100
120
load$V1
140
160

8. Расчётный пример

Пример 3.2. Даны телеметрические данные о транзите
мощности ВСЖД на участке «Гидростроитель – Коршуниха» за
трое суток. Дискретность измерений составляет 1 минута.
Необходимо проверить гипотезу о нормальности выборки
электрической нагрузки с помощью тестов Шапира-Уилка и
Колмогорова-Смирнова - lillie.test(). Расчёты провести в R.
60
мощность,МВт
50
40
30
20
10
0
04.02.08 05.02.08 06.02.08 07.02.08 08.02.08 09.02.08 10.02.08 11.02.08 12.02.08 13.02.08
дни

9. Критерии согласия

Для
проверки
гипотезы
о
соответствии
эмпирического
распределения теоретическому закону распределения используются
особые статистические показатели — критерии согласия. К ним
относятся критерии Пирсона, Колмогорова, Романовского, Ястремского
и др.
Такие критерии подразделяются на два класса:
1. Общие - применимы к самой общей формулировке гипотезы, а
именно, к гипотезе о согласии наблюдаемых результатов с любым
априорно предполагаемым распределением вероятностей.
2. Специальные - предполагают специальные нулевые гипотезы,
формулирующие согласие с определенной формой распределения
вероятностей.

10. Расчётный пример

Пример 3.3 Задача о бомбардировках Лондона. Задача
возникла в связи с бомбардировками Лондона во время
Второй мировой войны. Для улучшения организации
оборонительных мероприятий, необходимо было понять цель
противника. Для этого территорию города условно разделили
сеткой из 24-ёх горизонтальных и 24-ёх вертикальных линий на
576 равных участков. В течении некоторого времени в центре
организации обороны города собиралась информация о
количестве попаданий снарядов в каждый из участков. В итоге
были получены следующие данные:

11. Расчётный пример

Гипотеза H0: стрельба случайна (нет "целевых" участков).
Закон редких событий (распределение Пуассона)
Тогда при уровне значимости 0.05 гипотеза H0 не выполняется
Объединим события (4,5,6,7) с малой частотой попаданий в одно,
тогда имеем:
тогда при 0.05 гипотеза H0 всё-таки верна.

12. Расчётный пример

Пример 3.3. Сформирован месячный массив данных
измерений напряжения в узле (табл. 1). При уровне значимости
0,05 проверить гипотезу о нормальном распределении ГС
измерений напряжения, если известны эмпирические и
теоретические частоты.
Эмпирические
частоты
Теоретические
частоты
6
13
38
74
106
85
30
14
3
14
42
82
99
76
37
13
Критерий хи-квадрат Пирсона
kr
ni
2
i 1
' 2
ni
'
ni

13. Расчётный пример

Теоретические частоты
2.5
3.0
Решение в R
1.5
0.5
1.0
Frequency
2.0
library("nortest")
u <-read.csv("data_U.csv", sep = ";")
chisq.test(u)
0.0
Pearson's Chi-squared test
data: u
X-squared = 3.1578, df = 7, p-value =
0.87
2
2
0
40
60
80
100
u$teor
3.0
экспериментальные частоты
1.5
1.0
0.5
0.0
Frequency
2.0
2.5
набл кр
qchisq(p = 0.95, df = 7)
[1] 14.06714
нет
оснований
отвергать
нулевую
гипотезу.
Другими
словами,
расхождение
эмпирических и теоретических частот
незначимое.
20
0
20
40
60
u$emp
80
100
120

14. Критерии однородности

Две разные выборки называются однородными, если они
одинаково распределены.
Проверка «гипотез однородности» в математической
статистике занимает особое место.
Величины, имеющие нормальное распределение, в реальных
экспериментах возникают совершенно естественным образом,
При измерении любой характеристики всегда имеется ошибка
измерения. Если предполагать, что ошибка прибора имеет
нормальное
распределение,
то
среднее
отвечает
за
систематическую ошибку, а дисперсия — за величину
случайной ошибки.

15. Критерии однородности

Критерий Стьюдента
Если дисперсия ГС неизвестна (например, в случаях малых
выборок), то в качестве критерия проверки нулевой гипотезы
приминают критерий Стьюдента в виде:
t x M 0 N (x) ис
Критерий Фишера-Снедекора
Если необходимо проверить гипотезу о равенстве дисперсий
двух нормальных генеральных совокупностей, то в этом случае
используется критерий Фишера-Снедекора:
D x 1
F
D x 2

16. Расчётный пример

Пример 3.4. В лаборатории двумя приборами в течение
нескольких дней были проведены измерения напряжения. Из
полученных генеральных совокупностей U1 и U2 были
извлечены независимые выборки объёмами N1=12 и N2=15, и
найдены выборочные дисперсии D(U1)=11.41 , D(U2)=6.52 . При
уровне значимости 0.05 проверить нулевую гипотезу о
равенстве генеральных дисперсий при конкурирующей
гипотезе H 1 : D U 1 D U 2 .

17. Расчётный пример

Пример 3.4 – решение в R
x <- rnorm(12, sd = 3.3778)
y <- rnorm(15, sd = 2.5534)
var.test(x, y) # F-тест Фишера
F test to compare two variances
data: x and y
F = 1.8562, num df = 11, denom df = 14, p-value = 0.2749
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.5998217 6.2346305
sample estimates:
ratio of variances
1.856202

18. Критерии однородности

Пример 3.5. По результатам измерений активной мощности
на подстанции в течении месяца был сформирован массив
экспериментальных данных. По выборке объёма n=20,
извлечённой из генеральной совокупности (месячный архив
данных по активной мощности) найдены выборочная средняя
P=16 кВт и «исправленное» среднеквадратичное отклонение 4.5
кВт. Требуется, при уровне значимости 0.05, проверить нулевую
гипотезу H 0 : M(P) 15 кВт , при конкурирующей гипотезе
H1 : M(P) 15 кВт

19. Отсев грубых ошибок

Проверяемая гипотеза состоит в утверждении, что результат
наблюдения х, не содержит грубой погрешности, т.е. является одним
из значений измеряемой величины. Пользуясь определенными
статистическими критериями, пытаются опровергнуть выдвинутую
гипотезу. Если это удается, то результат наблюдений рассматривают
как содержащий грубую погрешность и его исключают.
Для выявления грубых погрешностей задаются вероятностью q
(уровнем значимости) того, что сомнительный результат действительно
мог иметь место в данной совокупности результатов измерений.
Критерий "трех сигм" применяется для результатов измерений,
распределенных по нормальному закону. Данный критерий надежен
при числе измерений n > 20... 50.

20. Расчётный пример

Пример 3.6. Имеются данные потребления электроэнергии в жилой
квартире в период с января по ноябрь (табл. 2). Как видно из таблицы
в в большинстве месяцев месячное потребление составляло примерно
110–150 кВт⋅ч. Однако в августе было показание 190 кВт⋅ч, а в
сентября - 240 кВт⋅ч. Последнее показание субъективно выбивалась из
общей тенденции среднего. Необходимо установить не содержат
данные показания грубых ошибок. Проверку провести методом «трёх
сигм».
Янв.
Февр.
Март
Апр.
Май
Июнь
Июль
Авг.
Сент.
Окт.
Нояб.
210
140
160
170
170
110
150
190
240
160
140
Shapiro-Wilk normality test
data: w$V1
W = 0.959, p-value = 0.7592
# P > 0.05 - нулевая гипотеза не отвергается

21. Расчётный пример

Пример 3.6.
Янв.
Февр.
Март
Апр.
Май
Июнь
Июль
Авг.
Сент.
Окт.
Нояб.
210
140
160
170
170
110
150
190
240
160
140

22. Отсев грубых ошибок

Пример 3.7. При диагностировании дизельного генератора
результаты пяти измерений расхода топлива составили: 22, 24, 26, 28,
30 л для одинаковых периодов работы. Последний результат вызывает
сомнение. Проверить по критерию Романовского, не является ли он
промахом.
Критерий Романовского применяется, если число измерений n < 20.
При этом вычисляется отношение |(х̅ - xi)/SX| = b и сравнивается с
табличным критерием bт. Если b больше или равна bт, то результат хi
считается промахом и отбрасывается.

23. Отсев грубых ошибок

Большинство существующих критериев отбраковки аномальных
значений
опираются
на
предположение
о
принадлежности
наблюдаемых случайных величин закону нормального распределения.
Если же закон распределения случайной величины не известен, то
возможно применение критерия Диксона (Q-критерий).
Исследования показывают, что критерий Диксона не зависит от
параметров распределения и его можно использовать для выявления
аномальных значений при произвольном характере распределения
исходных данных. Однако критерий Диксона можно использовать при
малом числе экспериментальных данных (меньше 30).
К примеру, в задаче контроля балансов электроэнергии
(выявление грубых погрешностей) по данным АСКУЭ стандартные
стат.критерии не подходят, т.к. они требуют многократных измерений,
в то время как измерения для учета электрической энергии —
принципиально
однократные.
В
этом
случае,
предлагается
использование критерия Диксона.

24. Расчётный пример

Пример 3.8. Было проведено пять измерений напряжения в
электросети. Получены следующие данные: 127,1; 127,2; 126,9; 127,6;
127,2 В. Результат 127,6 В существенно (на первый взгляд) отличается
от остальных. Проверить, не является ли он промахом.
Критерий Диксона определяется как
КД = (хn - xn-1/(xn –x1).
Критическая область для этого критерия Р(КД > Zq) = q. Значения Zf
приведены в таблице 3.

25. Занимательная наука

English     Русский Rules