Оценка достоверности статистических параметров. Статистический анализ вариации количественных признаков
Каждое отдельное явление, взятое само по себе (длина листа на дереве) является случайным. Но взятые в массе они обнаруживают
Вероятность – это возможность осуществления определенного события в некотором количестве случаев из общего числа возможных.
Теорема сложения вероятностей
Теорема умножения вероятностей.
Теоретическая и эмпирическая (фактическая) вероятности.
Распределение вероятностей
Виды распределений
Нормальное распределение
Доверительные вероятности. Уровни значимости.
Проблема достоверности в статистике.
При N>100
Нулевая гипотеза (Н0) - между показателями разных выборок достоверного различия нет. Противоположная гипотеза – альтернативная
Понятия о непараметрической статистике
Критерии оценки независимости элементов выборки
Критерий «восходящих» и «нисходящих» серий.
Критерии однородности выборок.
481.00K
Category: mathematicsmathematics

Оценка достоверности статистических параметров. Статистический анализ вариации количественных признаков

1. Оценка достоверности статистических параметров. Статистический анализ вариации количественных признаков

Лекция 2

2. Каждое отдельное явление, взятое само по себе (длина листа на дереве) является случайным. Но взятые в массе они обнаруживают

статистические
закономерности.

3. Вероятность – это возможность осуществления определенного события в некотором количестве случаев из общего числа возможных.

Вероятность варьирует от 0 до 1.
p=m/N, где m- число благоприятных
факторов, N – число равновозможных
случаев

4. Теорема сложения вероятностей

Для независимых друг от друга событий, которые
совершенно несовместимы.
Например, на клумбе растут 20 красных, 30 синих
и 40 белых астр. Какова вероятность сорвать в
темноте окрашенную (синюю или красную)
астру?:
20 30
p
0,56
90 90

5. Теорема умножения вероятностей.

Относится к таким независимым
событиям,
р=
которые следуют друг за другом и также
независимы друг от друга.
Например, какова вероятность наличия цифры 4
=
у двух выброшенных одновременно кубиков?
p= 1/6 *1/6 = 1/36

6. Теоретическая и эмпирическая (фактическая) вероятности.

Фактические вероятности приложимы только к
конкретным совокупностям, по которым они
вычислены.
В генеральной совокупности вероятности
становятся теоретическими.
Возникает вопрос о том, насколько достоверны
статистические показатели, полученные по
выборочной совокупности, чтобы можно было по
ним судить о генеральной совокупности.

7. Распределение вероятностей

х1, х2, х3 ,…, хn
р1, р2, р3 ,…, pn
Распределение - совокупность значений xi
и соответствующих им вероятностей pi .

8. Виды распределений

Биномиальное
(a+b)1=a+b
(a+b)2=a2+2ab+b2
Частоты распределения отдельных классов
пропорциональны коэффициентам разложения
бинома Ньютона: (p+q)k , где p – вероятность
появления данного события, q- вероятность не
появления, k- количество классов.
Пуассона
Для очень редких событий, распределение событий
ассиметрично.

9. Нормальное распределение

(p+q) k , где k- стремится к бесконечности.
Закономерности нормального распределения
дают возможность по среднему
арифметическому и среднему квадратическому
отклонению построить весь ряд.
Нормированное отклонение (t) – отклонение
варианты от среднего арифметического,
выраженное в сигмах :
t
( xi x )

10. Доверительные вероятности. Уровни значимости.

Доверительная
вероятность
Доверительный
интервал
Уровень
значимости
0,95
-1,96 σ…+1,96σ
0,05 (5%)
0,99
-2,58σ…+2,58σ
0,01 (1%)
С вероятностью 0,95 любая случайно взятая варианта будет
отклоняться от среднего арифметического не более чем на
±1,96σ, иными словами, с вероятностью 0,05 варианта будет за
пределами ±1,96σ.
Вероятности 0,95 (95%) соответствует уровень значимости 0,05
(5%). Это означает, что выход за пределы принятых границ
возможен с вероятностью 0,05, то есть, вероятность ошибочного
прогноза составляет 5%.

11. Проблема достоверности в статистике.

Чем меньше ошибка средней, тем ближе
выборочное среднее к генеральному среднему.
mx
N
Доверительный интервал средней
арифметической генеральной совокупности
x tmx x tmx
При N >30 коэффициент Стьюдента t01 = 1,96 и
t05=2,58

12. При N>100

При N>100
Ошибка среднего квадратического отклонения и
доверительный интервал вычисляются по
формулам:
m
2N
tm ˆ tm
Ошибка коэффициента вариации и
доверительный интервал – по формулам:
cv
cv tmcv cˆv cv tmcv
mcv
2N

13. Нулевая гипотеза (Н0) - между показателями разных выборок достоверного различия нет. Противоположная гипотеза – альтернативная

(На).
Ошибка первого рода (ошибка α-типа):
отклоняется нулевая гипотеза, которая в
действительности верная.
Ошибка второго рода (ошибка β-типа):
принимается нулевая гипотеза, которая в
действительности ложная.
Мощность статистического критерия - есть
вероятность того, что будет принято правильное
решение при ложной нулевой гипотезе (1-β).
Мощность критерия зависит от объема выборки,
уровня значимости, надежности
экспериментальных методов и приборов.

14. Понятия о непараметрической статистике

Параметрические критерии основаны на том или
ином законе распределения случайной
переменной.
Непараметрические критерии: 1) критерии оценки
независимости элементов выборки; 2) критерии
для оценки однородности выборок; 3) критерии
для оценки степени соответствия фактических
данных теоретически ожидаемым; 4) критерии
для оценки корреляции; 5) критерии для оценки
степени сходства между объектами по комплексу
признаков.

15. Критерии оценки независимости элементов выборки

Критерий серий, основанный на медиане.
Правило преобразования: вместо варианты ставится «+», если
она больше Ме; вместо варианты ставится «-», если она меньше
Ме; если варианта равна Ме, она исключается из ряда.
Серией называют последовательность записанных подряд
одинаковых знаков «+» или «-». Серия может состоять и из
одного знака.
v - количество серий во всей последовательности знаков;
T (Тау) – количество знаков в самой длинной серии.
Нулевая гипотеза (Н0) - варианты выборки независимы;
альтернативная гипотеза (НА): варианты выборки зависимы.
Если нулевая гипотеза верна, то v - количество серий – должно
быть достаточно большим, а величина T (тау) – протяженность
самой длинной серии – должна быть малой.

16. Критерий «восходящих» и «нисходящих» серий.

Сравниваются значения двух рядом
расположенных вариант (пары): «xi» и «xi+1»:
если разность (xi+1-xi)>0, то ставится знак «+»;
если разность (xi+1-xi)<0, то знак «-»; если
xi+1=xi, то никакой знак не ставится.
Нулевая гипотеза принимается если
1
3
(2 N 1) tst
16n 29
90
T (тау) <5 (при N<26); или 6 (при 27<N<153);
или7 (при 154<N<1170)

17. Критерии однородности выборок.

Однородность выборок означает
возможность считать их выбранными из
одной и той же генеральной совокупности.
К таким критериям относятся: критерий
Манна-Уитни, критерий Уилкоксона,
критерий Краскела-Уоллиса.
English     Русский Rules