Лекция Описательная статистика
Совокупность
Правила вычисления результатов (по П.М. Крылову)
Средние величины
Таблица – Основные виды средних в биологии (по К.Е. Никитину и А.З. Швиденко)
ПОКАЗАТЕЛИ ВАРИАЦИИ
ФУНКЦИИ РАСПРЕДЕЛЕНИЯ. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ
Биномиальное распределение
869.50K
Category: mathematicsmathematics

Описательная статистика

1. Лекция Описательная статистика

1 Расчет параметров описательной статистики
при качественной вариации признака
2 Расчет параметров описательной статистики
при количественной вариации признака
3 Теоретические распределения случайных
величин и их свойства (нормальное и
биномиальное распределение, распределение
Пуассона).

2. Совокупность

Математическая
Генеральная
Большая (N 30)
Статистическая
Выборочная
Малая (N≤30)

3.

Чтобы выборочная совокупность как можно полнее отражала
генеральную, необходимо учитывать следующие основные
положения.
1. Выборка должна быть вполне представительной,
или типичной, т.е. в ее состав входят варианты,
наиболее полно отражающие генеральную
совокупность (рост деревьев в высоту – исключить
деревья, сломанные бурей, поврежденные огнем).
2. Выборка должна быть объективной (случайный
отбор).
3. Выборка должна быть качественно однородной
(особи одного пола, вида, возраста).

4. Правила вычисления результатов (по П.М. Крылову)

Правила 1-5. При сложении и вычитании, умножении и
делении, возведении в квадрат или куб, извлечении корня
квадратного или кубического, при использовании логарифмов в результате нужно сохранять столько десятичных знаков
после запятой, сколько их имеет “слагаемое” с наименьшим
количеством десятичных знаков.
Правило 6. Для промежуточного результата, получаемого по
правилам 1-5, необходимо сохранить одну дополнительную
“запасную” цифру; в конечном результате ее отбрасывают.
Правило 7. Если исходные данные имеют разное количество
десятичных знаков или значащих цифр, то их надо
предварительно округлить с сохранением одной “запасной”
цифры.
Правило 8. Если результаты должны быть получены с nзначащими цифрами, то исходные данные следует брать с
n+1 значащей цифрой.

5.

Статистические показатели разделяются на две группы:
показатели, которые характеризуют центральную тенденцию,
или уровень ряда,
показатели, измеряющие степень вариации.
К первой группе относятся различные средние величины:
мода,медиана,
средняя арифметическая, средняя геометрическая.
Ко второй:
вариационный размах, лимиты,
коэффициент вариации,
среднее квадратическое отклонение (варианса,дисперсия),
коэффициенты асимметрии и эксцесса.

6. Средние величины

7.

8.

4. Средняя квадратическая - применяется для
получения истинного значения площади
сечения или объема признака
я гармоническая
ичина применяется для1 вычисления
средней
характеристик
2
xi ni .
x кв =
которые представляют
собой отношение двух други
n
х величин.
Среднюю
гармоническую
определяют
по
формуле
5. Средняя гармоническая - применяется для
вычисления средней характеристики
признаков, которые представляют собой
N /( варьирующих
1/ X ),
отношение двухХ hдругих
величин.
или
Хh
N /( n / x),
(4.10)
(4.11)

9. Таблица – Основные виды средних в биологии (по К.Е. Никитину и А.З. Швиденко)

Средняя
Арифметическая
Формулы для вычисления средних
Малая выборка
Большая выборка
(невзвешенные средние)
(взвешенные средние)
1 n
1 k
Х x i ni
Х xi
n i 1
n i 1
Геометрическая
G n x1 х2 ...хn
G n x1n1 x2n2 ...xknk
Гармоническая
1
lg G lg xi
n
n
H
1
x
i
1
lg G ni lg xi
n
n
H
1
n
ix
i
Квадратическая
“Верхняя”,
1
xi2
n
1 n
X xi
Xg
Xg
1
X
1
xi2 ni
n
xi ni A *
k

10.

5. Квантили являются обобщением понятия
медианы.
Если разделить частоты распределения на k равных
частей, то k 1 значение случайной величины,
соответствующее точкам деления, называется
квантилями распределения.
При k=2 единственный квантиль будет медианой, при
k=4 средняя из точек деления будет медианой, а
первая и третья - нижним и верхним квартилями.

11. ПОКАЗАТЕЛИ ВАРИАЦИИ

В зависимости от характера изучаемого признака
различают варьирование:
количественным признакам
непрерывное,
прерывистое (дискретное)
качественным признакам
Атрибутивное (степень окраски, консистенции, форма,
вид, а также альтернативное, т.е. противопоставления
здоровые - больным, сильные – слабым, окрашенные –
неокрашенным, присутствующие – отсутствующим и т.д.

12.

.
1.
Показатель (Lim) указывает фактические границы
вариабельности признака.
2.
Вариационный размах
3.
Среднее линейное отклонение, может иметь значение
только при условии, что отклонения вариант от средней
арифметической берутся без учета знаков, так как в
противном случае ∑( х Х ) 0 .
(х Х )
∆=
п

13.

Чтобы преодолеть недостатки линейного отклонения,
принято отклонения вариант от средней
арифметической возводить в квадрат и сумму
квадратов отклонений относить к общему числу
наблюдений, т.е. к объему выборки. Полученный
таким образом показатель служит центральным
моментом второго порядка, он характеризует
рассеяние вариант около средней арифметической.
Этот показатель, называемый дисперсией, или
вариансой, обозначается греческой буквой σ2 (сигма
малая в квадрате) и выражается следующей
формулой:
4.

14.

5. Среднее квадратическое отклонение. Среднее
квадратическое отклонение, как и средняя
арифметическая, относится к величинам именованным
и выражается в тех же величинах, что и признак.
Выборка, в которой рассеяние вариант около средней
арифметической больше, характеризуется и большей
величиной среднего квадратического отклонения и,
наоборот, при меньшей вариабельности признака
среднее квадратическое отклонение оказывается
меньшим.

15.

7. Коэффициент вариации представляет собой
показатель изменчивости изучаемого признака,
выраженный в относительных единицах, обычно в
процентах. Он определяется по формуле
где υ – коэффициент вариации;
σ – среднеквадратическое отклонение;
X - среднее значение.
Коэффициент вариации применяется при сравнительной оценке
варьирования различных признаков. При <30% - выборка имеет
большую степень концентрации вариант возле величины. При 30%≤
≤100% - степень концентрации допустимая. При >100% - делается
вывод о неоднородности выборки.

16.

8.
Показатель асимметрии
9.
Показатель эксцесса
E r4 3
Рабочие формулы
А= ∑f(xi –X)3 /n∙σ3
Е= ∑f(xi –X)4 /n∙σ4
r3
-3

17. ФУНКЦИИ РАСПРЕДЕЛЕНИЯ. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

Наиболее универсальной в биологии является
уравнение кривой нормального распределения
или функция Гаусса-Лапласса.
Ее
суть заключается в том, что частота
отклонения отдельных вариант от средней
арифметической данной совокупности есть
функция их величины. Вероятность частоты той
или иной варианты в генеральной совокупности
и определяется этой функцией.

18.

Рисунок 1- Кривая нормального распределения
Уравнение кривой нормального распределения выражает
зависимость теоретических численностей f(x) или y от
значений x, являющейся непрерывно распределяющейся
случайной величиной.

19.

Здесь y – ордината или высота кривой на любом
расстоянии от Х , т. е. центра распределения.
Вправо от этого центра случайная величина хi
имеет положительные, а влево – отрицательные
значения.

20.

Так как π – 3,14593 и e – основание
натуральных логарифмов, равное 2,7183,
являются постоянными величинами,
следовательно величина t - нормированное
отклонение.
xi X
t

21.

Кривая нормального распределения обладает следующими свойствами:
Однозначно определяется двумя параметрами: X - средним значением и
σ – среднеквадратическим отклонением.
Кривая симметрична относительно среднего значения ( X ) и имеет
колоколообразную форму, которая зависит от величины σ, являющейся
параметром масштаба, а положение определяется X .
1
Кривая имеет один максимум, равный
и две точки перегиба на
2
расстоянии ±σ от X .
Ветви кривой асимптотически приближаются к оси абсцисс на
расстояние ±∞.

22.

Рисунок 2 - Графическая иллюстрация “правила
плюс - минус трех сигм”

23.

«Правило трех сигм»
в
пределах ±1∂ находится 68,28% всех
вариант эмпирической совокупности,
распределяющейся по нормальному
закону;
в
в
пределах ±2∂ заключено 95,45%,
пределах ±3∂ содержится 99,73% всех
вариант совокупности.

24. Биномиальное распределение

Если значения частот вариант выразить в виде
распределения вероятностей, получим
биномиальное распределение (a+b)п – бином
ньютона
a b
2
a 2ab b
2
2

25.

a b
n
a n Cn1abn 1 Cn2a n 2b2 ..... Cnk a n k bk ... Cnn 1abn 1 Cnnbn
где - число сочетаний из n элементов по k.
A
n n 1 n 2 ..... n k 1
n k
C
Cn
Pk
1 * 2 * 3......k
k
n
k
n

26.

Например, при n=8 и k=5 уравнение (7.2) будет иметь вид
5
8
A
8*7 *6*5* 4
C
56
P5
1* 2 * 3 * 4 * 5
5
8
8*7 *6
C C
56
1* 2 * 3
5
8
3
8
m m n m
n
an, m C a b
n!
m n m
ab
m! n m !

27.

Формула конечного члена (формула Бернули):
m m n m
n
an, m C a b
m
n
n!
m n m
ab
m! n m !
a=1-b; C - число сочетаний из n элементов по m; ! – знак факториала, т.
е. a,b,c,…..,n! = a*b*c*….*n! например 5! = 1*2*3*4*5 = 120
Теорема верна для m=0 или m=n.

28.

Распределение Пуассона.
Распределение Пуассона, или пуассоново
распределение, подобно биномиальному, относится к
дискретной или прерывистой изменчивости. Оно имеет
самостоятельное значение, хотя его можно
рассматривать и как предельный случай
биномиального. При биномиальном распределении
значения a и b могут быть близки друг к другу, при
пуассоновом же a очень мало, т.е. события
осуществляются очень редко, а b приближается к
единице.

29.

y C p q
m
n
m
n m
n n 1 ... n m 1
* m 1
m!
n
n
n m
где np ; p / n .
Так как числитель первой дроби имеет m сомножителей, а в знаменателе
стоит nm каждый из сомножителей можно разделить на n. Получим:
m
1 2 m 1
y 1 1 ... 1
* 1
n m n
n n
n m
В биологии к распределению Пуассона прибегают, когда
исследуют мутации при проведении генетико-селекционных
исследований, при анализе появления альбиносов среди
лесных зверей и птиц, для оценки выживаемости самосева
сосны под пологом леса и т.д., при анализе других редких
событий.
English     Русский Rules