Основы математической статистики
Задачи математической статистики
Генеральная и выборочная совокупности
Пример
Повторная и бесповторная выборки. Репрезентативная выборка
Статистическое распределение выборки
Пример
Решение
Пример
Решение
Полигон и гистограмма
Пример гистограммы
Статистические оценки параметров распределения
Генеральная и выборочная средние. Методы их расчета .
Генеральная и выборочная дисперсии.
312.00K
Category: mathematicsmathematics

Основы математической статистик

1. Основы математической статистики

Лекция 3

2. Задачи математической статистики

• Установление закономерностей, которым
подчинены массовые случайные явления,
основано на изучении методами теории
вероятностей статистических данных —
результатов наблюдений.

3.

• Первая задача математической статистики
— указать способы сбора и группировки
статистических сведений, полученных в
результате наблюдений или в результате
специально поставленных экспериментов.
• Вторая задача математической
статистики—разработать методы анализа
статистических данных в зависимости от
целей исследования.

4.

• Задача математической статистики состоит
в создании методов сбора и обработки
статистических данных для получения
научных и практических выводов.

5. Генеральная и выборочная совокупности

• Выборочной совокупностью или просто
выборкой называют совокупность случайно
отобранных объектов.
• Генеральной совокупностью называют
совокупность объектов, из которых
производится выборка.
• Объемом совокупности (выборочной или
генеральной) называют число объектов
этой совокупности.

6. Пример

• Если из 1000 деталей отобрано для
обследования 100 деталей, то объем
генеральной совокупности N = 1000, а
объем выборки n =100.

7. Повторная и бесповторная выборки. Репрезентативная выборка

• Повторной называют выборку, при которой
отобранный объект (перед отбором
следующего) возвращается в генеральную
совокупность.
• Бесповторной называют выборку, при
которой отобранный объект в генеральную
совокупность не возвращается. На практике
обычно пользуются бесповторным
случайным отбором.

8.

• Свойства объектов выборки должны
правильно отражать свойства объектов
генеральной совокупности, или, как
говорят, выборка должна быть
репрезентативной (представительной).
Считается, что выборка репрезентативна,
если все объекты генеральной
совокупности имеют одинаковую
вероятность попасть в выборку, т. е. выбор
осуществляется случайно.

9. Статистическое распределение выборки

• Пусть из генеральной совокупности
извлечена выборка, причем х1 наблюдалось
n1 раз, х2 — n2 раз, ..., хk —nk раз и n1 + n2 +
… + nk = n— объем выборки. Наблюдаемые
значения x1, x2, … xk называются
вариантами, а последовательность вариант,
записанная в возрастающем порядке —
вариационным рядом.

10.

• Числа наблюдений n1, n2, … nk называют
частотами, а их отношения к объему
nk
n1
* n2
*
выборки
p1 , p 2 , ... , p k*
n
n
n
— относительными частотами. Отметим,
что сумма относительных частот равна
единице:
nk n1 n2 ... nk n
n1 n2
p p ... p ...
1
n n
n
n
n
*
1
*
2
*
k

11.

• Статистическим распределением выборки
называют перечень вариант и
соответствующих им частот или
относительных частот. Статистическое
распределение можно задать также в виде
последовательности интервалов и
соответствующих им частот (непрерывное
распределение). В качестве частоты,
соответствующей интервалу, принимают
сумму частот вариант, попавших в этот
интервал.

12. Пример

• Дана выборка:
• 12,2,6,2,6,12,6,2,6,12,6,6,12,12,12,6,6,12,6,6
• Составить вариационный ряд и
статистическое распределение

13. Решение

• Составим вариационный ряд:
• 2,2,2,6,6,6,6,6,6,6,6,6,6,12,12,12,12,12,12,12
• Создадим статистическое распределение:
Варианта
хi
Частота
ni
2
6
12
3
10
7

14. Пример

• Задано распределение частот выборки
объема n — 20:
Варианта
хi
Частота
ni
2
6
12
3
10
7
• Написать распределение относительных
частот.

15. Решение

• Найдем относительные частоты, для чего
разделим частоты на объем выборки:
3
10
7
*
*
p
0,15; p 2
0,50; p3
0,35
20
20
20
*
1
• Поэтому получаем следующее
распределение:
Варианта хi
2
6
12
Относительная
частота ni
0,15
0,50
0,35

16. Полигон и гистограмма

• Для графического изображения
статистического распределения
используются полигоны и гистограммы.
• Полигоном частот называют ломаную,
отрезки которой соединяют точки
(х1; n1), (х2; n2), ..., (xk; nk).
• Полигоном относительных частот
называют ломаную, отрезки которой
соединяют точки
*
*
*
x1 ; p1 , x2 ; p2 , ... xk ; pk

17.

• Гистограммой частот называют
ступенчатую фигуру, состоящую из
прямоугольников, основаниями которых
служат частичные интервалы длиною h, а
ni
высоты равны отношению (плотность
h
частоты).
• Площадь i-го частичного прямоугольника
равна
ni
h ni —сумме частот вариант i-гo
h
интервала; следовательно, площадь
гистограммы частот равна сумме всех
частот, т. е. объему выборки.

18. Пример гистограммы

hi=n/xi

19.

• Гистограммой относительных частот
называют ступенчатую фигуру, состоящую из
прямоугольников, основаниями которых
служат частичные интервалы
длиною
h,
а
*
p
высоты равны отношению i (плотность
относительной частоты). h
• Площадь i-го частичного прямоугольника
равна
pi*
h pi* - относительной частоте вариант,
h
попавших в i-й интервал, следовательно,
площадь гистограммы относительных частот
равна сумме всех относительных частот, т. е.
единице.

20. Статистические оценки параметров распределения

• Cтатистической оценкой неизвестного
параметра теоретического распределения
называют функцию от наблюдаемых
случайных величин.

21. Генеральная и выборочная средние. Методы их расчета .

• Пусть изучается дискретная генеральная
совокупность объема N относительно
количественного признака X.
• Генеральной средней xГ называют среднее
арифметическое значений признака
генеральной совокупности.

22.

• Если все значения x1, x2, … xN признака
генеральной совокупности объема N
различны, то
1
x Г x1 x2 ... x N
N
• Если же значения признака x1, x2, … xk
имеют соответственно частоты N1, N2, ...,
Nk, причем N1 + N2 + ... + Nk = N, то
1
x Г x1 N1 x2 N 2 ... xk N k
N
или
1

N
k
x N
i 1
i
i

23.

• Пусть для изучения генеральной
совокупности относительно
количественного признака X произведена
выборка объема n.
• Выборочной средней xВ называют среднее
арифметическое значение признака
выборочной совокупности.

24.

• Если все значения x1, x2, … xk признака
выборки объема n различны, то
1
xВ x1 x2 ... xk
n

25.

• Если же значения признака x1, x2, … xk
имеют соответственно частоты n1, n2 … nk
причем n1 + n2 + … +nk = n, то
1
xВ x1n1 x2 n2 ... xk nk
n
или
1 k
xВ xi ni
n i 1

26. Генеральная и выборочная дисперсии.

• Для того чтобы охарактеризовать рассеяние
значений количественного признака X
генеральной совокупности вокруг своего
среднего значения, вводят сводную
характеристику — генеральную дисперсию.

27.

• Генеральной дисперсией DГ называют
среднее арифметическое квадратов
отклонений значений признака генеральной
совокупности от их среднего значения x à .
• Если все значения x1, x2, … xN признака
генеральной совокупности объема N
различны, то
2
N
1
DГ xi x Г
N i 1

28.

• Если же значения признака x1, x2, … xk
имеют соответственно частоты N1, N2, ...,
Nk, причем N1 + N2 + ... + Nk = N, то
1

N
2
N
x x N
i 1
i
Г
i

29.

• Генеральным средним квадратическим
отклонением (стандартом) называют
квадратный корень из генеральной
дисперсии:
Г DГ

30.

• Выборочной дисперсией DB называют
среднее арифметическое квадратов
отклонения наблюдаемых значений
признака от их среднего значения x  .
• Если все значения x1, x2, … xk признака
выборки объема n различны, то
k
2
1
DВ xi xВ
n i 1

31.

• Если же значения признака x1, x2, … xn
имеют соответственно частоты n1, n2 … nk
причем n1 + n2 + … +nk = n, то
2
k
1
DВ ni xi xВ
n i 1

32.

• Выборочным средним квадратическим
отклонением (стандартом) называют
квадратный корень из выборочной
дисперсии: В DВ

33.

• Выборочная дисперсия является
смещенной оценкой генеральной
дисперсии, т.е. математическое ожидание
выборочной дисперсии не равно
оцениваемой генеральной дисперсии, а
равно
n 1
M DВ

n

34.

• Легко «исправить» выборочную дисперсию
так, чтобы ее математическое ожидание
было равно генеральной дисперсии.
Достаточно для этого умножить DB на
n
дробь n 1 . Итак, в качестве оценки
генеральной дисперсии принимают
исправленную дисперсию
k
1
2
s
ni xi xВ
n 1 i 1
2

35.

• Точечной называют оценку, которая
определяется одним числом. Все оценки,
рассмотренные выше, — точечные. При
выборке малого объема точечная оценка
может значительно отличаться от
оцениваемого параметра, т. е. приводить к
грубым ошибкам. По этой причине при
небольшом объеме выборки следует
пользоваться интервальными оценками.

36.

• Интервальной называют оценку, которая
определяется двумя числами — концами
интервала. Интервальные оценки
позволяют установить точность и
надежность оценок.

37.

• Пусть X — оцениваемый параметр
генеральной совокупности (генеральное
среднее, генеральная дисперсия и т.д.), a —
X его точечная оценка, полученная по
выборке.
• Интервальной оценкой параметра X
называется оценка вида
P X X X P

38.

• При этом интервал X , X
называется доверительным интервалом.
• Величина ε характеризует точность оценки,
а величина Рα равна вероятности того, что
параметр X лежит в указанных пределах.

39.

• Пусть рассматриваемый признак
распределен в генеральной совокупности
по нормальному закону с неизвестными
значениями генерального среднего и
дисперсии. Для того чтобы получить
интервальную оценку генерального
среднего Хг, поступают следующим
образом.

40.

• Для выборки некоторого объема n
вычисляют выборочное среднее и
исправленное среднее квадратическое
отклонение .
• Выбирают доверительную вероятность Рα
(обычно 0,95 или 0,99) и для нее по таблице
распределения Стьюдента находят
параметр t.
• Рассчитывают полуширину доверительного
t s
интервала ε:
n

41.

• Получают интервальную оценку
генеральной средней с выбранной
доверительной вероятностью:
XВ X Г XВ
English     Русский Rules