Similar presentations:
Основы математической статистики. Лекция 3
1. Основы математической статистики
Лекция 32. Задачи математической статистики
• Установление закономерностей, которымподчинены массовые случайные явления,
основано на изучении методами теории
вероятностей статистических данных —
результатов наблюдений.
3.
• Первая задача математической статистики— указать способы сбора и группировки
статистических сведений, полученных в
результате наблюдений или в результате
специально поставленных экспериментов.
• Вторая задача математической
статистики—разработать методы анализа
статистических данных в зависимости от
целей исследования.
4.
• Задача математической статистики состоитв создании методов сбора и обработки
статистических данных для получения
научных и практических выводов.
5. Генеральная и выборочная совокупности
• Выборочной совокупностью или простовыборкой называют совокупность случайно
отобранных объектов.
• Генеральной совокупностью называют
совокупность объектов, из которых
производится выборка.
• Объемом совокупности (выборочной или
генеральной) называют число объектов
этой совокупности.
6. Пример
• Если из 1000 деталей отобрано дляобследования 100 деталей, то объем
генеральной совокупности N = 1000, а
объем выборки n =100.
7. Повторная и бесповторная выборки. Репрезентативная выборка
• Повторной называют выборку, при которойотобранный объект (перед отбором
следующего) возвращается в генеральную
совокупность.
• Бесповторной называют выборку, при
которой отобранный объект в генеральную
совокупность не возвращается. На практике
обычно пользуются бесповторным
случайным отбором.
8.
• Свойства объектов выборки должныправильно отражать свойства объектов
генеральной совокупности, или, как
говорят, выборка должна быть
репрезентативной (представительной).
Считается, что выборка репрезентативна,
если все объекты генеральной
совокупности имеют одинаковую
вероятность попасть в выборку, т. е. выбор
осуществляется случайно.
9. Статистическое распределение выборки
• Пусть из генеральной совокупностиизвлечена выборка, причем х1 наблюдалось
n1 раз, х2 — n2 раз, ..., хk —nk раз и n1 + n2 +
… + nk = n— объем выборки. Наблюдаемые
значения x1, x2, … xk называются
вариантами, а последовательность вариант,
записанная в возрастающем порядке —
вариационным рядом.
10.
• Числа наблюдений n1, n2, … nk называютчастотами, а их отношения к объему
nk
n1
* n2
*
выборки
p1 , p 2 , ... , p k*
n
n
n
— относительными частотами. Отметим,
что сумма относительных частот равна
единице:
nk n1 n2 ... nk n
n1 n2
p p ... p ...
1
n n
n
n
n
*
1
*
2
*
k
11.
• Статистическим распределением выборкиназывают перечень вариант и
соответствующих им частот или
относительных частот. Статистическое
распределение можно задать также в виде
последовательности интервалов и
соответствующих им частот (непрерывное
распределение). В качестве частоты,
соответствующей интервалу, принимают
сумму частот вариант, попавших в этот
интервал.
12. Пример
• Дана выборка:• 12,2,6,2,6,12,6,2,6,12,6,6,12,12,12,6,6,12,6,6
• Составить вариационный ряд и
статистическое распределение
13. Решение
• Составим вариационный ряд:• 2,2,2,6,6,6,6,6,6,6,6,6,6,12,12,12,12,12,12,12
• Создадим статистическое распределение:
Варианта
хi
Частота
ni
2
6
12
3
10
7
14. Пример
• Задано распределение частот выборкиобъема n — 20:
Варианта
хi
Частота
ni
2
6
12
3
10
7
• Написать распределение относительных
частот.
15. Решение
• Найдем относительные частоты, для чегоразделим частоты на объем выборки:
3
10
7
*
*
p
0,15; p 2
0,50; p3
0,35
20
20
20
*
1
• Поэтому получаем следующее
распределение:
Варианта хi
2
6
12
Относительная
частота ni
0,15
0,50
0,35
16. Полигон и гистограмма
• Для графического изображениястатистического распределения
используются полигоны и гистограммы.
• Полигоном частот называют ломаную,
отрезки которой соединяют точки
(х1; n1), (х2; n2), ..., (xk; nk).
• Полигоном относительных частот
называют ломаную, отрезки которой
соединяют точки
*
*
*
x1 ; p1 , x2 ; p2 , ... xk ; pk
17.
• Гистограммой частот называютступенчатую фигуру, состоящую из
прямоугольников, основаниями которых
служат частичные интервалы длиною h, а
ni
высоты равны отношению (плотность
h
частоты).
• Площадь i-го частичного прямоугольника
равна
ni
h ni —сумме частот вариант i-гo
h
интервала; следовательно, площадь
гистограммы частот равна сумме всех
частот, т. е. объему выборки.
18. Пример гистограммы
hi=n/xi19.
• Гистограммой относительных частотназывают ступенчатую фигуру, состоящую из
прямоугольников, основаниями которых
служат частичные интервалы
длиною h, а
*
высоты равны отношению pi (плотность
относительной частоты). h
• Площадь i-го частичного прямоугольника
равна
pi*
h pi* - относительной частоте вариант,
h
попавших в i-й интервал, следовательно,
площадь гистограммы относительных частот
равна сумме всех относительных частот, т. е.
единице.
20. Статистические оценки параметров распределения
• Cтатистической оценкой неизвестногопараметра теоретического распределения
называют функцию от наблюдаемых
случайных величин.
21. Генеральная и выборочная средние. Методы их расчета .
• Пусть изучается дискретная генеральнаясовокупность объема N относительно
количественного признака X.
• Генеральной средней xГ называют среднее
арифметическое значений признака
генеральной совокупности.
22.
• Если все значения x1, x2, … xN признакагенеральной совокупности объема N
различны, то
1
x Г x1 x2 ... x N
N
• Если же значения признака x1, x2, … xk
имеют соответственно частоты N1, N2, ...,
Nk, причем N1 + N2 + ... + Nk = N, то
1
x Г x1 N1 x2 N 2 ... xk N k
N
или
1 k
x Г xi N i
N i 1
23.
• Пусть для изучения генеральнойсовокупности относительно
количественного признака X произведена
выборка объема n.
• Выборочной средней xВ называют среднее
арифметическое значение признака
выборочной совокупности.
24.
• Если все значения x1, x2, … xk признакавыборки объема n различны, то
1
xВ x1 x2 ... xk
n
25.
• Если же значения признака x1, x2, … xkимеют соответственно частоты n1, n2 … nk
причем n1 + n2 + … +nk = n, то
1
xВ x1n1 x2 n2 ... xk nk
n
или
1 k
xВ xi ni
n i 1
26. Генеральная и выборочная дисперсии.
• Для того чтобы охарактеризовать рассеяниезначений количественного признака X
генеральной совокупности вокруг своего
среднего значения, вводят сводную
характеристику — генеральную дисперсию.
27.
• Генеральной дисперсией DГ называютсреднее арифметическое квадратов
отклонений значений признака генеральной
совокупности от их среднего значения x à .
• Если все значения x1, x2, … xN признака
генеральной совокупности объема N
различны, то
2
N
1
DГ xi x Г
N i 1
28.
• Если же значения признака x1, x2, … xkимеют соответственно частоты N1, N2, ...,
Nk, причем N1 + N2 + ... + Nk = N, то
N
2
1
DГ xi x Г N i
N i 1
29.
• Генеральным средним квадратическимотклонением (стандартом) называют
квадратный корень из генеральной
дисперсии:
Г DГ
30.
• Выборочной дисперсией DB называютсреднее арифметическое квадратов
отклонения наблюдаемых значений
признака от их среднего значения x  .
• Если все значения x1, x2, … xk признака
выборки объема n различны, то
k
2
1
DВ xi xВ
n i 1
31.
• Если же значения признака x1, x2, … xnимеют соответственно частоты n1, n2 … nk
причем n1 + n2 + … +nk = n, то
2
k
1
DВ ni xi xВ
n i 1
32.
• Выборочным средним квадратическимотклонением (стандартом) называют
квадратный корень из выборочной
дисперсии: В DВ
33.
• Выборочная дисперсия являетсясмещенной оценкой генеральной
дисперсии, т.е. математическое ожидание
выборочной дисперсии не равно
оцениваемой генеральной дисперсии, а
равно
n 1
M DВ
DГ
n
34.
• Легко «исправить» выборочную дисперсиютак, чтобы ее математическое ожидание
было равно генеральной дисперсии.
Достаточно для этого умножить DB на
n
дробь n 1 . Итак, в качестве оценки
генеральной дисперсии принимают
исправленную дисперсию
k
1
2
s
ni xi xВ
n 1 i 1
2
35.
• Точечной называют оценку, котораяопределяется одним числом. Все оценки,
рассмотренные выше, — точечные. При
выборке малого объема точечная оценка
может значительно отличаться от
оцениваемого параметра, т. е. приводить к
грубым ошибкам. По этой причине при
небольшом объеме выборки следует
пользоваться интервальными оценками.
36.
• Интервальной называют оценку, котораяопределяется двумя числами — концами
интервала. Интервальные оценки
позволяют установить точность и
надежность оценок.
37.
• Пусть X — оцениваемый параметргенеральной совокупности (генеральное
среднее, генеральная дисперсия и т.д.), a —
X его точечная оценка, полученная по
выборке.
• Интервальной оценкой параметра X
называется оценка вида
P X X X P
38.
• При этом интервал X , Xназывается доверительным интервалом.
• Величина ε характеризует точность оценки,
а величина Рα равна вероятности того, что
параметр X лежит в указанных пределах.
39.
• Пусть рассматриваемый признакраспределен в генеральной совокупности
по нормальному закону с неизвестными
значениями генерального среднего и
дисперсии. Для того чтобы получить
интервальную оценку генерального
среднего Хг, поступают следующим
образом.
40.
• Для выборки некоторого объема nвычисляют выборочное среднее и
исправленное среднее квадратическое
отклонение .
• Выбирают доверительную вероятность Рα
(обычно 0,95 или 0,99) и для нее по таблице
распределения Стьюдента находят
параметр t.
• Рассчитывают полуширину доверительного
t s
интервала ε:
n
41.
• Получают интервальную оценкугенеральной средней с выбранной
доверительной вероятностью:
XВ X Г XВ