Similar presentations:
Выборочное наблюдение
1. Тема Выборочное наблюдение
Общая теориястатистики
Тема
Выборочное
наблюдение
2. Найдите: медиану стажа и среднюю зарплату для коллектива из 5 человек
НомерСтаж, лет
Зарплата, т.р.
1
5
№ в списке
2
12
8
3
№ в списке
15
4
20
22
5
25
19
3. Определение выборочного наблюдения
Выборочное наблюдение — это способнесплошного статистического наблюдения, при
котором обследуются не все единицы
изучаемой (генеральной) совокупности, а лишь
часть ее (выборка), отобранная по
определенным правилам (научно) и
обеспечивающая получение данных,
характеризующих совокупность в целом.
4. Причины применения:
♦ Экономия♦ Невозможность
проведения сплошного
исследования
5. Основные обозначения
N – объем, численность, число единицГС
n – объем ВС
x генеральна я _ средняя ;
w
ген
доля _ единиц , обладающих
признаком _ в _ ГС
6. Основная идея выборочного метода состоит в том, что в результате обследования части совокупности можно судить с определенной
вероятностью о характеристикахвсей изучаемой совокупности
(генеральной совокупности)
Часть генеральной совокупности,
которая подвергается обследованию
– называется выборочной
совокупностью (выборкой).
7.
Для того, чтобы выборочнаясовокупность давала объективные
результаты, она должна быть
репрезентативной (каждая единица
генеральной совокупности должна
иметь равную возможность попасть в
выборку). Тогда с увеличением объема
выборки характеристики выборочной
совокупности будут приближаться к
характеристикам генеральной
совокупности.
8.
Теоретической основойвыборки являются
теоремы закона больших
чисел (Чебышева,
Ляпунова, Бернулли и
др.)
9. Задачи выборочного метода
♦ Определение доверительного интервала,в котором находится характеристика
генеральной совокупности
♦ Определение минимального объема
выборки
♦ Определение доверительной вероятности
того, что разность между
характеристиками выборочной и
генеральной совокупностей не
превзойдет наперед заданного числа
10. Пример. Имеются данные о зарплате рабочих в у. е.
Группы по з/пл. ГС - человек10-13
100
Из них попали
в выборку
5
13-16
150
10
16-19
400
30
19-22
200
45
22-25
150
10
1000
100
Итого
11. Сходство ГС и ВС
Из теорем Чебышева, Ляпунова и законабольших чисел следует:
Хотя каждая выборочная средняя
отличается от генеральной, среднее
значение по ним равно генеральной:
~
x
n
x
12. вывод.
Реально наблюдаемая совокупностьобъектов, статистически представленная
рядом наблюдений x1, x2,…, xn случайной
величины Х, является выборкой, а
гипотетически существующая
(домысливаемая) – генеральной
совокупностью.
13.
В основе решения задач навыборочный метод лежат формулы
предельных ошибок выборки
t
14. Обозначения
t- число, связанное с вероятностью
через табл. закона распределения
- средняя ошибка выборки
- предельная ошибка
15. Ошибки выборки
| x x |0
- ошибка средней
x
- генеральная средняя
| W W |
0
W0
w
- генеральная доля
- ошибка доли
16. Характеристики выборочной совокупности
x nx
i
i
n
2
x
m
W
n
- выборочная средняя
2
i
x ni
- выборочная дисперсия
n
- выборочная доля
17. Объем выборки
Числонаблюдений n, образующих
выборку, называется объемом
выборки. Если объем выборки n
достаточно велик (n ), выборка
считается большой, в противном
случае она называется выборкой
ограниченного объема.
18.
Малой считаетсявыборка,
в которую входит
19.
Рассмотрим особенности малой выборки.Если мы работаем с обычной
выборкой, то используется таблица
«Интеграла вероятностей закона
нормального распределения».
В случае малой выборки необходимо
пользоваться таблицей «Распределение
Стьюдента», при этом число степеней
свободы равно:
20. Объем выборки
Выборка считается малой, если приизмерении одномерной случайной
величины X объем выборки не
превышает 30 (n <= 30), а при
измерении одновременно нескольких
(k) признаков в многомерном
пространстве отношение n к k не
превышает 10 (n/k < 10).
21. Условия проведения выборки
Выборка будет представлять всю совокупностьс приемлемой точностью при выполнении двух
условий.
22. Условия проведения выборки
Во-первых, она должна бытьдостаточно многочисленной,
чтобы в ней могли проявиться
закономерности,
существующие в генеральной
совокупности.
23. Условия проведения выборки
Во-вторых, элементы выборки должныбыть
отобраны
объективно,
независимо от воли исследователя,
чтобы
каждый
из
них
имел
одинаковые шансы быть отобранным
или чтобы эти шансы были известны
исследователю.
24. характеристика выборочного наблюдения
Генеральная совокупность может бытьконечной (число наблюдений N = const)
или бесконечной (N = ), а выборка из
генеральной совокупности – это всегда
результат
ограниченного
ряда
n
наблюдений.
25. Способы отбора
По виду различают индивидуальный,групповой и комбинированный отбор. При
индивидуальном отборе в выборочную
совокупность отбираются отдельные единицы
генеральной совокупности, при групповом
отборе – группы единиц, а комбинированный
отбор предполагает сочетание группового и
индивидуального отбора.
26. Виды и схемы отбора
Процесс образования выборочнойсовокупности называется отбором.
Он осуществляется в порядке
беспристрастного,
случайного
отбора единиц из генеральной
совокупности.
Существуют
пять
основных
способов отбора
27. Простой случайный отбор
прикотором
n
объектов
случайно
извлекаются из генеральной совокупности
N объектов (например с помощью таблицы
или датчика случайных чисел), причем
каждая из возможных выборок имеют
равную вероятность. Такие выборки
называются собственно-случайными.
28. Случайная выборка
♦ Случайная выборка - основа всех другихспособов отбора.
♦ Случайная выборка осуществляется
методом жеребьевки: все единицы
совокупности нумеруются, номера
записываются на карточки, а потом
отбираются.
♦ Отбор может быть повторным и
бесповторным.
29. Формулы предельных ошибок выборки
Повторныйотбор
Для средней
Для доли
t
2
n
w (1 w)
t
n
Бесповторный
отбор
t
2
n
(1 )
n
N
n
w (1 w) (1 )
N
t
n
30. Обозначения:
• 2 - выборочная дисперсия;• W - выборочная доля;
• n - объем выборочной совокупности;
• N - объем генеральной совокупности;
• t - число, связанное с вероятностью,
которая берется из таблицы интеграла
вероятностей закона распределения.
31. Пример
Для определения среднего срокаслужбы изделий было обследовано 250
изделий. При этом средний срок
службы был установлен на уровне 41,9
месяца. Среднее квадратическое
отклонение равно 6,2 месяцам.
С вероятностью 0,9973 определить,
в каких пределах находится средний
срок службы всех изделий
32. Решение:
• Р=0,9973, t=3 (из таблицы интеграла вероятностейзакона нормального распределения).
2
6
,
2
x 3
1, 2мес
250
x x x0 x x
41,9 1,2 x0 41,9 1,2
40 ,7 мес x0 43,1мес
33. Пример
• Определить вероятность того, что предельнаяошибка средней службы не превысит 1 месяц.
Решение:
x t
t
x
2
2
n
n
P 0,9892
1
6,2 2
250
2,55
34. Пример Определение минимального объема выборки.
Сколько следует прохронометрироватьопераций, чтобы с вероятностью 0,9973
можно было бы утверждать, что разность
между
средней
продолжительностью
операций в выборочной и генеральной
совокупности не превысит 1 секунды, если
по результатам предыдущего испытания
установлено, что средняя продолжительность
операции равна 30 секундам, а среднее
квадратическое
отклонение
равно
7
секундам?
35. Решение :
n ?1
t
3 7
n 2 2 441
x
1
2
2
2
2
Ответ: нужно прохронометрировать не менее
441 операции.
36. Простой отбор с помощью регулярной процедуры
осуществляется с применениеммеханической составляющей
(номера квартиры, даты, дня
недели, буквы алфавита) и
полученные таким способом
выборки называются
механическими.
37. Стратифицированный отбор
заключается в том, что генеральнаясовокупность объема N подразделяется на
части совокупности или слои (страты)
объема N1, N2, … , Nr, так что N1 + N2 + … +
Nr = N.
38. Стратифицированный отбор
Страты - однородные объекты с точки зрениястатистических
характеристик
(например,
население по возрасту делится на две страты – в
трудоспособном и нетрудоспособном возрасте;
банки – по размеру капитала). В этом случае
выборки называются стратифицированными
(расслоенными,
типическими,
районированными).
39. Серийный отбор
Приемы серийного отбора используютсядля формирования серийных или гнездовых
выборок. Они удобны в том случае, если
необходимо обследовать сразу "блок" или
серию объектов (например, партию товара,
продукцию определенной серии или
предприятия территориальноадминистративной единицы).
40.
Вся совокупность делится насерии, после чего механическим
или собственно случайным
способом отбирается некоторое
количество серий. Все единицы
совокупности, входящие в
отобранные серии, подвергаются
сплошному контролю.
41.
ПовторныйМетод
отбора
Выборка
для
средней
Серийная
(гнездовая)
t
x
r
Бесповторный
для доли
2
t
w
r
для средней
2
t
x2
r
1
r R
для доли
t
w2 r
1
r R
42.
r – количество отобранных серийR – общее число серий
xi
( x x )
x
x
r
r
2
x - межсерийная дисперсия
2
W
(
W
W
)
i
2
i
W
W
r
r
2
2
i
2
W
Wi
W
- межсерийная выборочная дисперсия для доли
- доля изучаемого признака в i-той группе
- средняя выборочная доля изучаемого
признака
43.
Пример:На предприятии 10 бригад. Изучается
производительность труда. Отбираются 2
бригады. Средняя производительность труда 1-й
бригады – 4,6 тонны, а 2-й – 3 тонны. С
вероятностью 0,9973 определить пределы в кот.
будет находиться средняя производительность
труда рабочих данного предприятия.
t=3
44.
4,6 3x
3,8т.
2
2
2
(
4
,
6
3
,
8
)
(
3
3
,
8
)
x2
0,64
2
0,64
2
x 3
(1 ) 1,5т.
2
10
3,8 1,5 x 3,8 1,5
0
2,3 x 5,3
0
ОТВЕТ:
2,3 x 5,3
0
45. Типическая выборка
способ проведения типической выборки:1. вся совокупность делится на тип
сельское
пример
население
городское
2. из каждой типической группы
отбирается некоторое
количество единиц
Отбор может быть как
пропорциональным объёму
типических групп, так и
непропорциональным
www.olegfedorov.info
46. Объем выборки
При отборе, пропорциональном объему типических групп, числонаблюдений по каждой группе определяется по формуле:
Ni
ni n
N
ni -объем выборки из i -й типической группы.
n
-общий объем выборки.
N i -объем i-й типической группы в генеральной совокупности.
N -объем генеральной совокупности.
47. Типическая выборка: формулы
ПовторныйМетод
отбора
Выборка
Для средней
Типическая (при отборе
пропорциональном объему
групп)
t
i
2
n
Для доли
Бесповторный
Для средней
Для доли
2
wi (1 wi )
i
n t wi (1 wi ) (1 n )
t
(1 )
t
n
N
n
N
n
48. Типическая выборка: пример
Задача. Определим средний возраст мужчин,вступающих в брак, произведя 5%-ю типическую
выборку:
соц. группа
рабочие
служащие
число
мужчин
средний
возраст
ср. кв.
отклонение
ni
xi
i
60
40
24
27
5
8
доля мужчин,
вступающих во
второй брак.
wi
0.10
0.20
С вероятностью 0,954 определить
1) пределы, в которых будет находиться средний
возраст мужчин, вступающих в брак
2) долю мужчин, вступающих в брак во второй раз.
49. Типическая выборка: пример
Решение. 1) Средний возраст вступления в бракмужчин находится в пределах
х x х0 х x
x n
x
n
i
i
i
2
i
24 60 27 40
25,2 года;
100
2
i ni
n
i
25 60 64 40
40,6
100
50. Решение примера типической выборки
40,6x 2
(1 0,05) 1,2 года
100
Таким образом, с вероятностью 0,954 можно
утвердить, что средний возраст мужчин, вступающих
в брак, принимает значения 25,2 ± 1,2 года,
или
24 x 26,4
51. Типическая выборка: пример
Решение. 2) Доля мужчин, вступающих в брак вовторой раз, находится в пределах
w w w0 w w
wn
w
n
i i
i
0,1 60 0,2 40
0,14 14%
100
w (1 w )n
w (1 w )
n
i
i
i
i
i
i
(0,1 0,9) 60 (0,2 0,8) 40
0,098
100
52. Вывод по примеру типической выборки
0,098w 2
(1 0,05) 0,06 6%
100
Таким образом, с вероятностью 0,954 можно утверждать, что доля
мужчин, вступающих в брак во второй раз, принимает значения
14% ± 6%, или
8% p 20%
53. Комбинированный (ступенчатый ) отбор
может сочетать в себе сразу несколькоспособов
отбора
(например,
стратифицированный и случайный
или случайный и механический);
такая
выборка
называется
комбинированной.
54. Методы отбора По методу отбора различают повторную и бесповторную выборку. Бесповторным называется отбор, при котором попавшая
в выборку единица невозвращается в исходную совокупность и
в дальнейшем выборе не участвует; при
этом численность единиц генеральной
совокупности N сокращается в процессе
отбора.
55.
При повторном отборе попавшая в выборкуединица после регистрации возвращается в
генеральную совокупность и таким образом
сохраняет равную возможность наряду с другими
единицами быть использованной в дальнейшей
процедуре отбора; при этом численность единиц
генеральной совокупности N остается неизменной
(метод в социально-экономических исследованиях
применяется редко). Однако, при большом N (N )
формулы для бесповторного отбора приближаются к
аналогичным для повторного отбора и практически
чаще используются последние (N = const).
56. Механическая выборка
При механической выборке всясовокупность делится на группы по числу
единиц, которые должны войти в выборку,
после чего из каждой группы отбирается 1
единица. Таким образом механическая
выборка является бесповторной. Для
механической выборки применяются
формулы собственно-случайного,
бесповторного отбора
57.
Механическая выборка применяется в случаях,когда генеральная совокупность каким либо
образом , упорядочена , т.е. имеется
определенная
последовательность
в
расположении единиц (табельные номера
работников,
избирательные
списки,
телефонные номера респондентов, номера
домов и квартир и т.п.)
58. Характеристики генеральной и выборочной совокупности
Воснове статистических выводов
проведенного исследования лежит
распределение случайной величины
Х, наблюдаемые же значения (х1, х2,
… , хn) называются реализациями
случайной величины Х (n – объем
выборки).
59. Характеристики генеральной и выборочной совокупности
Распределение случайной величины Хв генеральной совокупности носит
теоретический, идеальный характер,
а ее выборочный аналог является
эмпирическим распределением.
60. Выборочная доля
Отношениечисла единиц,
обладающих данным признаком
или данным его значением m, к
общему числу единиц выборочной
совокупности n называется
выборочной долей w:
w = m/n.
61. Пример
В партии товара, содержащей 10 тыс.штук, при 4% выборке доля выборки kn в
абсолютной величине составляет 400 шт.
(n = N 0,04); если же в этой выборке
обнаружено 12 бракованных изделий, то
выборочная доля брака w составит 0,03
(w = 12/400 = 0,03 или 3%).
62.
2x
i
2
x ni
n
W0-генеральная доля
M
W0
N
W – выборочная доля
m
W
n
63. Ошибка выборочного наблюдения
Поскольку выборочная совокупностьотлична от генеральной, то возникают
ошибки выборки. При сплошном и
выборочном наблюдении могут
произойти ошибки двух видов:
регистрации и репрезентативности.
64. Ошибка выборочного наблюдения
Ошибки регистрации могут иметьслучайный и систематический характер.
Случайные ошибки складываются из
множества различных неконтролируемых
причин, носят непреднамеренный характер и
обычно по совокупности уравновешивают друг
друга (например, изменения показателей
прибора при температурных колебаниях или
магнитных бурях).
65. Ошибка выборочного наблюдения
Систематические ошибкитенденциозны, так как нарушают
правила отбора объектов в выборку
(например, отклонения в измерениях при
изменении настройки измерительного
прибора или отбор каждой четвертой
квартиры при 25% выборке в доме с
четырьмя квартирами на лестничной
площадке).
66.
Теоремы закона больших чиселустанавливают связь между предельной
ошибкой выборки, гарантированной с
определенной вероятностью, числом ( t ) и
средней ошибкой выборки ( )
67.
При оценке результатов малой выборки величина генеральной дисперсии врасчетах не используется. Для определения возможных пределов ошибки
пользуются так называемым критерием Стьюдента, определяемым по
формуле
~x x
t
MB
где
MB
выборке.
n 1
- мера случайных колебаний выборочной средней в малой
68. Теорема Ляпунова
А.М. Ляпунов доказал, что распределениевыборочных средних( а следовательно, и их
отклонений от генеральной средней ) при
достаточно большом числе независимых
наблюдений приближенно нормально при
условии, что генеральная совокупность
обладает конечной средней и ограниченной
дисперсией.
69. Теорема Ляпунова
Математически теорему Ляпунова можно записатьтак:
t
t2
2
x
t
1
P x x
e dt F (t )
2
где
x
x
t
2
n
=3,14(математическая постоянная);
- предельная ошибка выборки, которая дает
возможность выяснить, в каких пределах находится
70. Ошибка выборочного наблюдения
Параметры эмпирического распределенияx и s2 являются случайными
величинами, следовательно, ошибки
выборки также являются случайными
величинами, могут принимать для
разных выборок разные значения и
поэтому принято вычислять среднюю
ошибку.
71. Средняя ошибка выборки
m=2
n
72. Средняя ошибка выборки
выражает среднее квадратическое отклонениевыборочной средней от математического
ожидания. Эта величина при соблюдении
принципа случайного отбора зависит прежде
всего от объема выборки n и от степени
колеблемости признака: чем больше n и чем
меньше вариация признака (следовательно, и
значение 2), тем меньше величина средней
ошибки выборки m.
73.
Необходимыйобъем выборки
74.
ФОРМУЛЫ РАСЧЁТА НЕОБХОДИМОЙ ЧИСЛЕННОСТИ ВЫБОРКИ ДЛЯ СОБСТВЕННО-СЛУЧАЙНОГО ОТБОРАДля
средней
Для
доли
Собственно-случайный отбор
повторный
бесповторный
t 2 2
2
t 2 2 N
N 2 t 2 2
t 2 w(1 w)
2
t 2 Nw(1 w)
N 2 t 2 w(1 w)
75. Задача
В городе 2000 семей.Предполагается провести
выборочное
обследование методом
случайной бесповторной
выборки для нахождения
среднего размера семьи.
76.
Определить необходимуючисленность выборки
при условии, что с
вероятностью 0,954 ошибка
выборки не превысит 1
человека при среднем
квадратическом отклонении
3 человека.
77. Формула
78. Решение
79. Исходные данные
данные80. Ответ
n4 * 9 * 2000
36
2000 * 1 49
Необходимо обследовать не менее 36
семей.