Similar presentations:
Задачи экометрии
1.
ЗАДАЧИ ЭКОМЕТРИИ1 задача: Указать способы сбора и группировки стат.
сведений, полученных в результате наблюдений или
некоторых поставленных экспериментов в области
экологии и природопользования
2 задача: Разработать методы анализа стат.данных в
зависимости от целей исследования:
а).оценка неизвестной вероятности события; оценка
неизвестной функции распределения; оценка
параметров распределения; оценка зависимости
случайной величины от других случайных величин
б).проверка стат.гипотез о виде неизвестного
распределения
2.
Гл.1 Случайные величины§1. Основные понятия
Случайная величина
Дискретная (ДСВ)
Непрерывная (НСВ)
ДСВ обозначаем: X,Y,Z…, а их значения x,y,z…
ДСВ имеет конечное число значений,
НСВ- имеет бесконечное число значений.
3.
§2. ВЫБОРОЧНЫЙ МЕТОДп.1.Генеральная и выборочная совокупность
СТАТИСТИЧЕСКАЯ СОВОКУПНОСТЬ
ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ
(ОБЪЕМ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ)
ВЫБОРКА
ПОВТОРНЫЕ
(ОБЪЕМ ВЫБОРКИ)
БЕСПОВТОРНЫЕ
РЕПРЕЗЕНТАТИВНАЯ
4.
п.2. Статистическое распределение выборки.ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ
ВЫБОРОЧНАЯ СОВОКУПНОСТЬ
Значение х1 наблюдалось п1 раз; х2-п2 раза;…;
хk- nk раз.
k
п1 п2 ... пk пi
i 1
х1;х2;…хk-варианты
n1;n2;…nk – частоты
пi
п1
1 ;... i
п
n
относительные частоты
5.
§2. ВЫБОРОЧНЫЙ МЕТОДЗадано распределение частот
выборки объема п=20
Написать распределение
относительных частот
ПРИМЕР
хi
2
6
12
ni
3
10
7
3
1
0,15
20
10
2
0,5
20
7
3
0,35
20
хi
i
2
0,15
пi 20
6
0,5
12
0,35
Проверка: 0,15+0,5+0,35=1
6.
п.3. Полигон и гистограмма§2. ВЫБОРОЧНЫЙ МЕТОД
Графическое изображение статистического
распределения
Полигон частот: ломаная ( х1 ; п1 )...( хk ; nk )
Полигон относительных частот: ( х1; 1 )...( хk ; k )
Графическое изображение непрерывного
распределения
Гистограмма- ступенчатая фигура, состоящая из
прямоугольников, основаниями которых служат
частичные интервалы длиной h, а высоты равны
отношению пi -плотности частот
h
7.
1).Построить полигоны частот иотносительных частот распределения.
§2. ВЫБОРОЧНЫЙ МЕТОД
пi 100
Пример 1.
(Рис.1.)
хi
1
3
5
7
9
ni
10
15
30
33
12
хi
1
i
0,1
3
0,15
5
0,3
i 1
7
9
0,33
0,12
(Рис.2.)
8.
§2. ВЫБОРОЧНЫЙ МЕТОДПолигон частот
35
30
частоты
25
20
Ряд1
15
10
5
0
0
2
4
6
значение вариант
Рис.1
8
10
9.
Полигон относительных частот0,35
относительная частота
0,3
0,25
0,2
0,15
0,1
0,05
0
0
1
2
3
4
5
6
7
8
9
10
значение вариант
Рис.1
САМОСТОЯТЕЛЬНО!
10.
§2. ВЫБОРОЧНЫЙ МЕТОД2). Построить гистограмму частот и
относительных частот распределения.
Частичный
интервал
Сумма частот
вариант
2-5
5-8
8-11
11-14
9
10
25
6
Плотность
частот
9/3=3
10/3=3,3(3)
25/3=8,3(3)
6/3=2
Длина частичного интервала равна 3
пi
Найдем плотность частоты
h
ni 50
11.
Строим гистограмму частот§2. ВЫБОРОЧНЫЙ МЕТОД
Гистограмма частот
9
8
плотность частот
7
6
5
4
3
2
1
0
2
(2-5;3); (5-8;3,3);
(8-11;8,3); (11-14;2)
5
8
частичные интервалы
11
14
12.
§2. ВЫБОРОЧНЫЙ МЕТОДЧастичный
интервал
2-5
5-8
8-11
11-14
пi
i
n
9/50 =0,18
10/50=0,2
25/50 =0,5
6/50=0,12
Плотность отн. wi
частоты
h
0,18/3=0,06
0,2/3=0,08
0,5/3=0,16
0,12/3=0,04
Построить гистограмму
13.
§2. ВЫБОРОЧНЫЙ МЕТОДГистограмма относительных частот
плотность относительных частот
0,18
0,16
0,14
0,12
0,1
0,08
0,06
0,04
0,02
0
2
5
8
11
частичные интервалы
14
14.
§2. ВЫБОРОЧНЫЙ МЕТОДП. 4. Эмпирическая функция
распределения.
Пусть пх- число наблюдений
п- объем выборки
пх
- относительная частота
п
пх
п
- функция,
зависящая от х
эмпирическая - установленная опытным
путем
15.
ОПРЕДЕЛЕНИЕn x функция распределения
F ( x)
n выборки
*
пх-число вариант, меньших х
п-объем выборки
* Функцию распределения генеральной
совокупности называют теоретической
функцией распределения F(x)
16.
•Теоретическая функция F(x) определяетвероятность события Х<х, а эмпирическая
функция F*(x) определяет относительную
частоту этого же события .
•Если объем выборки п число большое,
то функции F(x) и F*(x) мало
отличаются друг от друга, т.е.
lim P( F ( x) F ( x) ) 1
*
n
(ε>0)
Это равенство (теорема Чебышева)
является теоретической основой
выборочного метода.
17.
ПРИМЕР:Дано распределение выборки
х-варианты
1
5
9
п-частоты
6
12
22
п=40объем
выборки
Построить эмпирическую функцию.
1). Наименьшая варианта равна 1, по свойству
функции распределения F*(x)=0 при х 1
2). Значение X<5 наблюдалось 6 раз,т.е.
6
F ( x)
40
*
1 x 5
18.
3). Значение X<9 наблюдалось 6+12=18раз,т.е.
18
*
F ( x)
40
5 x 9
4) Наибольшая варианта х=9, тогда
F*(x)=1 при x>9
0; x 1
0,15;1 x 5
*
F ( x)
0,45;5 x 9
1; x 9
19.
ПОСТРОИМ ГРАФИК ЭМПИРИЧЕСКОЙФУНКЦИИ:
1
0,45
0,15
1
5
9
20.
§3. Оценки параметров генеральнойсовокупности по ее выборке.
П.1. Х-количественный признак, х-значения
этого признака.
Х-случайная величина, х-одно из
возможных ее значений
х1;х2;…хп- значения количественного
признака, полученные в результате пнезависимых испытаний
21.
Найти оценку неизвестного параметразначит найти функцию от наблюдаемыхСВ Х1;Х2;…Хп , которая дает
приближенное значение оцениваемого
параметра
П.2.
ГЕНЕРАЛЬНАЯ И ВЫБОРОЧНАЯ
СРЕДНИЕ
Пусть изучается дискретная генеральная
совокупность объема N относительно
количественного признака Х
22.
ОПРЕДЕЛЕНИЕГенеральной средней х Г называется среднее
арифметическое значений признака
генеральной совокупности, т.е.
х1 х2 ... х N
хГ
N
Если значения х1;х2;…хk имеют соответственно
частоты N1;N2;…;Nk, причем N1+N2+…+Nk=N
х1 N1 х2 N 2 ... хk N k 1 k
хГ
xi N i
N
N i 1
23.
Так как каждый объект может бытьизвлечен с одной и той же вероятностью
1/N, то тогда генеральная средняя
хГ M ( X )
ОПРЕДЕЛЕНИЕ
Выборочной средней называется среднее
арифметическое значений признака выборочной
совокупности.
Если все значения х1;х2;…;хп признака
выборки объема п различны, то средняя
х1 х2 ... хп
выборочная равна
хВ
п
24.
Если же значения х1;х2;…хk имеютчастоты n1;n2;…nk, причем
k
1
n1+n2+…+nk=п, то х x п
В
i i
п i 1
Выборочная средняя для различных выборок
того же объема из той же генеральной
совокупности может получаться различной.
Всевозможные, получающиеся выборочные
средние есть возможные значения случайной
величины, которая называется выборочной
средней СВ
Х
-выборочная средняя
25.
Если варианты хi –большие числа, тодля облегчения вычисления выборочной
средней применяют, так называемый,
«ложный нуль»
n
n
Пусть С-const, т.к. xi ( xi C ) nC
i 1
i 1
тогда выборочная средняя вычисляется по
формуле
1 n
1 n
1 n
х В xi ( ( xi C ) nC ) С ( xi C )
п i 1
п i 1
п i 1
С-const-«ложный нуль», постоянную берут
такой, чтобы хi C были небольшими и
С по возможности было числом круглым
26.
примерх1=71,88
х2=71,93
х3=72,05
Имеется выборка
х4=72,07
х5=71,90
х6=72,02
х7=71,93
х8=71,77
х9=72,71
х10=71,96
С=72, найдем разность хi-С=αi
α1= - 0,12
α4=0,07
α7= - 0,07 α10= - 0,04
α2= - 0,07
α5= - 0,1
α8=-0,23
α3=0,05
α6=0,02
α9=0,71
Их сумма равна 0,22
i 0,02 среднее арифметическое
10
27.
Тогда выборочная средняя равна72+0,02=72,02
П.3.
ГЕНЕРАЛЬНАЯ И ВЫБОРОЧНАЯ
ДИСПЕРСИЯ
ОПРЕДЕЛЕНИЕ
Генеральной дисперсией DГ называют среднее
арифметическое квадратов отклонений
значений признака Х генеральной
совокупности от генеральной средней х Г
28.
n1
D Г ( xi x Г )
N i 1
2
Генеральным средним квадратическим
отклонением (стандартом) называется
Г DГ
( Х ) - средняя квадратическая ошибка
29.
ОПРЕДЕЛЕНИЕВыборочной дисперсией называется среднее
арифметическое квадратов отклонений
наблюдаемых значений признака Х от
выборочной средней
n
1
D В ( xi x В )
п i 1
Выборочный стандарт
2
В DВ
30.
Выборочную дисперсию, рассматриваемуюкак случайную величину, будем обозначать
~2 1 n
S ( X i X )2
n i 1
X
-выборочная средняя случайная величина
n 1
~2
М (S )
DГ
n
ТЕОРЕМА
•Если варианты – большие числа,то для
вычисления используем «ложный нуль» С
n
2
1
2
D В ( xi С ) ( х В С )
п i 1
31. §4.Точность оценки, доверительная вероятность(надежность), доверительный интервал
• Точечной называютоценку, которая
определяется одним
числом
• При выборке малого
объема точечная оценка
значительно отличается
от оцениваемого
параметра
• Интервальной называют
оценку, которая
определяется двумя
числами, концами
интервала
• Интервальные оценки
позволяют установить
точность и надежность
оценки
32. Интервальные оценки
• Статистическая характеристика θ*, найденнаяпо данным выборки, служит оценкой
неизвестного параметра θ
• Пусть θ –постоянное число или случайная
величина
• Чем меньше модуль разности * , тем
точнее θ * определяет θ
• Пусть * ,при δ>0. Чем меньше δ, тем
оценка точнее, т.е. δ характеризует точность
оценки
33. Интервальные оценки
• Доверительной• (θ *-δ; θ *+δ)
вероятностью или
интервал
надежностью оценки
доверительный
θ по θ * называют
• Он покрывает
вероятность γ, с
неизвестный
которой
параметр с заданной
осуществляется
надежностью γ
неравенство
*
34. §5.Характеристики вариационного ряда
• Модой М называют варианту, котораяимеет наибольшую частоту.
0
Например имеется ряд вида:
варианта
1
4
7
9
частота
5
1
20
6
М0=7
35. Характеристики вариационного ряда
• Медианой те называют варианту, котораяделит вариационный ряд на две части ,
равные по числу вариант. Если число вариант
нечетно, т.е. n=2k+1, то те=xk+1, при четном
n=2k медиана
x k x k 1
me
2
• Размахом варьирования R называют разность
между наибольшей и наименьшей вариантами
R=xmax-xmin.
Размах является простейшей
характеристикой вариационного ряда.
36. Характеристики вариационного ряда
• Средним абсолютным отклонениемθ (тэта) называют среднее арифметическое
абсолютных отклонений
n x x
n
i
i
в
i
Среднее абсолютное отклонение служит
для характеристики рассеяния вариационного
ряда
37. Пусть дан вариационный ряд
xini
1
4
3
10
6
5
16
1
4 1 10 3 5 6 1 16 80
xi
4
4 10 5 1
20
4 1 4 10 3 4 5 6 4 1 16 4
2,2
4 10 5 1
Среднее абсолютное отклонение
38. Характеристики вариационного ряда
• Коэффициентом вариации V называют выраженное в процентахотношение выборочного среднего квадратического отношения
к выборочной средней
V
в
xв
100%
Коэффициент вариации служит для сравнения величин
рассеяния по отношению к выборочной средней двух
вариационных рядов: тот из рядов имеет большее рассеяние по
отношению к выборочной средней, у которого коэффициент
вариации больше.
• Коэффициент вариации- безразмерная величина, поэтому он
пригоден для сравнения рассеяний вариационных рядов,
варианты которых имеют различную размерность, например,
если варианты одного ряда выражены в сантиметрах, а другогов граммах.
39.
• Если вариационный ряд составлен поданным выборки, то все описанные
характеристики называют
выборочными.
• Если вариационный ряд составлен по
данным генеральной совокупности, то
характеристики называют
генеральными
40. §6.Методы расчета сводных характеристик выборки
uixi C
h
§6.Методы расчета сводных характеристик
выборки
П.1. Условные варианты
Пусть варианты выборки расположены в
возрастающем порядке, т.е. в виде вариационного
ряда.
Равноотстоящими называют варианты, которые
образуют арифметическую прогрессию с разность h
Условными называют варианты, определяемые
равенством
xi C
ui
h
где С- ложный нуль, h- шаг, т.е. разность между любыми двумя
соседними первоначальными вариантами.
41.
• Упрощенные методы расчета сводных характеристиквыборки основаны на замене первоначальных
вариант условными.
• Если вариационный ряд состоит из равноотстоящих
вариант с h- шагом, то условные варианты есть
целые числа
• Выберем в качестве ложного нуля произвольную
варианту, например хт, тогда условная варианта
xi xm x1 (i 1)h x1 (m 1)h
ui
i m
h
h
• т.к. i и m целые числа, то и их разность есть целое
число
42.
Замечание 1. В качестве ложного нуля можно взятьлюбую варианту. Максимальная простота
вычислений достигается, если в качестве ложного
нуля выбрать варианту, которая расположена
приблизительно в середине вариационного ряда
(часто такая варианта имеет наибольшую частоту)
Замечание 2. Варианте, которая принята в качестве
ложного нуля, соответствует условная варианта
равная нулю.
43. П.2.Обычные начальные и центральные эмпирические моменты
• Обычным эмпирическим моментом порядка kназывают среднее значение k-х степеней
разностей xi-C
M k*
k
n
(
x
C
)
i i
n
хi-наблюдаемая варианта, С- ложный нуль, пi-частота
варианты, п- объем выборки
44.
• Начальнымэмпирическим
моментом порядка k
называется обычный
момент порядка k при
С=0
• Начальный
эмпирический момент
первого порядка равен
выборочной средней
Mk
M1
k
n
(
x
)
i i
n
nx
i i
n
xв
45.
• Центральным эмпирическимk
n
(
x
x
)
моментом порядка k
i i в
mk
называется обычный момент
n
порядка k при С= xв
2
• Центральный эмпирический
n
(
x
x
)
i i в D
момент второго порядка равен m2
в
n
выборочной дисперсии
• Выразим центральные
*
* 2
m
M
(M
2
2
1)
моменты через обычные
m3 M 3* 3M 2* M 1* 2( M 1* ) 3
m4 M 4* 4 M 3* M 1* 6 M 2* ( M 1* ) 2 3( M 1* ) 4
46. П.3. Условные эмпирические моменты. Отыскание центральных моментов по условным
• Для упрощения расчетов первоначальные вариантызаменяем условными
• Условным эмпирическим моментом порядка k
называется начальный момент порядка k,
вычисленный для условных вариант
xi C
n
i
h
M k*
n
k
при k =1
xi C
n
i
1 ni xi
h
*
M1
C
n
h n
n 1 x
i
n
h
в
С
47. Для того, чтобы найти выборочную среднюю, необходимо условный момент первого порядка умножить на шаги к результату прибавить ложный нуль
xв M h C*
1
Найдя таким образом обычные моменты можно
получить центральные, в итоге получаем удобные для
вычислений формулы, выражающие центральные
моменты через условные
m2 (M 2* (M1* ) 2 )h 2
m3 ( M 3* 3M 2* M 1* 2( M 1* )3 )h 3
m4 ( M 4* 4M 3* M 1* 6M 2* ( M 1* ) 2 3( M 1* ) 4 )h 4
48.
• В соответствии спредыдущими
формулами получим
формулу для
вычисления
*
* 2
2
D
M
(
M
)
h
в
2
1
выборочной
дисперсии по
условным моментам
первого и второго
порядков
49. Метод произведений для вычисления выборочной средней и выборочной дисперсии
П. 4• Метод произведений –это удобный способ для вычисления
условных моментов вариационного ряда с равноотстоящими
вариантами. Зная условные моменты, найдем начальные и
центральные моменты и соответственно выборочную среднюю
и выборочную дисперсию
• Этот метод удобнее оформлять в таблицу
Выборочн
ые
варианты в
возрастаю
щем
порядке
Частоты
вариант
…
…
Условные
варианты
ui
ni n
…
xi C
h
Частоты
умножают
на
варианты
ni ui
2
ni (ui 1) 2
ni ui
…
niui
…
n u
i i
2
…
n (u 1)
i
i
2
50.
Заполняя третий столбец,
варианту с большей частотой
или варианту, находящуюся
примерно в середине
вариационного ряда берут за
0, в клетках над ним берут -1,2,-3…, под ним 1,2,3…и т.д.
После заполнения расчетной
таблицы вычисляются
условные моменты и затем выборочные средние и
выборочная дисперсия:
4
1
M1
nx
i i
n
2
M
*
2
nx
2
i i
n
*
x
M
3 в
1h C
Dв M 2* ( M 1* ) 2 h 2
51.
П.5.Построение нормальной кривой по
опытным данным
• Находим xв ; в , например по методу
произведений
• Находим ординаты (выравнивающие частоты)
теоретической кривой по формуле
nh
где п- сумма наблюдаемых
yi
(ui )
в
частот, h- разность между двумя соседними
вариантами, значения выборочных средних равны
ui
xi х в
в
(u )
1
е
2
и2
2
52.
• Строим точки с координатами (хi;уi) впрямоугольной системе координат и
соединяем их плавной кривой
• Близость выравнивающих частот к
наблюдаемым подтверждает правильность
допущения о том, что обследуемый признак
распределен нормально
53.
Построить нормальную кривую по данному распределенияхi
15
20
25
30
40
45
50
55
пi
6
13
38
74 106 85
30
10
4
35
Пользуясь методом произведений получим
в 7.38
Найдем выравнивающие частоты
xв 34.7
54.
хi15
20
25
30
35
40
45
50
55
пi
6
13
38
74
106
85
30
10
4
366
xi х в
nh
xi xв ui
y
(ui )
(ui ) i
в
в
-19.7
-14.7
-9.7
-4.7
0.3
5.3
10.3
15.3
20.3
-2.67
-1.99
-1.31
-0.63
0.05
0.73
1.41
2.09
2.77
0.0113
0.0551
0.1691
0.3271
0.3984
0.3056
0.1476
0.0449
0.0086
3
14
42
82
99
76
37
11
2
366
55.
нормальная кривая и полигон частот120
100
80
Ряд1
60
Ряд2
40
20
0
15
20
25
30
35
40
45
50
55
Для того, чтобы более уверенно считать, что данные
наблюдений свидетельствуют о нормальном
распределении признака, пользуются специальными
правилами – критериями согласия (рассмотреть
самостоятельно!)