2.44M
Category: mathematicsmathematics

Основы теории вероятностей и математической статистики. Часть 1

1.

Основы теории
вероятностей и
математической статистики.
Часть 1

2.

ОГЛАВЛЕНИЕ:
• Данные и ряды данных.
• Упорядочение данных, таблица распределения.

3.

Данные и ряды данных.

4.

Статистика — это точная наука, изучающая методы
сбора, анализа и обработки данных, которые
описывают массовые действия, явления и процессы
Математическая статистика – это раздел
математики, изучающий методы сбора,
систематизации и обработки результатов
наблюдений случайных массовых явлений с целью
выявления существующих закономерностей.

5.

Статистика изучает:
• численность отдельных групп населения страны и ее
регионов,
• производство и потребление разнообразных видов
продукции,
• перевозку грузов и пассажиров различными видами
транспорта,
• природные ресурсы и многое другое.

6.

Результаты статистических исследований широко
используются для практических и научных выводов.
В настоящее время статистика начинает изучаться уже в
средней школе, в ВУЗах это обязательный предмет, потому
что связан со многими науками и отраслями.
Чтобы увеличить количество продаж в магазине, чтобы
улучшить качество знаний в школе, чтобы двигать страну
по экономическому росту, надо проводить статистические
исследования и делать соответствующие выводы. И это
должен уметь каждый.

7.

Содержание:
• Ряд данных
• Объем ряда данных
• Размах ряда данных
• Мода ряда данных
• Медиана ряда
• Среднее арифметическое

8.

• Ряд данных – это ряд результатов каких-либо
измерений.
Например:
1) измерения роста человека;
2) Измерения веса человека (животного);
3)Показания счетчика (электроэнергии, воды,
тепла…);
4) Результаты в беге на стометровку
И т.д.

9.

• Устно решите
уравнения:
1) 2x = –4;
2) 4x = 25 – x;
3) 17 + x = 8;
4) 3 (x + 2) – 2 = x;
5) 3 – x = 4 – (1 – 3x);
6) 16 –x = 2x + 1;
7) –4x – 8 = 0;
8) 12x – 11 = –11(x + 1);
9) 1–x = 6 – 2x;
10)– 2 – (3 – x) = – 7.

10.

Результат : РЯД
a) – 2, 5, – 9, – 2, 0, 5, – 2, 0, 5, – 2 .

11.

Объемом ряда данных называется количество всех
данных.
Например: дан ряд чисел
2; –3; 7; -9; 10; 5
объём его будет равен 6. Почему?

12.

Результат : Объем
б) Объем ряда : 10

13.

Разность между наибольшим и наименьшим числом называется
размахом набора чисел.
Таблица 6. Производство пшеницы в России в 1995-2001 гг.
Год
1995 1996 1997 1998 1999 2000 2001
Млн.тонн
30,1
34,9
44,3
27,0
31,0
34,5
47,0
Размах показывает, насколько велико
рассеивание значений в числовом наборе.

14.

Размах – это разность между наибольшим и
наименьшим числами из ряда данных.
Например: если дан ряд чисел
2; 5; 0; -3; 9; 12, то размах этого ряда данных
будет равен 15 (т.к. 12 – ( – 3) = 15)

15.

Результат : Размах
в) Размах : 14

16.

• Модой ряда данных называется число
ряда, которое встречается в этом ряду
наиболее часто.
• (Если таких элементов нет, то моды у
данного ряда нет)
Ряд чисел может иметь более одной моды или
не иметь моды совсем.

17.

Например, в ряду чисел
47, 46, 50, 52, 47, 52, 49, 45, 43, 53
две моды – это числа 47 и 52,
а в ряду чисел 69, 68, 66, 80, 67, 65, 71, 74, 63, 73, 72 моды нет.
Моду ряда данных обычно находят тогда, когда хотят выявить некоторый
типичный показатель. Например, если изучаются данные о размерах
мужских сорочек, проданных в определенный день в универмаге, то удобно
воспользоваться таким показателем, как мода, который характеризует
размер, пользующийся наибольшим спросом. Находить в этом случае среднее
арифметическое не имеет смысла. Мода является наиболее приемлемым
показателем при выявлении, например, расфасовки некоторого товара,
которой отдают предпочтение покупатели; цены на товар данного вида,
наиболее распространенной на рынке, и т. п.

18.

Результат : МОДА
г) Мода : – 2 .

19.

• Медиана с нечётным числом членов – это число,
записанное посередине.
• Медиана с чётным числом членов - это среднее
арифметическое двух чисел, записанных посередине.
Например: определить медиану ряда чисел
1) 7; -3; 9; -2; -3; 8; 9; -2; 3. Ответ: -3
2) -10; 10; 8; 1; -1; 10;9; -1. Ответ: 0

20.

Чему равна медиана ряда?
Так как объем нашего ряда число четное, то
медиана :
(0 + 5) : 2 = 2,5.

21.

• Среднее арифметическое - это частное от деления
суммы чисел ряда на их количество.
Например: дан ряд чисел
-1; 0; 2; 1; -1; 0; 2; -1.
Тогда среднее арифметическое будет равно:
(-1+0+2+1+(-1)+0+2+(-1)):8 =2:8=0,25

22.

Среднее арифметическое ряда?
(– 2 + 5 + (– 9) +(– 2) + 0 + 5 + (– 2)
+ 0 + 5 + (– 2)): 10 = –2 : 10 = – 0,2
Среднее арифметическое ряда : – 0,2

23.

ПРАКТИЧЕСКАЯ РАБОТА
Задание: охарактеризовать успеваемость ученика Иванова по
математике за четвертую четверть.
ВЫПОЛНЕНИЕ РАБОТЫ:
1.Сбор информации:
Выписаны оценки из журнала: 5,4,5,3,3,5,4,4,4.
2.Обработка полученных данных:
объём = 9
размах = 5 - 3 = 2
мода = 4
медиана = 3
среднее арифметическое =(5+4+5+3+3+5+4+4+4) : 9 ≈ 4
Характеристика успеваемости: ученик не всегда готов к уроку.
В основном учится на «4». За четверть выходит «4».

24.

Самостоятельно:
Надо найти объём ряда, размах ряда, моду, медиану
и среднее арифметическое:
1. 24,5; 27; 21,5; 24; 27.
2. 6; -4; 5; -2; -3; 3; 3; -2; 3.
3. 12,5; 12; 12; 12,5; 13; 12,5; 13.
4. -1; 0; 2; 1; -1; 0; 2; -1.
5. 125; 130; 124; 131.
6. 120; 100; 110.

25.

1.
Проверим
объём ряда = 5
размах ряда = 5,5
2.
мода = 27
объём ряда = 9
медиана = 21,5
размах ряда = 10
среднее арифметическое = 24,8
мода = 3
3.
медиана = -3
объём ряда = 7
среднее арифметическое = 1
размах ряда = 0,5
мода = 12,5
медиана = 12,5
среднее арифметическое = 12,5

26.

4.
Проверим
объём ряда = 8
размах ряда = 3
6.
мода = -1
объём ряда = 3
медиана = 0
размах ряда = 20
среднее арифметическое = 0,25
мода = нет
5.
медиана = 100
объём ряда = 4
среднее арифметическое = 110
размах ряда = 7
мода = нет
медиана = 127
среднее арифметическое =127,5

27.

Упорядочение данных,
таблица распределения.

28.

Содержание
• Упорядоченные ряды данных
• Таблица распределения данных
• Номинативный ряд данных
• Частота результата
• Процентная частота
• Группировка данных
• Способы обработки данных

29.

Упорядоченными рядами данных называются ряды, в
которых данные расположены по какому то правилу
Как упорядочить ряд чисел?
• Записать числа так, чтобы каждое последующее число
было не меньше (не больше) предыдущего);
• записать некоторые названия «по алфавиту»…
Причем сами данные в ряду данных не изменяются , а
изменяется только порядок их следования

30.

Выполни задание
Дан ряд чисел:
-1;-3;-3;-2;3;3;2;0;3;3;-3;-3;1;1;-3;-1
Упорядочить его по возрастанию чисел.
Решение:
-3;-3;-3;-3;-3;-2;-1;-1;0;1;1;2;3;3;3;3
Получился упорядоченный ряд.
Сами данные в нем не изменились, изменился только порядок
их следования.

31.

Нечисловые ряды данных.

32.

Номинативный ряд данных – это НЕ ЧИСЛОВЫЕ
ДАННЫЕ, а например, имена; названия;
номинации…
Например: список финалистов чемпионатов мира
по футболу с 1930 года: Аргентина, Чехословакия,
Венгрия, Бразилия, Венгрия, Швеция, Чехословакия,
ФРГ, Италия, Нидерланды, Нидерланды, ФРГ, ФРГ,
Аргентина, Италия, Бразилия, Германия, Франция

33.

Выполни задание:
Найти из предыдущего примера:
1) объём ряда
2) моду ряда
3) составьте таблицу распределения
Решение: объём =18; мода – немецкая команда.

34.

Вероятность случайного события равна
дроби, в знаменателе которой содержится
число всех равновероятных
возможностей, из которых состоит
достоверное событие, а в числителе –
число тех возможностей, при которых
рассматриваемое событие происходит

35.

Работа с таблицами
распределения.

36.

Таблица распределения данных – это таблица упорядоченного
ряда, в котором вместо повторений одного и того же числа
записывается количество повторений.
И наоборот, если известна таблица распределения, то можно
составить упорядоченный ряд данных.
Например:
Результат измерения
-3
-1
5
7
8
Сколько раз встречается в ряде данных
3
4
2
1
5
Из нее получается такой упорядоченный ряд:
-3;-3;-3;-1;-1;-1;-1;5;5;7;8;8;8;8;8

37.

Выполни задание:
В женском обувном магазине провели статистические исследования и составили
соответствующую таблицу по цене обуви и количества продаж:
Цена (руб.): 500 1200 1500 1800 2000 2500
Количество: 8
9
14
15
3
1
Для данных показателей надо найти статистические характеристики:
• составить упорядоченный ряд данных
• объем ряда данных
• размах ряда
• моду ряда
• медиану ряда
• среднее арифметическое ряда данных

38.

И ответить на следующие вопросы:
• Из данных ценовых категорий, обувь за какую цену
не следует продавать магазину?
• Обувь, по какой цене следует распространять?
• К какой цене лучше стремиться?

39.

Подведём итоги:
Мы познакомились с начальными понятиями того, как
происходит статистическая обработка данных:
1) данные всегда являются результатом какого-либо
измерения
2) у ряда некоторых данных можно найти:
объём, размах, моду, медиану и среднее арифметическое
3) любой ряд данных можно упорядочить и составить
таблицу распределения данных

40.

Таблицы распределения
частот.

41.

Частота результата = (сколько раз результат
встретился) : (объем данного ряда)
Например:
среди 19 данных некоторого измерения один и тот же
результат встретился 5 раз.
Значит частота данного результата равна 5:19

42.

• Если в таблицу распределения добавить еще одну строку, содержащую
значения частот, получим таблицу распределения частот.
Результат измерения
Сколько раз встречается в ряде данных
Частота
-3
3
1/5
-1
4
4/15
5
7
8
2
1
5
2/15 1/15 1/3

43.

Теорема.
• У любого ряда сумма частот всех
данных равна единице.

44.

• Доказательство:
• Проведем его для ряда в котором 4 разных результата
Результат
Сколько раз встретился
a
k
b
m
c
n
Частота
k/v
m/v n/v
d
s
Всего: 4
Сумма:
v=k+m+n+s
s/v
Сумма: ?
• Найдем сумму всех частот: k/v+m/v+n/v+s/v =
(k+m+n+s)/v= v/v=1
• Теорема доказана.

45.

Процентные частоты.

46.

Процентная частота = (частота · 100% )
Например:
если частота результата равна 5:19 = 0,263157…, то
процентная частота будет равна: 0,263 · 100 = 26,3%
Часто ответы для процентных частот могут быть не
точными, а приближенными

47.

Группировка данных.

48.

Группировка данных – применяется когда
различных результатов измерений слишком много.
Т.е их объединяют в группы.
При группировке различных данных информация
становится менее точной.

49.

Способы обработки данных:
• Таблица
Год
обучения
1-4 кл.
5-9 кл
10-11 кл
20072008
250
254
80
20082009
253
248
78
20092010
258
240
73
1
• Диаграмма круговая
(каламбер)
2
3
4

50.

Способы обработки данных
• График
180
160
140
120
100
1 четверть
80
2 четверть
60
40
20
0
5
4
3
2
35
30
25
• Гистограмма
(столбчатая диаграмма)
20
Ряд1
Ряд2
15
10
5
0
1
2
3
4

51.

Пример обработки данных:
В финал конкурса
«Мисс факультета»
вышли 10 студенток,
за которых голосовали
90 студентов.

52.

Способы обработки данных
В таблице приведены результаты голосования за участниц с номерами
1 – 10:

53.

График:

54.

Гистограмма:

55.

Каламбер:

56.

Подведём итоги:
Мы узнали, что….:
• Номинативный ряд – это….
• Частота результата – это….
• Группировка данных – это…
• Способы обработки данных:
1) таблица
2) график
3) гистограмма (или столбчатая диаграмма)
4) каламбер (или круговая диаграмма)

57.

Среднее значение и
дисперсия.

58.

ДИСПЕРСИЯ
• Наиболее полной характеристикой разброса набора чисел
является набор отклонений от среднего арифметического. Но
когда набор чисел велик, рассматривать набор отклонений
практически неудобно. Нужно описать разнообразие чисел в
наборе одной характеристикой, одним числом.
• Размах – слишком грубая мера разброса чисел в наборе,
поскольку учитывает только два из них – наименьшее и
наибольшее. Можно попробовать взять «среднее отклонение».
Но сумма отклонений всегда равна нулю, поэтому среднее
арифметическое отклонений тоже равно нулю и его нельзя
использовать как меру разброса.

59.

• Чтобы судить о разбросе, принято складывать не сами
отклонения, а их квадраты. Квадраты отклонений
неотрицательны, поэтому сумма квадратов отклонений
зависит только от абсолютных величин отклонений, а
не от их знаков. Чем больше отклонения чисел от
среднего арифметического, тем больше будет сумма
квадратов отклонений. Для того чтобы мера разброса
чисел не зависела от их количества в наборе, в
качестве такой меры берут среднее арифметическое
квадратов отклонений. Эту величину называют
дисперсией.

60.

• Среднее арифметическое квадратов
отклонений от среднего значения
называется в статистике
дисперсией набора чисел.

61.

Пример 1.
Среднее
1. Найдем
арифмесреднее
тическое
арифмети
равно
35,5
-ческое
млн.тонн
Обратимся к
втаблице
год
производпроизводства
ства
Найдем
пшеницы
пшеницы
отклонения
(млн.тонн) в
отРоссии.
среднего
Вычислить
дисперсию.
Год
производство
1995
30,1
1996
34,9
1997
44,3
1998
27,0
1999
31,0
2000
34,5
2001
47,0
Отклонение от
среднего
Квадрат
отклонения

62.

Год
Найдем
квадраты
отклонений
Найдем
отклонения
от среднего
производство
Отклонение от
среднего
1995
30,1
-5,4
1996
34,9
-0,6
1997
44,3
8,8
1998
27,0
-8,5
1999
31,0
-4,5
2000
34,5
-1,0
2001
47,0
11,5
Квадрат
отклонения

63.

Вычислим
среднее
значение
квадратов
отклонений
Найдем
квадраты
отклонений
Год
производство
Отклонение от
среднего
Квадрат
отклонения
1995
30,1
-5,4
29,16
1996
34,9
-0,6
0,36
1997
44,3
8,8
77,44
1998
27,0
-8,5
72,25
1999
31,0
-4,5
20,25
2000
34,5
-1,0
1,00
2001
47,0
11,5
132,25

64.

• (29,16+0,36+77,44+72,25+20,25+1,00+1
32,25) :7=47,53.
• 47,53 - дисперсия

65.

Дисперсия
Пример 2.
Покажем на простом примере, как дисперсия
характеризует разброс отклонений. Возьмем два
набора чисел 1, 2, 3 и 0, 2, 4. Среднее
арифметическое значение обоих наборов равно 2. Для
обоих наборов вычислим отклонения и квадраты
отклонений и все данные занесем в таблицу 9.

66.

Дисперсия
1-й
набор
Отклонение
от среднего
Пример 2.
Квадрат
отклонения
1-й
набор
1
0
2
2
3
4
Отклонение
от среднего
Квадрат
отклонения

67.

Дисперсия
1-й
набор
Отклонение
от среднего
1
Пример 2.
Квадрат
отклонения
1-й
набор
Отклонение
от среднего
-1
0
-2
2
0
2
0
3
1
4
2
Квадрат
отклонения

68.

Дисперсия
Пример 2.
1-й
набор
Отклонение
от среднего
Квадрат
отклонения
1-й
набор
Отклонение
от среднего
Квадрат
отклонения
1
-1
1
0
-2
4
2
0
0
2
0
0
3
1
1
4
2
4

69.

Дисперсия
Пример 2.
1-й
набор
Отклонение
от среднего
Квадрат
отклонения
1-й
набор
Отклонение
от среднего
Квадрат
отклонения
1
-1
1
0
-2
4
2
0
0
2
0
0
3
1
1
4
2
4
Дисперсия первого набора:
(1 + 0 + 1): 3 =
2
3
Дисперсия второго набора:
(4 + 0 + 4): 3 =
8
2
2
3
3

70.

Дисперсия
Пример 2.
1-й
набор
Отклонение
от среднего
Квадрат
отклонения
1-й
набор
Отклонение
от среднего
Квадрат
отклонения
1
-1
1
0
-2
4
2
0
0
2
0
0
3
1
1
4
2
4
Дисперсия первого набора:
(1 + 0 + 1): 3 =
2
3
Дисперсия второго набора:
(4 + 0 + 4): 3 =
8
2
2
3
3
Числа в первом наборе расположены более кучно – ближе друг
к другу и к своему среднему, - чем числа во втором наборе.
Поэтому дисперсия первого набора меньше, чем второго.

71.

Дисперсия
Пример 3.
Континентальный климат отличается от умеренного более
резкими изменениями температуры в течение года. В
районах с континентальным климатом жаркое лето и очень
холодная зима. С помощью дисперсии различия между двумя
видами климата можно выразить количественно. Сравним
для примера изменение температур в течение года в Москве
и Киеве, где климат умеренный, с изменением температур в
Новосибирске и Хабаровске, где климат континентальный. В
таблице 10 приведены средние месячные температуры за 80
лет в Москве, Киеве, Новосибирске и Хабаровске.

72.

Дисперсия
Месяцы
Пример 3.
Москва
Киев
Новосибирск
Хабаровск
1
-9,3
-5,9
-19,0
-22,3
2
-8,6
-5,2
-17,2
-17,2
3
-3.4
-0,4
-10,7
-8,5
4
5,1
7,5
-0,1
3,1
5
12,4
14,7
10,0
11,1
6
16,7
17,8
16,3
17,4
7
18,4
19,8
18,7
21,1
8
16,6
18,7
16,0
20,0
9
10,9
13,9
9,9
13,9
10
4,4
7,5
1,5
4,7
11
-2,0
1,2
-9,7
-8,1
12
-6,8
-3,5
-16,9
-18,5
Среднее за год
4,5
6,0
-0,1
-1,4
Дисперсия
98,9
86,5
185,2
228,8

73.

Упражнения
№1 Для данных чисел вычислите среднее значение.
Составьте таблицу отклонений от среднего и квадратов
отклонений от среднего и вычислите дисперсию:
а) -1, 0, 4;
в) -3, 1, 2, 4; д) -2, -1, 1, 2, 5;
б) 2, 3, 7;
г) 2, 6, 7, 5; е) -1, -3, -2, 3, 3.

74.

Упражнения
№2. Даны два набора чисел. Отметьте их на числовой
прямой. Вычислите дисперсию каждого из этих наборов.
Дисперсия какого набора больше?
а) 2, 3, 7 и 1, 2, 3;
б) 2, 3, 4, 7 и 1, 5, 6, 8.

75.

Упражнения
№3. Даны два набора чисел. Отметьте их на
числовой прямой. Вычислите дисперсию каждого из
этих наборов. Сравните дисперсии:
а) 2, 3, 4 и 6, 7, 8;
б) 3, 5, 7, 9 и 12, 14, 16, 18.

76.

Обозначения и формулы
Числа в наборах часто приходиться обозначать буквами,
подобно тому, как это делается при решении задач на
движение. Но поскольку чисел может быть много,
использовать для каждого числа отдельную букву неудобно.
Поэтому поступают иначе: используют одну и ту же букву с
номером. Таким образом, можно рассматривать набор х1,
х2, х3, х4, х5 или у1, у2, у3, у4, у5, у6 и т.п. Номера чисел
называются индексами.

77.

Обозначения и формулы
Среднее арифметическое чисел х1, х2, х3, х4, х5 принято
обозначать через x
Например, среднее арифметическое пяти чисел запишется
так:
x1 x2 x3 x4 x5
x
5

78.

Обозначения и формулы
Отклонения от среднего значения теперь запишутся так:
x2 x ,
x1 x,
x3 x, x4 x, x5 x.
Разберем на примере набора х1, х2, х3, х4, как
записывается в символьном виде дисперсия. Дисперсия равна
среднему арифметическому квадратов отклонений этих
чисел от среднего значения. Обозначают дисперсию обысно
через S 2. Получается:
x x x x x x x x
s
.
2
2
1
2
2
2
3
4
2
4

79.

Обозначения и формулы
Упражнения
№1. Запишите с помощью букв набор чисел 17, 3, 6, 21, 15.
Чему равно значение х2 в этом наборе? Чему равно значение
х5 в этом наборе?
№2. Пусть а – некоторое число. Вычислите среднее
2
арифметическое x и дисперсию S набора чисел:
а) х1 = а +1, х2 = а +2, х3= а + 3;
а) х1 = а +2, х2 = а +3, х3= а + 7.

80.

Свойства среднего арифметического и дисперсии
Буквенные обозначения чисел в наборе и введенные
обозначения x для среднего арифметического и S 2
для дисперсии набора чисел позволяют легко записать
некоторые их свойства. Для простоты записи
сформулируем их для набора из пяти чисел. Эти правила
верны для любого количества чисел в наборе.

81.

Свойства среднего арифметического и дисперсии
Рассмотрим набор чисел х1, х2, х3, х4, х5. Пусть x - его
2
среднее арифметическое, а S - дисперсия.
Прибавим к каждому числу этого набора постоянное число а.
Получим набор
х1+а, х2+а, х3+а, х4+а, х5+а.

82.

Свойство 1.
Среднее арифметическое набора
х1+а, х2+а, х3+а, х4+а, х5+а равно x a.

83.

Свойство 2.
Дисперсия набора
х1+а, х2+а, х3+а, х4+а, х5+а равна дисперсии набора
х1, х2, х3, х4, х5.

84.

Свойство 3.
Среднее арифметическое набора ах1, ах2, ах3, ах4, ах5
равно a x.
Свойство 4.
Среднее арифметическое набора ах1, ах2, ах3, ах4, ах5
2
равна a S
2
English     Русский Rules