Similar presentations:
Основы математической обработки информации. Вариационные ряды и их характеристики. (Лекция 1)
1. ОСНОВЫ МАТЕМАТИЧЕСКОЙ ОБРАБОТКИ ИНФОРМАЦИИ
2. Целью дисциплины является:
формирование знаний основ классических методовматематической обработки информации; навыков
применения математического аппарата обработки
данных теоретического и экспериментального
исследования при решении профессиональных задач
3. Задачи дисциплины:
формирование системы знаний и умений, связанныхс представлением информации с помощью
математических средств;
актуализация межпредметных знаний,
способствующих пониманию особенностей
представления и обработки информации средствами
математики;
ознакомление с основными математическими
моделями и типичными для соответствующей
предметной области задачами их использования;
формирование системы математических знаний и
умений, необходимых для понимания основ процесса
математического моделирования и статистической
обработки информации в профессиональной области.
4. Литература:
1.2.
3.
Ермолаев, О. Ю. Математическая
статистика для психологов– М.:
Московский психолого-социальный
институт : Флинта, 2006.
Кремер, Н. Ш. Теория вероятностей и
математическая статистика. Учебник для
вузов - М. : ЮНИТИ-ДАНА, 2006.
Письменный, Д. Т. Конспект лекций по
теории вероятностей, математической
статистике и случайным процессам - М. :
Айрис-пресс, 2008
5.
«Зрелость науки обычно измеряется тем,в какой мере она использует математику.»
(С.С. Стивенс, книга «Экспериментальная психология»)
6.
Количественныйанализ
результатов
исследования
занимает
важное
место
в
профессиональной
деятельности
педагогаисследователя, практического психолога, имеет
свои границы и осуществляется с помощью
определенной группы математико-статистических
методов.
7.
Данные, полученные в результатепсихологического исследования, не имеют
практического значения без дополнительного
математико - статистического анализа,
ограничены в возможности осмысления и
интерпретации.
Математические методы обеспечивают
познавательную
потребность специалиста.
Описание каких-либо психологических
явлений при помощи математических методов –
это мощное средство их обобщения,
способствующее теоретизации психологии как
науки.
8.
Правильное применение статистики позволяет ученому:1) доказывать правильность и обоснованность
используемых методических приемов и методов;
2) строго обосновывать экспериментальные планы;
3) обобщать данные эксперимента;
4) находить зависимости между экспериментальными
данными;
5) выявлять наличие существенных различий между
группами испытуемых (например,
экспериментальными и контрольными);
6) строить статистические предсказания;
7) избегать логических и содержательных ошибок и
многое другое.
9. Схема:
ИССЛЕДОВАТЕЛЬПРЕДМЕТ ИССЛЕДОВАНИЯ (психические свойства, процессы,
функции)
ИСПЫТУЕМЫЙ (группа испытуемых)
ЭКСПЕРИМЕНТ(измерение)
ДАННЫЕ ЭКСПЕРИМЕНТА( числовые коды)
СТАТИСТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ ЭКСПЕРИМЕНТА
Результат статистической обработки эксперимента
ВЫВОДЫ (печатный текст: отчет, статья, …)
ПОЛУЧАТЕЛЬ НАУЧНОЙ ИНФОРМАЦИИ (руководитель , заказчик)
10.
Тема лекции:Вариационные ряды и их
характеристики
§1. Основные понятия
11.
Обычнополученные
в
результате
наблюдений данные представляют собой
набор чисел. Просматривая этот набор, как
правило,
трудно
выявить
какую-либо
закономерность.
Поэтому
данные
подвергаются
некоторой
первичной
обработке,
целью
которой
является
упрощение дальнейшего анализа.
12. Ряды распределения
Рядом распределения называетсяупорядоченное распределение единиц
совокупности на группы по какому-либо
варьирующему признаку
13. Ряды распределения
Распределение может быть попризнакам, не имеющим количественной
меры (атрибутивным), и по признакам, в
которых изменяется их количественная
мера
14. Ряды распределения
Ряды распределения единиц совокупностипо признакам, имеющим количественное
выражение, называются вариационными
рядами
15. Элементы вариационного ряда:
Варианты
• Частоты
16.
Предположим, что изучается некотораяслучайная величина Х (некоторый признак).
С этой целью производится ряд
независимых опытов или наблюдений, в
каждом из которых величина Х принимает то
или иное значение.
Совокупность полученных значений
(1)
x1 , x2 , ... , xn
(некоторые значения могут совпадать)
называется выборкой .
17.
Определение. Различные значенияпризнака, наблюдающиеся у членов
совокупности, называются вариантами, а
числа, показывающие, сколько раз
встречается каждый вариант – их
частотами.
18. Частость –
относительное выражение частоты,представляет собой отношение частоты к
сумме частот.
Может выражаться в процентах:
ni
wi
ni
19.
Определение. Дискретнымвариационным рядом называется
ранжированный в порядке возрастания
или убывания ряд вариантов с
соответствующими им частотами или
частостями.
20. Дискретный вариационный ряд
Вариантаx1
x2
Частота
варианты
n1
n2
Относительная
частота
варианты
(частость)
n1
n2
w1
w2
n
n
…
…
…
xm
nm
nm
wm
n
21.
Пример 1. 20 студентов на экзамене попсихологии получили такие оценки (по
пятибалльной системе): 5, 4, 4, 3, 3, 5, 2, 3,
4, 3, 3, 4, 4, 4, 3, 5, 4, 4, 3 ,5. Составить
дискретный вариационный ряд, а также
статистическое распределение выборки.
22. Дискретный вариационный ряд:
Варианта2
3
4
5
Частота
варианты
1
7
8
4
23. Статистическое распределение выборки:
Варианта2
3
4
5
Частота
варианты
1
7
8
4
Относительная
частота варианты
(частость)
1/20 7/20 8/20
4/20
24. Накопленная (кумулятивная) частота –
какое число единиц совокупности имеетвеличину варианты не большую данной:
нак
i 1
n
n
нак
i
ni 1 ,
где niнак – накопленная частота варианты xi ,
– частота варианты
.
ni 1
xi 1
нак
1
Заметим, что n
n1 .
25.
Варианта2
3
4
5
Частота
варианты
1
7
8
4
1
8
16
20
Накопленная
(кумулятивная)
частота
26.
Если число различных значений признака(с.в. Х) в выборке велико, или признак
является непрерывным (т.е. с.в. Х может
принять любое значение в некотором
интервале), составляют интервальный
статистический ряд.
27.
Если весь промежуток изменения значенийвыборки, от минимального до
максимального, разбить на интервалы, а
затем подсчитать число значений из
выборки, попадающих в каждый интервал
(частоты), а затем – относительные частоты,
то в результате получим интервальную
таблицу частот, называемую
интервальным статистическим рядом.
28. Интервальный статистический ряд
[ x1 ; x 2 ) [ x ; x )2
n1
n1
w1
n
[ xm ; xm 1]
3
…
n2
…
nm
…
nm
wm
n
n2
w2
n
29.
Пример 2. По результатам измеренийполучена выборка. Постройте интервальный
статистический ряд
6,8
9,5
11,5
9,7
8,2
12,0 6,6 8,8
9,4 11,4 11,1
12,6 7,0 8,2
9,9
8,4 7,9
9,0 13,5 9,6
12,5
7,1
8,4
10,6
13,8
10,7
13,3
11,3
9,1
13,4
13,5
11,9
13,7
10,4
11,7
10,6 10,8
7,3
9,3
9,7 11,3
8,5
6,9
11,5 7,8
8,7
10,4
10,1
8,0
9,4
Разобьем промежуток изменения выборки на 7
интервалов и подсчитаем, сколько чисел из выборки
принадлежит каждому интервалу - частоты интервалов
ni
30.
ИнтервалыЧастота
интервала
Относительная
частота интервала
ni
wi
Накопленная
частота интервала
ni (нак)
[6,0 ; 7,2)
5
0,1
5
[7,2 ; 8,4)
6
0,12
11
[8,4 ; 9,6)
11
0,22
22
[9,6 ; 10,8)
11
0,22
33
[10,8 ; 12,0)
8
0,16
41
[12,0 ; 13,2)
3
0,06
44
[13,2 ; 14,4)
6
0,12
50
ni = 50
wi =1
31. Вопросы:
Сколько должно быть интервалов?Какова длина каждого интервала?
Как определить границы интервалов?
Ответ на поставленные вопросы получим на
практических занятиях!
32. Графическое изображение вариационных рядов
33. Полигон (греч. – «многоугольник»)
применяется для изображения какдискретных, так и интервальных рядов
(если предварительно привести его к
дискретному).
При этом по оси абсцисс
откладываются варианты, а по оси
ординат – частоты или частости
34. Пример полигона для вариационного ряда
Время, мин3
5
10
15
20
30
40
Частота
2
1
7
8
2
8
2
35. Таблица 1. Распределение рабочих по числу обслуживаемых станков
Число станков,обслуживаемых одним
рабочим (х)
Число рабочих (n)
1
10
2
37
3
43
4
34
5
16
Итого:
140
36. Полигон
37. Построен полигон частот появления гласных в отрывке повести А.С. Пушкина «Медный всадник»:
38. Гистограмма
Применяется для изображения толькоинтервальных вариационных рядов и
представляет собой ступенчатую фигуру из
прямоугольников с основаниями, равными
интервалам значений признака и высотами,
равными частотам (частостям) интервалов.
При этом по оси абсцисс откладываются
интервалы, а по оси ординат – частоты (или
частости) в случае равенства интервалов,
или плотности распределения частот (или
частостей) в случае неравенства интервалов.
39. Таблица 2. Распределение рабочих по выработке
Выработка, м (x)Число рабочих (n)
до 200
200 – 220
3
12
220 – 240
240 – 260
50
56
260 – 280
280 – 300
47
23
300 – 320
свыше 320
7
2
Итого:
200
40. Гистограмма
41. Кумулята
Кумулятивная кривая (кумулята) –кривая накопленных частот (частостей).
Для дискретного вариационного ряда
кумулята представляет ломаную,
нак
(
х
;
п
)
соединяющую точки
i
i
или ( хi ; wiнак ).
42. Кумулята
Для интервального вариационного рядаломаная начинается с точки ( xнач ; 0).
Абсциссы других точек этой ломаной
соответствуют концам интервалов,
ординаты – накопленным частотам этих
интервалов.
43. Кумулята
44. Числовые характеристики вариационного ряда:
Средние величины• Показатели вариации
45. Средние величины
Средние величины характеризуют значениепризнака, вокруг которого концентрируются
наблюдения или, как говорят, центральную
тенденцию распределения.
К ним относят: среднюю арифметическую
вариационного ряда,
моду и медиану.
46.
Средней арифметической вариационного ряданазывается сумма произведений всех вариантов на
соответствующие частоты, деленная на сумму частот:
m
х
x n
i 1
i
n
i
,
где xi - варианты дискретного ряда или середины
интервалов интервального вариационного ряда;
ni - соответствующие им частоты; т – число
неповторяющихся вариантов или число интервалов.
47.
Мода Mo - это значение, котороевстречается в выборке наиболее часто.
48.
Медиана Me - это значение, котороеделит упорядоченное множество данных
пополам.
Медиана может быть приближенно
найдена с помощью кумуляты как
значение признака, для которого
п
нак
х
п
2
49. Показатели вариации
Дисперсией вариационного ряданазывается средняя арифметическая
квадратов отклонений вариантов от их
средней арифметической:
x
m
s
2
i 1
i
2
x ni
n
Среднее квадратическое отклонение s
- арифметическое значение корня
квадратного из дисперсии.