Similar presentations:
Математические методы в психологии
1.
МАТЕМАТИЧЕСКИЕМЕТОДЫ В ПСИХОЛОГИИ
1
2. Оглавление (для перехода к соответствующему разделу нажмите кнопку)
ВведениеПонятие генеральной совокупности и выборки
Измерения и шкалы
Формы учета результатов измерений
Числовые характеристики распределений, нормальный закон
распределения и его свойства
Общие принципы проверки статистических гипотез
Статистические критерии (непараметрические)
Статистические критерии. Примеры обработки данных в SPSS
Статистические критерии. Фильм по обработке данных в SPSS
Сравнение средних (t-критерии Стьюдента)
Одно выборочный t Стьюдента. Фильм 1 по обработке в SPSS
t-критерии -критерии Стьюдента. Фильм 2
Однофакторный дисперсионный анализ (ANOVA)
Однофакторный дисперсионный анализ (ANOVA). Фильм
Корреляционный анализ
Корреляционный анализ Фильм
3.
Исследование в любой области, в том числе и впедагогике, психологии, социологии, предполагает
получение результатов - обычно в виде чисел (Как писал
А. де Сент-Экзюпери «взрослые люди любят цифры»).
Проще говоря необходимо научиться отвечать на простой
вопрос «да» или «нет» - только что «да» или «нет».
Исследователю необходимо умение собрать,
организовать данные, обработать и проинтерпретировать
их, что невозможно без знания основ статистики,
применения математических методов и соответствующих
современных программных средств. Естественно, что
наличие современных пакетов прикладных программ,
применение которых сейчас становится нормой для
исследователя значительно упрощает и ускоряет процесс
обработки данных .
3
4.
Но любая программа обработки данных переводит одиннабор чисел в другой набор чисел. При этом предлагается
богатый набор способов такого преобразования,
замечательным образом расширяющий возможности
анализа данных. И для использования этих возможностей
психолог должен уметь:
а) организовать исследование так, чтобы его результаты
были доступны обработке в соответствии с целями и
задачами исследования;
б) правильно выбрать метод обработки с учетом
собранных эмпирических данных;
в) содержательно интерпретировать результаты
обработки.
4
5.
Эти умения не заменят ни компьютерная программа,ни математик и программист, придумавшие и
написавшие данную программу.
Таким образом, применение математики как
общенаучного метода, наряду с экспериментом,
неизбежно приобретает в психологии свои
особенности, связанные со спецификой предмета.
При этом следует исходить из того, что в широком
смысле слова рассматриваются не отдельные
«предметы», а единое информационное пространство
с учетом всех связей и зависимостей, которые на
первый взгляд не видны, или просто кажутся не весьма
не значительными.
Поэтому следует руководствоваться следующими
принципами которые приведены ниже.
6.
ЧЕЛОВЕКОВЕДЕНИЕПЕДАГОГИКА
СОЦИОЛОГИЯ
ПСИХОЛОГИЯ
Социальная
психология
Педагогическая
Психология
Единое
информационное
пространство
Социальная
педагогика
6
7.
Основные вопросы, на которыенужно уметь отвечать специалисту (любому!)
ЧТО
ГДЕ
КОГДА
КОМУ
ЗАЧЕМ
ПОЧЕМУ
ЭТО И ЕСТЬ
ОСНОВЫ СИСТЕМНО-СТРУКТУРНОГО
АНАЛИЗА
КАК
8.
Основные задачи, которые стоят перед специалистомАНАЛИЗ СИТУАЦИЙ
МОДЕЛИРОВАНИЕ
ПРОГНОЗИРОВАНИЕ
УПРАВЛЯЮЩЕЕ
ВОЗДЕЙСТВИЕ
ОСНОВНОЕ:
ФОРМИРОВАНИЕ ПРОФЕССИОНАЛЬНЫХ
КОМПЕТЕНЦИЙ
9. Соотношение обыденного и научного познания
910. Генеральная совокупность и выборка
В дальнейшем мы будем исходить из следующихположений:
Генеральная совокупность — это все множество
объектов, в отношении которого формулируется
исследовательская гипотеза. Например, студенты одного
вуза, жители одного города и т.д.
Выборка — это ограниченная по численности группа
объектов (в психологии — испытуемых, респондентов),
специально отбираемая из генеральной совокупности для
изучения ее свойств. Соответственно, изучение на выборке
свойств генеральной совокупности называется
выборочным исследованием
в отличии от сплошного.
Практически все психолого-педагогические
исследования являются выборочными, а их выводы
распространяются на генеральные совокупности при
соблюдении следующих обязательных условий:
выборка должна быть репрезентативной и
10
статистически достоверной (валидной).
11.
Репрезентативность выборки — иными словами, еепредставительность - это способность выборки
представлять изучаемые явления достаточно полно с
точки зрения их изменчивости в генеральной
совокупности.
Способы получения репрезентативной выборки
Основной прием - это простой случайный отбор или, в
настоящее время используется генератор случайных
чисел с использованием ПК.
Второй способ обеспечения репрезентативности — это
стратифицированный случайный отбор с разбиением
выборки на страты по определенному правилу.
Валидность (или достаточность) выборки.
Валидность может рассматриваться как мера
соответствия того, насколько методика и результаты
исследования соответствуют поставленным задачам, а
объем достаточен для распространения полученных
результатов на всю генеральную совокупность.
11
12.
Статистическая достоверность, или статистическаязначимость, результатов исследования определяется при
помощи методов статистического вывода которые предъявляют
определенные требования к численности, или иными словами к
объему выборки.
Зависимые и независимые выборки. Обычна ситуация
исследования, когда интересующее исследователя свойство
изучается на двух или более выборках с целью их дальнейшего
сравнения. Эти выборки могут находиться в различных
соотношениях - в зависимости от процедуры их организации.
Независимые выборки (не связанные) характеризуются тем,
что вероятность отбора любого испытуемого одной выборки не
зависит от отбора любого из испытуемых другой выборки
(например, разные классы из разных школ) .
Зависимые выборки характеризуются тем, что каждому
испытуемому одной выборки поставлен в соответствие по
определенному критерию испытуемый из другой выборки, либо
тот же испытуемый, но в сравнении с различными испытаниями.
12
13. ИЗМЕРЕНИЯ И ШКАЛЫ
Измерение в терминах производимых исследователемопераций - это приписывание объекту числа по
определенному правилу. Это правило устанавливает
соответствие между измеряемым свойством объекта и
результатом измерения - признаком.
Шкалы разделяют на метрические (если есть или
может быть установлена единица измерения) и не
метрические (если единицы измерения не могут быть
установлены). Принято использовать четыре типа шкал.
1. Номинативная шкала (неметрическая), или шкала
наименований. В ее основе лежит процедура, обычно не
ассоциируемая с измерением (присваиваемый символ не
подлежит статистической обработке).
2. Ранговая, или порядковая шкала (неметрическая),
как результат ранжирования (упорядочивания) признаков
по определенному правилу.
13
14.
3. В шкале интервалов, или интервальной шкале,каждое из возможных значений измеренных величин
отстоит от ближайшего на равном расстоянии. Главное
понятие этой шкалы — интервал, который можно
определить как долю или часть измеряемого свойства
между двумя соседними позициями на шкале.
Шкалу отношений называют также шкалой равных
отношений. Особенностью этой шкалы является
наличие твердо фиксированного нуля, который означает
полное отсутствие какого-либо свойства или признака
Шакала отношений является наиболее информативной
шкалой, допускающей любые математические операции
и использование разнообразных статистических
методов.
14
15. ФОРМЫ УЧЕТА РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ
Исходная информация может быть представлена ввиде:
– Таблиц;
– Числовых последовательностей;
– Статистических рядов;
– Графиков;
– Диаграмм.
15
16. Пример обычной таблицы Сбор информации о «праворуких» и «леворуких» учениках одной школы
ЛеворукиеСумма
Классы
Праворукие
3
23
2
25
4
20
4
24
5
22
11
33
6
22
8
30
Суммы
87
23
110
16
17.
Числовая последовательность:2; 4; 6; 6; 8; 8; 8; 9; 9; 10
Статистический ряд
Xi
2
4
6
8
9
10
fi
1
1
2
3
2
1
Pi
0,1
0,1
0,2
0,3
0,2
0,1
X i – случайная величина
f i – частота
f
Pi – вероятность.
pi i
N
где
N -объем выборки
n
N fi
i 1
17
18. Пример формирования имени признака, метки и её значений с помощью SPSS (Statistical Package for the Social Science– Статистический пакет для социальных наук)
1819.
Пример представления данных в виде таблицы в SPSS(столбец – признак, строка – респондент)
19
20. Пример таблицы сопряженности (перекрестной таблицы) Связь социального положения и психического состояния для студентов обучающихся в одн
Пример таблицы сопряженности (перекрестной таблицы)Связь социального положения и психического состояния
для студентов обучающихся в одном из университетов
Германии
Психическое состояние
Социальное
положение
Итого
Крайне
неустойчивое
Неустойчивое
Устойчивое
Очень
устойчивое
Очень
хорошее
1
2
4
4
11
Хорошее
0
4
26
2
32
Среднее
3
13
9
0
25
Удовлетворит
ельное
4
4
2
0
10
Неудовлетвор
ительное
4
15
0
0
19
Плохое
8
2
0
0
10
20
21. Столбчатая диаграмма, полученная из таблицы сопряженности (связь психического состояния и социального положения)
2122. Данные полученные после обработки таблиц сопряженности с разбиением на страты (по полу: женский и мужской)
2223. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ РАСПРЕДЕЛЕНИЙ. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ
• Числовой характеристикой выборки как правило нетребующей вычислений является так называемая
мода, такое числовое значение которое встречается
в выборке наиболее часто.
• Медиана — это значениеx которое делит
упорядоченное множество данных пополам.
• Среднее арифметическое ряда из и числовых
значений Xi…Xn обозначается Mx и подсчитывается
как:
N
i
Mx
1
N
x
i 1
i
где N – объем выборки, Xi – значение .
23
24.
Квантиль - это точка на числовой прямой, котораяделит совокупность исходных наблюдений на две части с
известными пропорциями в каждой из частей. Так.
Например, один из квантилей - это медиана, значение
признака, которое делит всю совокупность измерений на
две группы с равной численностью.
Процентили - это 99 точек — значений признака (Р1 ...,
Р99), которые делят упорядоченное (по возрастанию)
множество наблюдений на 100 частей, равных по
численности, так 50 процентиль соответствует медиане.
Меры изменчивости применяются в психологии для
численного выражения величины межиндивидуальной
вариации признака.
Очевидной мерой изменчивости является размах, это
разность максимального и минимального значений
24
25.
• Дисперсия — мера изменчивости для метрических данных,пропорциональная сумме квадратов отклонений измеренных
значений от их арифметического среднего.
Дисперсия и средеквадратичное отклонение
N
DX
( xi M x )
2
i 1
N
D (x)
Чем больше изменчивость в данных, тем больше
отклонения значений от среднего, тем больше
величина дисперсии. Величина дисперсии получается
при усреднении всех квадратов отклонений:
25
26.
Нормальное распределение играет большую роль вматематической статистике, поскольку многие
статистические методы предполагают, что,
анализируемые с их помощью экспериментальные
данные распределены нормально.
Если индивидуальная изменчивость некоторого
свойства есть следствие действия множества причин,
то распределение частот для всего многообразия
проявлений этого свойства в генеральной совокупности
соответствует кривой нормального распределения. Это
и есть закон нормального распределения.
График нормального распределения имеет вид
колоколообразной кривой, а формула для вычисления
представлена ниже:
1
f ( x)
2
( x )2
e
2 2
26
27. Стандартное нормальное распределение (μ=0,σ=1)
2728. Нормальный закон распределения. Представлены 4 кривые с различными параметрами (μ,σ)
f ( x) 1 e (2x )2
2
2
Заштрихованные области
показывают «перекрытие» кривых
(1 и 2) и (3 и 4) (с одинаковыми
значениями σ(соответственно 1 и 2)
и разницей средних - μ в 2 единицы
28
29. Пример распределения близкого к нормальному
N206
Среднее
,0073
Медиана
,0000
Мода
Стд. отклонение
,00
1,01630
Дисперсия
1,033
Минимум
-3,00
Максимум
3,00
N
207
Среднее
,0266
Медиана
,0000
Мода
Стд. отклонение
,00
1,05113
Дисперсия
1,105
Минимум
-3,00
Максимум
4,00
2
9
30.
Для отражения близости формы распределения кнормальному виду существует две основные
характеристики: асимметрия и эксцесс.
Эксцесс (kurtosis) является мерой сглаженности (остроили плосковершинности) распределения. Если значение
эксцесса близко к 0, это означает, что форма распределения
близка к нормальному виду. Положительный эксцесс
указывает на плосковершинное распределение, у которого
максимум вероятности выражен не столь ярко, как у
нормального. Значения эксцесса, превышающие 5,0, говорят
о том, что по краям распределения находится больше
значений, чем вокруг среднего. Отрицательный эксцесс,
напротив, характеризует островершинное распределение,
график которого более вытянут по вертикальной оси, чем
график нормального распределения.
Считается, что распределение с эксцессом в диапазоне
от -1 до +1 примерно соответствует нормальному виду. В
большинстве случаев вполне допустимо считать
нормальным распределение с эксцессом, по модулю не
превосходящим 2;
31.
Асимметрия (skewness) показывает, в какуюсторону относительно среднего сдвинуто
большинство значений распределения.
Нулевое значение асимметрии означает
симметричность распределения относительно
среднего значения. Положительная
асимметрия указывает на сдвиг распределения
в сторону меньших значений, а отрицательная
— в сторону больших значений. В большинстве
случаев за нормальное принимается
распределение с асимметрией, лежащей в
пределах от -1 до +1.
В исследованиях, не требующих высокой
точности результатов, нормальным считают
распределение с асимметрией, по модулю не
превосходящей 2.
32.
Асимметрия – это показатель симметричности /скошенности кривой распределения, а эксцесс
определяет ее островершинность.
При левостронней асимметрии ее показатель
является положительным и в распределении
преобладают более низкие значения признака. При
правостронней – показатель положительный и
преобладают более высокие значения. У всех
симметричных распеделений (в том числе и у
нормального распределения) величина асимметрии
равна нулю. Формула показателя асимметрии является
следующей:
33.
Если в распределении преобладают значенияблизкие к среднему арифметическому, то формируется
островершинное распределение. В этом случае
показатель эксцесса стремится к положительной
величине. У нормального распределения эксцесс равен
нулю. Если у распределения 2 вершины (бимодальное
распределение), то тогда эксцесс стремится к
отрицательной величине. Показатель эксцесса
определяется по формуле:
34.
Распределение оценивается какпредположительно близкое к нормальному, если
установлено, что от 50 до 80 % всех значений
располагаются в пределах одного стандартного
отклонения от среднего арифметического, и
коэффициент эксцесса по абсолютной величине не
превышает значения равного двум.
Распределение считается достоверно
нормальным если абсолютная величина показателей
асимметрии и эксцесса меньше их ошибок
репрезентативности в 3 и более раз.
35. Пример левосторонней и правосторонней асимметрии
36. Островершинное и плосковершинное распределение в сравнении с нормальным распределением
37. ОБЩИЕ ПРИНЦИПЫ ПРОВЕРКИ СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Под статистической гипотезой обычно понимаютформальное предположение о том, что сходство (или
различие) некоторых параметрических или
функциональных характеристик случайно или,
наоборот, неслучайно.
При проверке
статистических гипотез
используются два понятия
так называемая
нулевая - Hо (гипотеза о
совпадении) и
альтернативная гипотеза H1
(гипотеза о различии)
37
38. Уровнем значимости называется вероятность ошибочного отклонения нулевой гипотезы. Или уровень значимости это вероятность ошибки первого
рода при принятии решения38
39. Традиционная интерпретация уровней значимости при α=0.05
3940. Традиционная интерпретация уровней значимости при α=0.05 (А.Д. Наследов)
4041.
Из приведенного ниже слайда следует,что точка на оси значимости отражает
положение полученного результата
относительно двух точек:
Gтеор 0,05 и Gтеор 0,01.
Использование таблиц, рассчитанных
для конкретных критериев позволяет
ответить на вопрос об уровне значимости
анализируемого результата.
42. Общие принципы анализа результатов исследования
При использовании компьютерных методов обработки получаетсяасимптотическое значение, которое и сравнивается с указанными
выше значениями (0,05 и 0,01).
42
43. Схема - классификации статистических гипотез
Статистические гипотезыНаправленные
нулевая
альтернативная
Н0: Х1 не превышает Х2
Н1: Х1 превышает Х2
Ненаправленные
альтернативная
нулевая
Н0: Х1 не отличается от Х2
Н1: Х1 отличается Х2
,
43
44. Классификация задач, решаемых с использованием математических методов
1. Задачи, требующие установления сходстваили различия.
2. Задачи, требующие группировки и
классификации данных.
3. Задачи, ставящие целью анализ источников
вариативности получаемых психологических
признаков.
4. Задачи, предполагающие возможность
прогноза на основе имеющихся данных
44
45.
Классификация психологических задачпо методам обработки (по Е. Сидоренко)
Задачи
1. Выявление различий в уровне
исследуемого признака
2. Оценка сдвига значений
исследуемого признака
3. Выявление различий в
распределении
Условия
Методы
а) 2 выборки испытуемых
Q - критерий Розенбаума;
U - критерий Манна-Уитни
б) 3 и более выборок испытуемых S - критерий тенденций Джонкира;
Н - критерий Крускала-Уоллиса.
а) 2 замера на одной и той же
Т - критерий Вилкоксона;
выборке испытуемых
G - критерий знаков;
Угловое преобразование Фишера
2
б) 3 замера на одной и той же
χл - критерий Фридмана;
выборке испытуемых
L - критерий тенденций Пейджа.
χ2 - критерий Пирсона хи-квадрат;
а) при сопоставлении
λ - критерий Колмогорова-Смирнова;
эмпирического признака
m - биномиальный критерий.
распределения с теоретическим
λ - критерий Колмогорова-Смирнова
б) при сопоставлении двух
эмпирических распределений
φ* - критерий φ* — угловое
преобразование Фишера
4. Выявление степени
согласованности изменений
а) двух признаков
б) двух иерархий или профилей
5. Анализ изменений признака под а) под влиянием одного фактора
влиянием контролируемых
условий
б) под влиянием двух факторов
одновременно
rs - коэффициент ранговой
корреляции Спирмена.
rs - коэффициент ранговой
корреляции Спирмена.
L - критерий тенденций Пейджа;
однофакторный дисперсионный
анализ Фишера.
Двухфакторный дисперсионный
45
анализ Фишера.
46. Дополнительные возможности
6. Факторный анализ - этоодин из способов снижения
размерности, то есть
выделения во всей
совокупности признаков тех,
которые действительно
влияют на изменение
зависимой переменной.
7. Кластерный анализ
1. Подготовки ковариационной
Наличие признаков,
измеренных в абсолютной матрицы (Иногда вместо нее
используется корреляционная
шкале.
матрица);
2. Выделения первоначальных
ортогональных векторов
(основной этап);
3. Вращение с целью
получения окончательного
решения.
1. Объединение по
наблюдениям;
2. Объединение по
признакам.
46
47. СТАТИСТИЧЕСКИЕ КРИТЕРИИ
4748.
Параметрические критерииКритерии, включающие в формулу расчета
параметры распределения, то есть средние и
дисперсии (t-критерий Стьюдента, критерий Фишера и
др.).
Непараметрические критерии
Критерии, не включающие в формулу расчета
параметры распределения и основанные на
оперировании частотами или рангами (критерий знаков
– Q-критерий, критерий Фридмана, критерий
Вилкоксона и др.)
И те, и другие критерии имеют свои преимущества и
недостатки. На основании нескольких руководств
можно составить таблицу, позволяющую оценить
возможности и ограничения тех и других.
Возможности и ограничения параметрических и
непараметрических критериев
48
49.
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИПозволяют прямо оценить различия в средних, полученных в
двух выборках (t - критерий Стьюдента).
Позволяют прямо оценить различия в дисперсиях (критерий
Фишера).
Позволяют выявить тенденции изменения признака при
переходе от условия к условию (дисперсионный
однофакторный анализ), но лишь при условии предположения о
нормальном распределении признака.
Позволяют оценить взаимодействие двух и более факторов в
их влиянии на изменения признака (факторный анализ).
При этом, экспериментальные данные должны отвечать
двум, а иногда трем, условиям:
а) значения признака измерены по интервальной или
абсолютной шкале;
б) распределение признака является нормальным.
Математические расчеты без использования пакетов
прикладных программ (напр. SPSS) довольно сложны.
Если условия, перечисленные выше выполняются,
параметрические критерии оказываются несколько более
мощными, чем непараметрические.
49
50.
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ1. Позволяют оценить лишь средние тенденции,
например, ответить на вопрос, чаще ли в выборке А
встречаются более высокие, а в выборке Б - более
низкие значения признака (критерии Q, U, φ* и др.).
2.Позволяют оценить лишь различия в диапазонах
вариативности признака (критерий φ*).
3.Позволяют выявить тенденции изменения признака
при переходе от условия к условию при любом
распределении признака (критерии тенденций L и S).
50
51.
4. Экспериментальные данные могут не отвечать ниодному из этих условий:
а) значения признака могут быть представлены в
любой шкале, начиная от шкалы наименований;
б) распределение признака может быть любым и
совпадение его с каким-либо теоретическим законом
распределения
необязательно и не нуждается в проверке;
в) требование равенства дисперсий отсутствует.
5. Математические расчеты по большей части
просты и занимают мало времени (за исключением
критериев χ2 и λ).
6. Если условия, перечисленные в п.4, не
выполняются, непараметрические критерии
оказываются более мощными, чем параметрические,
так как они менее чувствительны к "засорениям".
51
52. Общие принципы анализа результатов исследования
При использовании компьютерных методов обработки получаетсяасимптотическое значение, которое и сравнивается с указанными
выше значениями (0,05 и 0,01).
52
53.
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИСвязанные
(зависимые выборки)
Не связанные
(независимые выборки)
К=2
К>2
К=2
К>2
G-знаков
Уилкоксона
МакНемара
Фридмана
МаннаУитни
КраскелаУоллиса
53
54.
• G - Критерий знаковКритерий знаков используется при проверке
нулевой гипотезы о равенстве двух непрерывно
распределенных случайных величин. Критерий
применяется к паре связанных выборок. Он не
использует никаких данных о характере
распределения, и может применяться в широком
спектре ситуаций, однако при этом он может иметь
меньшую мощность чем более
специализированные критерии.
• Т- критерий или критерий Уилкоксона
Критерий предназначен для сопоставления
показателей, измеренных в двух разных условиях
на одной и той же выборке испытуемых. Он
позволяет установить не только направленность
изменений, но и их выраженность, то есть способен
определить, является ли сдвиг показателей в одном
направлении более интенсивным, чем в другом
55.
• Критерий Мак-Немара - являетсяаналогом непараметрического критерия
Уилкоксона, применяется для анализа
связанных измерений в случае
изменения реакции с помощью
дихотомической переменной. По
результатам такого исследования
строится результирующая таблица 2x2
в виде:
56.
• Критерий Фридмана - этонепараметрический аналог
дисперсионного анализа
повторных измерений,
применяется для анализа
повторных измерений,
связанных с одним и тем же
индивидуумом. Логика
критерия очень проста.
Например, каждый испытуемый
ровно один раз подвергается
каждому методу воздействия
(или наблюдается в
фиксированные моменты
времени). Результаты
наблюдения у каждого
испытуемого
упорядочиваются.
Причем отдельно
57.
• U-критерий Манна — УитниНепараметрический критерий, используемый
для оценки различий между двумя
независимыми выборками по уровню какоголибо признака, измеренного количественно.
Позволяет выявлять различия в значении
параметра между малыми выборками.
Этот метод определяет, достаточно ли мала
зона перекрещивающихся значений между
двумя рядами (ранжированным рядом
значений параметра в первой выборке и таким
же во второй выборке). Чем меньше значение
критерия, тем вероятнее, что различия между
значениями параметра в выборках достоверны
58.
• Н - критерий Крускала-Уоллиса.Критерий предназначен для оценки различий
одновременно между тремя, четырьмя и т.д.
выборками по уровню какого-либо признака.
Критерий Н иногда рассматривается как
непараметрический аналог метода
дисперсионного однофакторного анализа для
несвязных выборок.
Критерий является продолжением критерия
U на большее, чем 2, количество
сопоставляемых выборок
59. НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ обращение к критериям через SPSS
5960. SPSS Критерий Вилкоксона
61. Критерий Вилкоксона (обработка)
62. Критерий Фридмана (исходный набор данных и обращение к критерию)
63. Результат обработки
Нулевая гипотеза подтверждена64. Критерий МакНемара
65. Различия на уровне значимости 0,05
66. Критерий Манна Уитни
• Сравнение результатов контрольнойработы двух классов. Данные
ранжированы
67. Критерий Манна Уитни, различие на уровне 0,05. Ненулевая гипотеза не подтвердилась
68. Критерий Краскала-Уоллеса. Время решения задач разными группами
69. Обработка критерия
70.
71. Т-критерий Стьюдента
Критерий t Стьюдента направлен на оценку различийвеличин средних и двух выборок X и Y, которые распределены по
нормальному закону. Одним из главных достоинств критерия
является широта его применения. Он может быть использован для
сопоставления средних у связных и несвязных выборок, причем
выборки могут быть не равны по величине.
Случай несвязных выборок
В общем случае формула для расчета по t - критерию Стьюдента
такова:
где
Рассмотрим сначала равночисленные выборки. В этом случае n1 =
n2 = n, тогда выражение будет вычисляться следующим образом:
72.
В случае неравночисленных выборок , выражениебудет вычисляться следующим образом:
В обоих случаях подсчет числа степеней свободы
осуществляется по формуле:
где n1 и n2 соответственно величины первой и второй
выборки.
Понятно, что при численном равенстве выборок k = 2
n - 2.
73.
Различные варианты обработки данных с применениемt -критерия позволяют сделать вывод о различии двух
средних значений.
Например, в случае применения t-критерия для
независимых выборок проверяется достоверность
различия двух выборок по количественной переменной,
измеренной у представителей этих двух выборок. Для
этих выборок вычисляются средние значения
количественной переменной, затем по t –критерию
определяется статистическая значимость различия
средних. Применение t -критерия, по-видимому, самый
распространенный метод статистического вывода, так как
позволяет ответить на простой вопрос: «Насколько
существенны различия между двумя выборками по
данной количественной переменной?» Основное
требование к данным для применения этого критерия —
представление переменных, по которым сравниваются
выборки, в метрических единицах измерения.
74.
T-критерий для независимых выборокпредназначен для сравнения средних значений
двух выборок. Для сравниваемых выборок
должны быть определены значения
одной и той же переменной. С помощью tкритерия для независимых выборок можно
сравнить успеваемость студентов и студенток,
степень удовлетворенности жизнью холостяков
и женатых, средний рост футболистов двух
команд и пр. Обязательным условием для
проведения этого t-критерия является
независимость выборок.
Непараметрическим аналогом t-критерия
является критерий Манна-Уитни
75.
T-критерий для парных, илизависимых, выборок позволяет сравнить
средние значения двух измерений одного
признака для одной и той же выборки,
например результаты первого и последнего
экзаменов группы студентов или значения
показателя до и после воздействия на группу.
Обязательным условием применения Tкритерия для зависимых выборок является
наличие повторного измерения для одной
выборки.
Непараметрическим аналогом t-критерия
является критерий Уилкоксона
76.
Одновыборочный t-критерийпозволяет сравнить среднее значение этой
выборки с некоторой эталонной величиной.
Например, отличается ли среднее значение
некоторого теста для данной выборки от
нормативной величины, отличается ли
время, показанное бегунами во время
соревнования, от 17 минут и т. д.
77. t-критерий Стьюдента обращение к критерию из SPSS
7778. T-критерий для независимых выборок Обработка (ex01.sav) см. А.Д. Наследов
79.
80. T-критерий для парных выборок Обработка (ex01.sav) см. А.Д. Наследов
Сравнение успеваемости по двум срезам81.
82. Значимое различие оценок 1-го и 2-го измерения
83. Одновыборочный T-критерий. Сравнение средних с эталоном (ex01.sav) см. А.Д. Наследов
84.
85.
86. T - критерий для независимых и связанных выборок
87. Дисперсионный анализ
Дисперсионный анализ (Analysis Of Variances, ANOVA —общепринятое обозначение метода) — это процедура
сравнения средних значений выборок, на основании которой
можно сделать вывод о соотношении средних значений
генеральных совокупностей.
Анализ изменчивости признака под влиянием каких-либо
контролируемых переменных факторов.
Обобщенно задача дисперсионного анализа состоит в том,
чтобы из общей вариативности признака выделить три частные
вариативности:
- Вариативность, обусловленную действием каждой из
исследуемых независимых переменных.
- Вариативность, обусловленную взаимодействием
исследуемых независимых переменных.
- Вариативность случайную, обусловленную всеми
неучтенными обстоятельствами.
87
88.
Ближайшим и более простым аналогом ANOVAявляется t-критерий.
В отличие от t-критерия дисперсионный анализ
предназначен для сравнения не двух, а нескольких
выборок. Слово «дисперсионный» в названии
указывает на то, что в процессе анализа
сопоставляются компоненты дисперсии изучаемой
переменной. Общая изменчивость переменной
раскладывается на две составляющие: межгрупповую
(факторную), обусловленную различием групп (средних
значений), и внутригрупповую (ошибки), обусловленную
случайными (неучтенными) причинами. Чем больше
частное от деления межгрупповой изменчивости на
внутригрупповую (F-отношение), тем больше
различаются средние значения сравниваемых выборок
и тем выше статистическая значимость этого различия.
89.
Вариативность, обусловленная действием исследуемыхпеременных и их взаимодействием соотносится со случайной
вариативностью. Показателем этого соотношения является
F – критерий Фишера, который используется для сравнения
дисперсий двух вариационных рядов.
s1
F
Он вычисляется по формуле:
s2
где S1 - большая дисперсия, S2- меньшая дисперсия.
Если вычисленное значение критерия F больше критического для
определенного уровня значимости и соответствующих чисел степеней
свободы для числителя и знаменателя, то дисперсии считаются
различными.
Число степеней свободы числителя и знаменателя определяется по
формуле: ni-1 (i=1;2),
•89
90.
Например, если мы выдвигаем гипотезу о зависимостиуспешности работы должностного лица от фактора Н
(социальной смелости по Кэттелу), то не исключено
обратное: социальная смелость респондента как раз и
может возникнуть (усилиться) вследствие успешности
его работы – это с одной стороны. С другой: следует
отдать себе отчет в том, как именно измерялась
«успешность»? Если за ее основу взяты были не
объективные характеристики (модные нынче «объемы
продаж» и проч.), а экспертные оценки сослуживцев, то
имеется вероятность того, что «успешность» может
быть подменена поведенческими или личностными
характеристиками (волевыми, коммуникативными,
внешними проявлениями агрессивности и .т.д.)
90
91. Исходные данные для дисперсионного анализа
92. Запуск процедуры вычислений
93.
94.
95.
96.
Множественные сравнениясчет в уме
НЗР
(I-J)-я
разнос
ть
средн
их
Стд.
Ошибк
а
-1,766
,602
,233
спорт
Нижняя
границ
а
Верхняя
границ
а
,004
-2,96
-,57
,635
,714
-1,03
1,49
1,766
,602
,004
,57
2,96
искусство
1,999
,618
,002
,77
3,23
спорт
-,233
,635
,714
-1,49
1,03
-1,999
,618
,002
-3,23
-,77
(I) хобби
J) хобби
спорт
компьютер
искусство
компьютер
искусство
95% доверительный
интервал
компьютер
Знч.
97. Зависимость счет в уме/хобби
98.
99. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Корреляция - это статистическая взаимосвязь двух илинескольких случайных величин (либо величин, которые можно
с некоторой допустимой степенью точности считать
таковыми).
При этом изменения значений одной или нескольких из этих
величин сопутствуют систематическому изменению значений
другой или других величин.
Математической мерой корреляции двух случайных
величин служит корреляционное отношение, либо
коэффициент корреляции. В случае, если изменение одной
случайной величины не ведёт к закономерному изменению
другой случайной величины, но приводит к изменению
другой статистической характеристики данной случайной
величины, то подобная связь не считается корреляционной,
хотя и является статистической.
99
100. Использование коэффициентов корреляции в зависимости от типа шкалы измерения
ТИПЫ ШКАЛПеременная X
Переменная Y
Мера связи
Интервальная Интервальная
или отношений или отношений
Коэффициент
Пирсона rху
Ранговая,
Ранговая,
интервальная интервальная
или отношений или отношений
Коэффициент
Спирмена ρху
Ранговая
Ранговая
Коэффициент "Ʈ"
Кендала
100
101.
Корреляция Пирсона, называемся так же линейнойкорреляцией. Установить прямую связь между переменными и их
абсолютными значениями стало возможно благодаря линейному
корреляционному анализу. Коэффициент Пирсона позволяет
устанавливать тесноту связей между признаками. Если связь
между признаками линейная, то коэффициент Пирсона
определяет тесноту этой связи с высокой точностью. Корреляция
Пирсона предполагает, что две рассматриваемые переменные
измерены, по крайней мере, в интервальной шкале.
Для применения коэффициента корреляции Пирсона,
необходимо соблюдать следующие условия:
• рассматриваемые переменные должны быть обязательно
получены в шкале отношений или интервальной шкале;
• распределения переменных X и Y должны быть близки к
нормальному;
• количество варьирующих признаков переменной X должно
совпадать с количеством варьирующих признаков переменной Y
101
102. Формула для вычисления коэффициента корреляции Пирсона
В случае двух переменных коэффициенткорреляции вычисляется по следующей формуле:
где
103. Корреляционный анализ в SPSS
103104. Запуск программы вычисления
104105. Результаты обработки (фрагмент)
105106.
Коэффициентом ранговой корреляции Спирмена называютнепараметрический метод, используемый при статистическом
исследовании связи между различными явлениями. Два
количественных ряда признаков имеют некоторую степень
параллелизма. Именно эта степень и определяется с целью
получения оценки тесноты установленной связи. Метод
ранговой корреляции Спирмена позволяет определять тесноту
(или силу) и направление корреляционной связи между двумя
профилями признаков или признаками. Для расчета
коэффициента ранговой корреляции Спирмена выделяют
следующие действия:
• каждому из признаков присваивается порядковый номер
(ранг). Ранг может присваиваться как по возрастанию, так и
по убыванию;
• определяется разность рангов каждой пары сопоставляемых
значений;
• каждая разность возводится в квадрат, а полученные
результаты затем суммируются
106
107. Таблица сопряженности признаков, измеренных в ранговой шкале (связь статуса преподавателя и количества публикаций в научных журналах)
РангиСтатус
преподавателя
Количество
публикаций
Профессора
S+
S-
0
3
0
-1
1
1
1
2
1
1
1
0
4
0
0
0
0
2
5
1
I - по
статусу
II - по
количеству
публикаций
d
150
1
1
0
Доценты
40
2
3
Ст. преподаватели
50
3
Ассистенты
20
4
Сумма
Квадраты
разности
d
рангов ( )
В таблице серым цветом выделены графы для
подсчета ρ – Спирмена, голубым - для вычисления
τ-Кендала
107
108.
Коэффициент корреляции Спирменаn
1
6 d i2
i 1
2
n( n 1)
1
6 2
0,8
2
4(4 1)
Пример вычисления
где:
di разность пар рангов для i-го объекта,
n – число пар рангов.
(см. таблицу сопряженности признаков)
108
109.
Для вычисления коэффициента ранговой корреляцииКендала выделим пару объектов и сравним их ранги по
одному признаку и по другому (см. таблицу
сопряженности). Если по данному признаку ранги
образуют прямой порядок (т.е. порядок натурального
ряда), то паре приписывается +1, если обратный, то –1.
Для выделенной пары соответствующие плюс – минус
единицы (по признаку X и по признаку Y)
перемножаются. Результат, очевидно, равен +1; если
ранги пары обоих признаков расположены в
одинаковой последовательности, и –1, если в
обратной.
Если порядки рангов по обоим признакам у всех пар
одинаковы, то сумма единиц, приписанных всем парам
объектов, максимальна и равна числу пар.
109
110.
Коэффициент корреляции КендалаS S
1 n(n 1)
2
5 1
0,66
1 4( 4 1)
2
Пример вычисления
Где
S & S
берутся из таблицы сопряженности
110
111. gh
111112. Запуск вычислений
112113. Пример решения задачи с использованием SPSS
113114. Частные корреляции
Если удалось установить тесную зависимость междудвумя исследуемыми величинами, отсюда ещё
непосредственно не следует их причинная
взаимообусловленность. Из причинной связи величин
следует стохастическая связь, из стохастической связи
не всегда следует причинная.
За счет эффектов одновременного влияния
неучтенных факторов на исследуемые переменные
может искажаться смысл истинной связи между
переменными. Например, подсчеты приводят к
положительному значению коэффициента корреляции
между парой случайных величин, в то время как
истинная связь между ними имеет отрицательный
смысл. Такую корреляцию между двумя переменными
часто называют «ложной». Более детально подобные
ситуации — обнаружение и исключение «общих
причинных факторов», расчет «очищенных» или
частных коэффициентов корреляции — исследуют
методами многомерного корреляционного анализа.
115.
Исключить влияние третьей переменной позволяетчастный коэффициент корреляции. Частным
коэффициентом корреляции между случайными
величинами x и y при исключении влияния случайной
величины называется
rxy / z
rxy rxzryz
2
2
(1 rxz )(1 ryz )
где — rxy , rxz , ryz коэффициенты корреляции
Пирсона между случайными величинами x, y, z.
Если переменная Z не влияет, то из формулы
видно, что rxy / z rxy .