Similar presentations:
Теория и практика статистических выводов. Лекция 3
1. ЗАНЯТИЕ 3 ТЕОРИЯ И ПРАКТИКА СТАТИСТИЧЕСКИХ ВЫВОДОВ
Раздел 1. Генеративная статистикаи метод Монте-Карло
Александр Валерьевич Бухановский, Анна Владимировна Калюжная
2.
Понятие статистического выводаСтатистический вывод: использование
выборочных данных для получения и
формализации знаний о свойствах
генеральной совокупности
Оценить количественные характеристики
генеральной совокупности (вопрос
«насколько точно?»)
Выбрать и настроить модель описания
генеральной совокупности (вопрос
«подходит или нет?»)
Валидировать модель, т.е. оценить ее
качество (вопрос «насколько близко?»)
3.
Метод Монте-КарлоГенеративный (регенеративный) подход:
исследование статистических свойств на основе
«размножения» заданной выборки
Механизмы генерации:
На основе априорных знаний о
свойствах генеральной совокупности
На основе действий с выборкой
Метод Монте-Карло (метод
статистических испытаний): синтез
процессов и явлений с
использованием случайных чисел
4.
Случайные числаЗначения равномерно
распределенной случайной величины
в интервале [0,1]:
Псевдослучайные числа (ПСЧ): на
основе детерминированного алгоритма
(заданный период повторяемости)
Случайные числа (СЧ): на основе
физических механизмов или алгоритма
ПСЧ с внешним источником энтропии
(бесконечный период повторяемости)
5.
Моделирование случайных событийГеометрическая интерпретация случайного события заданной
вероятности P(A) - имитация попадания точки в интервал [0,P(A)]
Выбор варианта
реализации события
по значению :
0
P(A)
1
6.
Моделирование дискретных величинЗакон распределения
(вероятности набора событий)
Выбор реализации события
при попадании точки в
интервал
7.
Моделирование непрерывных величин (1/3)Дискретно-равномерное приближение
(на основе группированных данных)
1. Выбор номера
столбца i
2. Выбор значения х
внутри столбца
8.
Моделирование непрерывных величин (2/3)Метод обратной функции
(на основе преобразования квантилей)
Для плотности
распределения (напр.,
ядерной оценки)
9.
Моделирование непрерывных величин (3/3)Геометрический метод
(на основе плотности распределения)
при условии, что
10.
Моделирование гауссовых случайных величинНормированное распределение Гаусса N(0,1)
1) На основе центральной предельной теоремы:
2) На основе преобразования Бокса-Мюллера:
11.
Интервальное оценивание на основе Монте-КарлоДля избранной статистики
:
Задать аналитическую модель распределения
ее оценку
или
Выбрать метод моделирования случайной величины с этим
распределением
Сгенерировать M выборок
Рассчитать по каждой выборке точечную оценку
статистики
По выборке
определить характерные параметры,
в том числе границы β%-доверительного интервала:
12. Задача об отборе на выставку кошек (1/2)
2.3Найти интервальные оценки математического ожидания и дисперсии для:
(а) выборки из всех 109 кошек, (б) для случайно отобранных 10 кошек
13. Задача об отборе на выставку кошек (2/2)
Для малых выборок асимптотические формулынекорректны, а метод Монте-Карло – без ограничений
14.
Непараметрические методы: бутстрепФормирование М псевдовыборок
Псевдовыборки
на основе случайного выбора с возвращением
из исходной выборки:
15.
Непараметрические методы: джекнайфФормирование N подвыборок
Методическая проблема
джекнайфа и бутстрепа:
смещенность оценок
Подвыборки
путем выкалывания одного из членов
исходной выборки:
16.
Обобщение: генеративная статистикаМетод Монте-Карло: универсальный инструмент
статистического оценивания, когда аналитика не
справляется
Методы моделирования случайных величин: могут
использовать как параметрические, так и
непараметрические оценки распределений
Интервальное оценивание на основе метода Монте-Карло:
просто, надежно, но чувствительно к модели распределения
Методы бутстреп и джекнайф: не зависят от
распределения, но оценки могут быть смещены
17. Автор признателен всем котикам (и хозяевам) за возможность некоммерческого использования их изображений, размещенных в
публичном ИнтернетеАлександр Валерьевич Бухановский, Анна Владимировна Калюжная
[email protected]
18. ЗАНЯТИЕ 3 ТЕОРИЯ И ПРАКТИКА СТАТИСТИЧЕСКИХ ВЫВОДОВ
Раздел 2. Проверка гипотез.Непараметрические статистические критерии
Александр Валерьевич Бухановский, Анна Владимировна Калюжная
19. Проверка статистических гипотез
Нулевая (базовая) гипотеза=
? ?
Статистический критерий: механизм
проверки нулевой гипотезы путем
сравнения выборочных данных с
теоретическим «эталоном»
Гипотеза не
противоречит
выборочным
данным
Гипотеза не
подтверждается
выборочными
данными
Значения, полученные по выборке
20.
Гипотеза о виде распределения (пример)Критерий согласия
Базовая гипотеза -
Альтернатива
:
:
Теоретическая характеристика
Выборочная характеристика
21.
Критерии: сравнение характеристикКритическая
зона для
значимости α