ЗАНЯТИЕ 3 ТЕОРИЯ И ПРАКТИКА СТАТИСТИЧЕСКИХ ВЫВОДОВ
Задача об отборе на выставку кошек (1/2)
Задача об отборе на выставку кошек (2/2)
Автор признателен всем котикам (и хозяевам) за возможность некоммерческого использования их изображений, размещенных в
ЗАНЯТИЕ 3 ТЕОРИЯ И ПРАКТИКА СТАТИСТИЧЕСКИХ ВЫВОДОВ
Проверка статистических гипотез
Автор признателен всем котикам (и хозяевам) за возможность некоммерческого использования их изображений, размещенных в
ЗАНЯТИЕ 3 ТЕОРИЯ И ПРАКТИКА СТАТИСТИЧЕСКИХ ВЫВОДОВ
Логика параметрических критериев
Развитие: статистические игры и решения
Автор признателен всем котикам (и хозяевам) за возможность некоммерческого использования их изображений, размещенных в
ЗАНЯТИЕ 3 ТЕОРИЯ И ПРАКТИКА СТАТИСТИЧЕСКИХ ВЫВОДОВ
Идея метода наименьших квадратов (МНК)
МНК для линейно-масштабируемых величин
Простейшее приближение: МНК по всей выборке
Взвешенный МНК: учитываем особенности
МНК по избранным квантилям
Модель усеченного распределения
Модель склейки распределений
Модель смеси распределений
Модель распределения с засорением
Модель в форме ряда Эджворта
Обобщение: конструктивные распределения
Автор признателен всем котикам (и хозяевам) за возможность некоммерческого использования их изображений, размещенных в
ЗАНЯТИЕ 3 ТЕОРИЯ И ПРАКТИКА СТАТИСТИЧЕСКИХ ВЫВОДОВ
Инструменты компьютерной математики
Интервальное оценивание на основе Монте-Карло в MATLAB
Тест Колмогорова-Смирнова в MATLAB
Интервальное оценивание на основе Монте-Карло в Python
Тест Колмогорова-Смирнова в Python
Проверка статистических гипотез в Excel (1/1)
Интервальное оценивание на основе Монте-Карло в R (1/2)
Проверка статистических гипотез в R (2/2)
8.57M
Category: mathematicsmathematics

Теория и практика статистических выводов. Лекция 3

1. ЗАНЯТИЕ 3 ТЕОРИЯ И ПРАКТИКА СТАТИСТИЧЕСКИХ ВЫВОДОВ

Раздел 1. Генеративная статистика
и метод Монте-Карло
Александр Валерьевич Бухановский, Анна Владимировна Калюжная

2.

Понятие статистического вывода
Статистический вывод: использование
выборочных данных для получения и
формализации знаний о свойствах
генеральной совокупности
Оценить количественные характеристики
генеральной совокупности (вопрос
«насколько точно?»)
Выбрать и настроить модель описания
генеральной совокупности (вопрос
«подходит или нет?»)
Валидировать модель, т.е. оценить ее
качество (вопрос «насколько близко?»)

3.

Метод Монте-Карло
Генеративный (регенеративный) подход:
исследование статистических свойств на основе
«размножения» заданной выборки
Механизмы генерации:
На основе априорных знаний о
свойствах генеральной совокупности
На основе действий с выборкой
Метод Монте-Карло (метод
статистических испытаний): синтез
процессов и явлений с
использованием случайных чисел

4.

Случайные числа
Значения равномерно
распределенной случайной величины
в интервале [0,1]:
Псевдослучайные числа (ПСЧ): на
основе детерминированного алгоритма
(заданный период повторяемости)
Случайные числа (СЧ): на основе
физических механизмов или алгоритма
ПСЧ с внешним источником энтропии
(бесконечный период повторяемости)

5.

Моделирование случайных событий
Геометрическая интерпретация случайного события заданной
вероятности P(A) - имитация попадания точки в интервал [0,P(A)]
Выбор варианта
реализации события
по значению :
0
P(A)
1

6.

Моделирование дискретных величин
Закон распределения
(вероятности набора событий)
Выбор реализации события
при попадании точки в
интервал

7.

Моделирование непрерывных величин (1/3)
Дискретно-равномерное приближение
(на основе группированных данных)
1. Выбор номера
столбца i
2. Выбор значения х
внутри столбца

8.

Моделирование непрерывных величин (2/3)
Метод обратной функции
(на основе преобразования квантилей)
Для плотности
распределения (напр.,
ядерной оценки)

9.

Моделирование непрерывных величин (3/3)
Геометрический метод
(на основе плотности распределения)
при условии, что

10.

Моделирование гауссовых случайных величин
Нормированное распределение Гаусса N(0,1)
1) На основе центральной предельной теоремы:
2) На основе преобразования Бокса-Мюллера:

11.

Интервальное оценивание на основе Монте-Карло
Для избранной статистики
:
Задать аналитическую модель распределения
ее оценку
или
Выбрать метод моделирования случайной величины с этим
распределением
Сгенерировать M выборок
Рассчитать по каждой выборке точечную оценку
статистики
По выборке
определить характерные параметры,
в том числе границы β%-доверительного интервала:

12. Задача об отборе на выставку кошек (1/2)

2.3
Найти интервальные оценки математического ожидания и дисперсии для:
(а) выборки из всех 109 кошек, (б) для случайно отобранных 10 кошек

13. Задача об отборе на выставку кошек (2/2)

Для малых выборок асимптотические формулы
некорректны, а метод Монте-Карло – без ограничений

14.

Непараметрические методы: бутстреп
Формирование М псевдовыборок
Псевдовыборки
на основе случайного выбора с возвращением
из исходной выборки:

15.

Непараметрические методы: джекнайф
Формирование N подвыборок
Методическая проблема
джекнайфа и бутстрепа:
смещенность оценок
Подвыборки
путем выкалывания одного из членов
исходной выборки:

16.

Обобщение: генеративная статистика
Метод Монте-Карло: универсальный инструмент
статистического оценивания, когда аналитика не
справляется
Методы моделирования случайных величин: могут
использовать как параметрические, так и
непараметрические оценки распределений
Интервальное оценивание на основе метода Монте-Карло:
просто, надежно, но чувствительно к модели распределения
Методы бутстреп и джекнайф: не зависят от
распределения, но оценки могут быть смещены

17. Автор признателен всем котикам (и хозяевам) за возможность некоммерческого использования их изображений, размещенных в

публичном Интернете
Александр Валерьевич Бухановский, Анна Владимировна Калюжная
[email protected]

18. ЗАНЯТИЕ 3 ТЕОРИЯ И ПРАКТИКА СТАТИСТИЧЕСКИХ ВЫВОДОВ

Раздел 2. Проверка гипотез.
Непараметрические статистические критерии
Александр Валерьевич Бухановский, Анна Владимировна Калюжная

19. Проверка статистических гипотез

Нулевая (базовая) гипотеза
=
? ?
Статистический критерий: механизм
проверки нулевой гипотезы путем
сравнения выборочных данных с
теоретическим «эталоном»
Гипотеза не
противоречит
выборочным
данным
Гипотеза не
подтверждается
выборочными
данными
Значения, полученные по выборке

20.

Гипотеза о виде распределения (пример)
Критерий согласия
Базовая гипотеза -
Альтернатива
:
:
Теоретическая характеристика
Выборочная характеристика

21.

Критерии: сравнение характеристик
Критическая
зона для
значимости α
English     Русский Rules