29.56M
Category: mathematicsmathematics

Специальные главы математики

1.

СПЕЦИАЛЬНЫЕ ГЛАВЫ
МАТЕМАТИКИ
1 семестр

2.

Машинное обучение
2

3.

Методы машинного обучения
3

4.

МОДЕЛЬ ПРЕДСТАВЛЕНИЯ

5.

Характеристика объекта
Система – совокупность взаимосвязанных элементов или подсистем,
функционирование которых подчинено единым целям.
Внешняя среда
Xj
Zk
оо
Yi
Объект исследования
Xj – переменные входа, X={x1, x2…xj…} или X
Yi – переменные выхода, Y={y1, y2…yi…} или Y
Zk – переменные состояния, Z={z1, z2…zk…} или Z
5

6.

Характеристика объекта
Переменные
входа
• Характеризуют воздействие внешней среды на
объект
• Независимы по отношению к объекту
Переменные
состояния
• Отражают условия функционирования объекта
или его компонентов
• Зависят от природы объекта, определяются его
спецификой
Переменные
выхода
• Характеризуют влияние объекта на внешнюю
среду
• Зависят от природы объекта, определяются его
спецификой
Данные, собранные на объекте, могут быть активными и пассивными.
6

7.

Значения переменных объекта
Количественные переменные
• числовое поле
Неколичественные переменные
• качественные значения
• символьные значения
• документы
• графы
• файлы
• алгоритмы
Область значений каждой переменной должна быть ограниченной,
счетной и обладать свойством однозначности.
7

8.

Цели и целевые функции
Цели исследования
• характеризуются
множеством
переменных
• отражают конечные
результаты
функционирования
объекта
Критерии качества
• представлены в
виде техникоэкономических и
организационных
показатели
• отражают меру
эффективности
функционирования
объекта
Целевые функции
• математическая
форма записи
критериев качества
на основе
переменных,
описывающих цели
исследования
Объективная составляющая
• определяется природой объекта исследования
Субъективная составляющая
• определяется ЛПР
8

9.

Общая постановка задачи
На основе компьютерной обработки имеющихся реальных данных, если
они подходят для этого, оценить степень влияния каждой из входных
переменных X и переменных состояния Z на целевые функции V(Y ) (или
хотя бы одну из них) с тем, чтобы в дальнейшем можно было бы
выбором их оптимального уровня добиться улучшения
функционирования данного объекта или использовать полученные
оценки в других исследованиях.
XUZ≡X
• независимые переменные
• объясняющие переменные
• факторы
• предикторы
• регрессоры
V(Y)≡Y
• зависимые переменные
• объясняемые переменные
• целевые функции
• отклики
9

10.

Задача машинного обучения
10

11.

Классификация методов
Методы
статистического
анализа
Одномерные
методы
Метрические
данные
Многомерные
методы
Неметрические
данные
Зависимые
переменные
Взаимозависимые
переменные
Одна переменная
Несколько
переменных
Дисперсионный,
ковариационный,
дискриминантный
анализ, множественная
регрессия, кросстабуляция
Многомерный
дисперсионный,
ковариационный,
дискриминантный
анализ, анализ
корреляций
Зависимость
между
переменными
Межобъектное
сходство
Факторный анализ
Кластереный
анализ,
многомерное
шкалирование
11

12.

РЕГРЕССИОННЫЙ АНАЛИЗ
12

13.

Основная литература
а) Основная литература
1.
2.
3.
Дрейпер Н., Смит. Г. Прикладной регрессионный анализ, 3-е
изд.:Пер. с англ. – М.: Издательский дом «Вильямс», 2007. – 912
с.
Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика.
Начальный курс. 6-е изд., перераб. и доп. - М.: Дело, 2004. — 576
с.
Вучков И. и др. Прикладной линейный регрессионный анализ. –
м.: Финансы и статистика, 1987 г. – 239с.
б) Дополнительная литература
1.
2.
3.
4.
5.
6.
Доугерти К. Введение в эконометрику. - М.: Инфра, 2001 г. – 402
с.
Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная
статистика: классификация и снижение размерности. - М.:
Финансы и статистика, -1988 г.
Введение в методы эконометрики. Сборник задач: Пер. с польск./
Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2004 г. –
248 с.
Эконометрика. Учебник/ Под ред. И.И.Елисеевой. - М.: Финансы
и статистика 2003 г. - 344 с.
Форман Дж. Много цифр: Анализ больших данных с помощью
Excel. – М.: Альпина Паблишер, 2016. – 461с.
Мюллер А., Гвидо С. Введение в машинное обучение с помощью
Python: Пер. с англ. – СПб.: ООО «Альфа книга», 2017. – 480 с.
13

14.

Регрессия
Регрессия – зависимость
среднего значения какойлибо величины от некоторой
другой величины или
нескольких величин.
Тип корреляционной
(вероятностной,
статистической) зависимости
между величинами, не
имеющей функционального
характера.
M(Y|x)=y(x)
Значения ЦФ - количественные
Значения факторов – количественные
и неколичественные
14

15.

Построение регрессионной модели
I уровень
• y f ( x) f ' ( x)
• x X
n'
II уровень
• y x f ' ( x)
• f ( x) x x ... x x x x x ...
y f (x )
j 0
0
j
j
1 1
2 2
i
III уровень
n n
11 1 1
12 1 2
i
n'
n'
j 0
j 0
yˆ b j x j , yˆi b j x ji
ˆ j b j , M (b j ) j
y, j истинные значения
yˆ , b j расчетные (ттеоретические, оценочные) величины
j , b j регрессионные коэффициенты
15

16.

Эффекты влияния
Факторы (в чистом виде)
x1 , x2 ...x5 ...
Взаимодействия
x2 x3 , x1 x4 ...
Эффекты высоких степеней
x12 , x13 x2 , x52 x12 ...
Модели бывают линейные и нелинейные по факторам (x) и
по параметрам (b).
Линейность и нелинейность по факторам оговаривается особо и называется
порядком модели.
Пример:
yˆ b1e
b2 x1
b3 x2
16

17.

Пример
Записать общий вид аппроксимирующего полинома ЦФ, если известно,
что она зависит от трех факторов в чистом виде, их парных линейных
взаимодействий и эффекта третьей степени первого фактора.
17

18.

Пример
Записать общий вид аппроксимирующего полинома ЦФ, если известно,
что она зависит от трех факторов в чистом виде, их парных линейных
взаимодействий и эффекта третьей степени первого фактора.
Решение:
yˆ b0 b1 x1 b2 x2 b3 x3 b12 x1 x2 b13 x1 x3 b23 x2 x3 b111 x13
n'
b0 b1 x1 b2 x2 b3 x3 b4 x4 b5 x5 b6 x6 b7 x7 b j x j
j 0
n 3, n' 7
18

19.

Метод наименьших квадратов
y 0 1 x1 0 1 x , yˆ b0 b1 x
ŷi
yi
b0
Диаграмма рассеяния
x1i xi
b j регрессионные коэффициенты, параметры модели
19

20.

Система нормальных уравнений
ei остаток для yi
ei yi yˆi yi b0 b1 x
Q ei2 ( yi b0 b1 x) 2
i
i
Q функция потерь( риска)
Решается задача :
Q min
xi , yi известные величины
b j неизвестные величины
N
Q
b 2 ( yi b0 b1 x) 0
0
i 1
N
Q
2 ( yi b0 b1 xi ) xi 0
b1
i 1
N
N
yi Nb0 b1 xi 0
i 1
i 1
N
N
N
2
y x b
x
b
x
i i
0 i
1 i 0
i 1
i 1
i 1
bj - МНК-оценка j-го коэффициента в уравнении регрессии.
Коэффициент регрессии bj - это абсолютная величина, на которую в
среднем изменяется величина ЦФ при изменении j-го фактора на
единицу измерения, если все остальные факторы в модели остаются
неизменными.
20

21.

Основные предпосылки классического ЛРА
1. i случайная величина
yi f ( x) yi случайная величина
2. имеет нулевое математичское ожидание
3. некоррелированны и имеют одинаковую
дисперсию 2
4. имеет нормальное распеределение
~ N (0, 2 ), cov( i , l ) 0
5. Матрица регрессоров X - неслучайна
Классическая схема линейного регрессионного анализа – это процедура,
которая удовлетворяет всем предположениям.
21

22.

Задание 2. Линеаризация.
Некоторые зависимости в химических реакциях выражаются уравнениями
вида:
a
4
z a1 1 2 2a3 e 3
a
Линеаризовать модель, привести ее к стандартному виду.
22

23.

Задание 2. Линеаризация.
Некоторые зависимости в химических реакциях выражаются уравнениями
вида:
a
4
z a1 1 2 2a3 e 3
a
Линеаризовать модель, привести ее к стандартному виду.
Решение: прологарифмируем обе части уравнения:
ln z ln a1 a2 ln 1 a3 ln 2
Отсюда:
Тогда:
a4
3
yˆ ln z , b0 ln a1 , b1 a2 , x1 ln 1
b2 a3 , x2 ln 2 , b3 a4 , x3
1
3
yˆ b0 b1 x1 b2 x2 b3 x3
23

24.

Представление исходных данных
Матрица уровней
i x0 x1 x2 … xj … xn xn+1 … xn’
1 1 x11 x21
2 1 x12 x22
… … … …
i 1 … …
… … … …
N 1 x1N x2N






xj1 … xn1 xn+11
xj2 …

xji …

xjN …
… xn'1




… xn'N
Матрица планирования
Расширенная матрица планирования
Матрица уровней
Матрица
регрессоров X
i – номер выборки (опыта), j – номер фактора (регрессора)
Сочетание (ji) однозначно определяет уровень фактора
f ( x) 0 1 x1 2 x2 ... n xn n 1 xn 1 ... n ' xn '
24

25.

Представление исходных данных
Матрица результатов
i
yik
1 y11 ,y12...y1k … y1n1
2 y21 ,y22...y2k … y2n2


i yi1 ,yi2...yik … yini


N yN1 ,yN2...yNk … yNnN
English     Русский Rules