Методы и методики среднесрочного прогнозирования социально-экономических процессов
Нелинейные модели
Нелинейные модели
Как выполнить прогноз?
Мультиколлинеарность
Вывод:
831.50K
Category: economicseconomics

Методы и методики среднесрочного прогнозирования социально-экономических процессов

1. Методы и методики среднесрочного прогнозирования социально-экономических процессов

Методы и методики среднесрочного
прогнозирования социальноэкономических процессов
Автор
Проф. С.Г.Светуньков
Высшая школа экономики
www.hse.ru

2.

Классификация социально-экономических
процессов по типу динамики
Социально –
экономические
процессы
Стационарные
процессы
Однородные
стационарные
процессы
Неоднородные
стационарные
процессы
фото
Нестационарные
процессы
Однородные процессы
в переходный период
Необратимые
процессы
Эволюционные
процессы
фото
Хаотические процессы
фото
Высшая школа экономики, Санкт-Петербург

3.

Базовые определения
Под стационарными рядами понимаются ряды случайных
процессов, характеристики которых не меняются с течением
времени t, т.е. они инвариантны относительно временных
фото
сдвигов: t t
y t y t
при любом фиксированном действительном τ.
Под нестационарными в промежуток времени от t до t + T
обратимыми процессами понимаются такие из них,
фото
характеристики которых меняются вариантно относительно
временных сдвигов: t t y t y t y t
где приращение ∆y(t+τ) не определяется характеристиками
фото
процессов в предыдущие моменты времени.
Высшая школа экономики, Санкт-Петербург

4.

Методы прогнозирования в зависимости от
типов процессов
Социально –
экономические
процессы
Стационарные
процессы
Однородные
стационарные
процессы
Неоднородные
стационарные
процессы
Методы математической
статистики
Высшая школа экономики, Санкт-Петербург
фото
Нестационарные
процессы
Однородные процессы
в переходный период
Необратимые
процессы
Эволюционные
процессы
фото
Хаотические процессы
фото

5.

Мы рассмотрим прогнозирование
только стационарных процессов

6.

Нормальный закон
распределения вероятностей
случайной величины
φ(y)
Обратимые социально-экономические
процессы бывают самой разнообразной
природы. Но в подавляющем
большинстве случаев эти случайные
процессы описываются нормальным
законом распределения.
Нормальный закон распределения
вероятностей полностью описывается
двумя характеристиками –
математическим ожиданием и его
0
дисперсией.
y
y0
y0+∆y
y
График функции плотности нормального
распределения вероятностей

7.

Нормальный закон
распределения вероятностей
случайной величины
Гаусс предложил функцию, аппроксимирующую нормальный закон распределения
вероятностей, и носящую его имя:
y
1
y 2
e
1 y y
2 y
2
Здесь μy - математическое ожидание случайной величины y,
σy - дисперсия этой случайной величины.
Откуда взялась эта функция? Просто Гаусс сначала изучил более простую
функцию, а именно:
y e
y2
А потом искал ответ на вопрос: где бы её применить? А тут как раз попалась
статистическая задача…

8.

Средняя арифметическая и её
свойства
В числе средних величин, используемых в прогнозировании, на первом месте стоит
средняя арифметическая. Её популярность вызвана тем, что очень часто она является
лучшей оценкой математического ожидания.
Средняя арифметическая представляет собой частное от деления суммы значений
показателя на число элементов выборочной совокупности:
y1 y 2 ... yT
1 T
y
yt
T
T t 1
Важной характеристикой генеральной совокупности является дисперсия дискретной
случайной величины, которая представляет собой сумму квадратов отклонения
каждого значения случайной величины от её математического ожидания,
умноженную на вероятность этого значения.
Для работы не с генеральной совокупностью, а с выборкой из неё используют такую
формулу:
T
2
2
1
yt y
T 1 t 1

9.

Прогноз случайной
стационарной величины
Если есть основания считать, что случайная величина распределена нормально, то её
лучшей прогнозной оценкой будет являться средняя арифметическая:
1 T
yˆT 1 y yt
T t 1
Прогнозируемая величина будет лежать в пределах:
y t ,m
T
y y t ,m
T
m – число степеней свободы (число независимых наблюдений минус число
оцениваемых статистических параметров)

10.

Пример
Средняя арифметическая цены 0,5 литра ряженки по данным 126 магазинов
Выборгского района Санкт-Петербурга составила (руб.):
y 69
Выборочное значение дисперсии оказалось равным :
2 211,5
Число степеней свободы – m=126-1. Значение t-статистики Стьюдента для 125
степеней свободы при уровне значимости 0,05 равно 1,9791.
Значит, с доверительной вероятностью в 95% прогнозная величина цены пол литра
ряженки в магазине «О’кей» у метро «Озерки» будет лежать в пределах:
69 1,9791
211,5
211,5
y 69 1,9791
126
126
66, 44 y 71,56

11.

Чаще всего приходится иметь дело с нормально
распределёнными случайными процессами
Это означает, что схема прогнозирования такая:
1. Находим модель, описывающую математическое ожидание процесса,
2. Вычисляем выборочное значение дисперсии,
3. Выполняем прогноз,
4. Оцениваем прогнозные границы.
Но поскольку данные обратимые процессы протекают в условиях
неоднородности, возникает задача выявления и формального описания
связки: причины во внешнем окружении → следствия в
прогнозируемом процессе.
Это и есть искомая прогнозная модель.

12.

Как выявить причинно-следственную связь?
Взаимосвязь между двумя случайными факторами называется
«корреляционной».
Если мы говорим о корреляции между факторами, то это означает,
что мы утверждаем наличие зависимости между двумя случайными
факторами.
На первом этапе необходимо провести профессиональный анализ
возможных взаимосвязей и обосновать наличие и возможную форму
взаимосвязи.
На втором этапе необходимо использовать инструменты
корреляционного анализа.

13.

Как выявить причинно-следственную связь?
Наиболее часто в корреляционном анализе используется
коэффициент парной корреляции, который был выведен
Пирсоном в XIX веке, исходя из предположения о
наличия между двумя факторами линейной взаимосвязи.
Поэтому этот коэффициент свидетельствует только о том,
насколько предполагаемая связь между двумя факторами
приближается к линейной.
Он не помогает выявить взаимосвязь, а свидетельствует о
возможности её описания линейной зависимостью.

14.

Типовые прогнозные модели
Самый простой случай для прогнозирования, — когда число
изменяющихся факторов равно единице. В этом случае прогнозисту
приходится иметь дело с однофакторной моделью:
yt f xt t
Поскольку характер изменения рядов социально-экономических
показателей является многообразным, то и, описывающие его модели
могут иметь самые различные формы. Чаще всего в практике
социально-экономического прогнозирования в качестве моделей
однофакторных зависимостей используют несколько элементарных
функций. Рассмотрим их.

15.

yˆ t a0 a1 xt
Типовые прогнозные модели
yˆ t a0 a1 xt
Линейная функция:
yt
tgα = a1
a0
0
xt

16.

Типовые прогнозные модели
Модель квадратичной функции:

17.

Типовые прогнозные модели
Модель многочлена третьей степени:
3a3 a1 a22
yt
Δ < 0,
a3 > 0
0
yˆ t a0 a1 xt a 2 xt2 a3 xt3
xt

18.

Типовые прогнозные модели
yˆ t a0 xt
Модель степенной функции:
Случай I, когда a1 > 1
Случай II, когда 0 < a1 < 1
yt
yt
a0
A
a0
A
xt
0
1
xt
0
1
a1

19.

Типовые прогнозные модели
Модель гиперболы:
1
yˆ t a 0 a1
xt
yt
A
a0
0
1
xt

20.

Типовые прогнозные модели
yˆ t a 0 k
Модель показательной функции:
a1 xt
yt
a1 > 0
yˆ t a0 e a1xt
a1 < 0
yˆ t a 0 10
ea1
1
xt
0
1
a1 xt

21.

Типовые прогнозные модели
Модель логарифмической функции:
yˆ t a0 a1 ln xt
yt
A
a0
xt
0
1

22.

Метод наименьших квадратов
Рассмотрим вначале простую линейную модель:
yˆ t a0 a1 xt
yt


Расстояние ε’τ
Она описывает
исходные значения
показателя yt с
некоторой ошибкой
аппроксимации εt:
t yt yˆ t
Отклонение ετ
Модель МНК
a0
0

xt

23.

Метод наименьших квадратов
Метод наименьших квадратов предусматривает нахождение таких коэффициентов
модели, для которых сумма квадратов отклонений εt будет минимальной:
t2 yt yˆt F (ai ) min
2
t
t
В простом случае коэффициенты линейной однофакторной модели
yˆ t a0 a1 xt с помощью МНК определяются просто. Надо взять первые
производные функции по каждому из коэффициентов и приравнять их нулю:
n
2
(
y
a
a
x
)
i
0
1 t
n
F (a , a )
0
1
i 1
2 ( yi a0 a1 xt ) 0,
a0
a0
i 1
n
( yi a0 a1 xt ) 2
n
F (a0 , a1 )
i 1
2 xt ( yi a0 a1 xt ) 0,
a1
i 1
a1

24.

y t Ta 0 a1 xt
t
t
2
y
x
a
x
a
x
t t
0 t
1 t
t
t
t
Метод наименьших квадратов, для квадратичной функции (и любой
аддитивной функции) использовать легко:
yt a0 a1 xt a2 xt2
2
y
Ta
a
x
a
x
0
1 t
2 t
t
t
t
t
2
3
y
x
a
x
a
x
a
x
t t
0 t
1 t
2 t
t
t
t
t
y x 2 a x 2 a x 3 a x 4
0
t
1
t
2
t
t t t
t
t
t

25. Нелинейные модели

Для мультипликативных моделей непосредственное использование МНК ведёт к
необходимости
решения
системы
нелинейных
уравнений.
Например,
экспоненциальный тренд:
at
yˆt a0e 1
Для него получим такую систему уравнений МНК:
( ( yt a0 e a1t ) 2 )
t
0
a0
a1t 2
(
(
y
a
e
) )
t
0
t
0
a1
yt e a1t a0 e 2 a1t 0
t
t
a1t
2 a1t
2
a0 yt te a0 te 0
t
t

26. Нелинейные модели

В таком случае используют приём линеаризации модели:
yˆt a0e
a1t
ln yˆt ln a0 a1t
Для линеаризованной модели получим:
ln yt T ln a0 a1 t ,
t 1
t 1
T
T
T
2
t ln y ln a
t
0 t a1 t .
t 1
t 1
t 1
T
T
a0 e
ln a0

27. Как выполнить прогноз?

После вычисления с помощью МНК (или какого-нибудь другого метода)
коэффициентов модели, вычисляют дисперсию ошибки аппроксимации 2 .
После этого определяют значение факторной переменной xt в момент прогноза τ.
Подставляя это значение в модель, получим прогноз:
yˆt f xt
Поскольку у исходных данных была некоторая дисперсия (колеблемость), то и
прогноз должен быть интервальным. Для определения прогнозного интервала
используют формулу оценки доверительных границ:
y t ,m
T
y y t ,m
T

28.

Метод наименьших квадратов для многофакторных
моделей
Многофакторные модели могут быть как линейными, так и нелинейными.
Рассмотрим задачу построения линейной многофакторной модели:
yˆ t a0 a1 x1,t a 2 x 2,t ... a k x k ,t
Метод наименьших квадратов для данной аддитивной функции использовать легко:
yt na0 a1 x1t a2 x2t ... ak xkt
t
t
t
t
yx a
2
x
a
x
a
x
x
...
a
x
x
t
1
t
0
1
t
1
2
2
t
1
t
k
kt
1t
1
t
t
t
t
t
t
...
2
yt xkt a0 xkt a1 x1t xkt a2 x2t xkt ... ak x kt
t
t
t
t
t

29.

Метод наименьших квадратов
yˆ t a0 a1 x1,t a 2 x 2,t ... a k x k ,t
yt Ta0 a1 x1t a2 x2t ... ak xkt
t
t
t
t
yx a
2
0 x1t a1 x1t a2 x2 t x1t ... ak xkt x1t
t 1t
t
t
t
t
t
...
2
yt xkt a0 xkt a1 x1t xkt a2 x2t xkt ... ak x kt
t
t
t
t
t

30. Мультиколлинеарность

Мультиколлинеарность, как следует из самого названия, возникает
тогда, когда факторы модели имеют одинаковые, монотонные
относительно друг друга тенденции в динамике.
В этой ситуации оценки коэффициентов многофакторных моделей с
помощью МНК будут очень неточными и неустойчивыми - они меняют
свои значения и часто знаки даже при изменении порядка округления.
Так как оценки параметров оказываются неточными, то интерпретация
влияния факторов на прогнозируемый показатель будет совершенно не
той, которая есть на самом деле.
Ценность таких моделей крайне низка, так как неустойчивая модель даёт
очень сильную вариацию своих коэффициентов, а значит и расчётных
значений прогнозируемого показателя.
Модель, с помощью которой сделана попытка описать сложное
многофакторное явление, не описывает это явление.

31. Вывод:

Любые прогнозы не носят
точечный характер. Они всегда –
интервальны!
English     Русский Rules