Электронный Учебно-Методический Комплекс



Тема 1

  Элементы выборочной теории. Регрессия.

 

 Определение эконометрики. Предмет, цель и задачи эконометрики.

 

1.      Определение эконометрики

2.      Предмет, цель и задачи эконометрики

 

  1.Термин «Эконометрика» впервые был использован П. Сиомпой в 1910г. Эконометрика буквально означает: наука об экономических измерениях. Существуют различные определения эконометрики. Приведем некоторые высказывания известных ученых об эконометрике.

  Эконометрика - это раздел экономики, занимающейся разработкой и применением статистических методов для измерений взаимосвязей между экономическими переменными(С. Фишер и др.)

-Эконометрика- это ни в коем случае не то же самое, что экономическая статистика. Она отнюдь не идентична тому, что мы называем общей экономической теорией, хотя значительная доля этой теории носит определенно количественный характер. Также эконометрика недолжна, восприниматься как синоним применения математики в экономике. Опыт показывает, что и статистика, и экономическая теория, и математика, взятые по отдельности, являются необходимыми, но не достаточными для действительного понимания количественных отношений в современной экономической жизни. Именно объединение всех трех частей дает мощный эффект. И именно это объединение и составляет эконометрику (Р.Фриш).

-Эконометрика объединяет совокупность методов и моделей, позволяющих на базе экономической теории, экономической статистики и математико-статистического инструментария придавать количественные выражения качественным зависимостям (С.А.Айвазян).

С современных позиций эконометрику можно определить как науку о моделировании экономических явлений, позволяющем объяснить и прогнозировать их развитие, выявлять и измерять определяющие факторы.

Таким образом, предметом эконометрики являются факторы, формирующие развитие экономических явлений и процессов.

Эконометрика ставит своей целью количественно характеризовать те экономические закономерности, которые экономическая теория выявляет и определяет лишь в общем. В эконометрике оперируют конкретными экономическими данными и количественно описывают конкретные взаимосвязи.

Задача эконометрики состоит в том, чтобы с помощью статистики найти выражения тех закономерностей, которые экономическая теория и математическая экономика определяют в общем.

Основная задача эконометрики - наполнить эмпирическим содержанием априорные экономические рассуждения (Л.Клейн).

Инструментарий эконометрики составляют методы математической и прикладной статистики. Более шире основные задачи эконометрики можно описать следующим образом:

-построение эконометрических моделей–представление экономический процесс в математической форме, удобной для проведения эмпирического анализа;

-оценка параметров построенной модели, позволяющую характеризовать адекватность модели реальными данными;

-проверка качества полученных параметров модели в целом;

-использование построенных моделей для объяснения поведения исследуемых экономических показателей, прогнозирования, осмысления экономических решений.

 

Тема №2 Экономические системы и их моделирование

 

Экономическая система-это взаимодействие общественного производства и потребление материальных благ. Понятие системы в общем виде формулируется следующим образом. Под системой  понимается комплекс взаимосвязанных и взаимообусловленных элементов. Множество элементов образуют систему если имеют место следующие четыре признака:

-целостность системы, т.е. принципиальная несводимость свойств системы к сумме свойств составляющих ее элементов;

-наличие цели и критерия исследования данного множество элементов;

-наличие среды существование данной системы;

-возможность существования в данной системе автономной подсистемы.

Простейшую экономическую систему можно получить если рассмотреть взаимодействие основных фондов, рабочих и определенной технологии. Именно взаимодействие трех составляющих приводит к выпуску продукций. Без взаимодействие капиталовложение, рабочих и имеющихся технологий мы не имеем экономическую систему.

Экономическая система всегда переходит из одного состояния в другой, т.е. в этой системе происходит экономический процесс. Для изучения экономического процесса применяется метод эконометрического моделирования.

Под эконометрическим моделированием понимается исследование экономической системы с помощью эмпирических (статистических) данных.

Экономическая модель системы–некоторый условный образ реальной системы. Под эконометрической моделью понимается перевод реальной системы на математические соотношение (уравнения, неравенств и т.п.). Следует отметить что любая  модель не может абсолютно точно отражать реальный экономический процесс. Так как модель отражает существенные свойства экономического процесса, то с её помощью можно сделать содержательные выводы для практического применения. Степень соответствия модели той реальной системе, для описания которой она построена, называется адекватностью модели.

Различают два вида моделирование: материальное (предметное) и идеальное. Материальным называется моделирование, в котором исследование ведется на основе модели, воспроизводящей основные динамические и функциональные характеристики изучаемого объекта. В экономических исследованиях применяется идеальное моделирование основанное на мысленной аналогии реального объекта и его модели. Идеальное моделирование можно разбить на два подкласса: знаковое (формализованное) моделирование и интуитивное моделирование.

В эконометрике используется модели реальных объектов в форме алгебраических, дифференциальных и других уравнений решаемые с учетом дополнительных условий отражающие состояние системы.

Интуитивные моделирование – это моделирование на словесном (описательном) уровне. При интуитивном моделировании проводится мысленный анализ изучаемого объекта.

Процесс экономического моделирования состоит из трех структурных элементов: объект исследования, субъект (исследователь), модель опосредующую отношения между познающим субъектом и познаваемым объектом.

 

Тема №3 Основные этапы эконометрического моделирования

 

Качество эконометрического исследования зависит от качества построенной эконометрической модели. Модели должны быть «на столько простыми, насколько возможно, но не проще» сказал А.Энштейн. На основании модели делаются прогнозы протекания социально–экономических процессов и разрабатываются необходимые управленческие решения.

Процедура построение эконометрической модели состоит из нескольких взаимосвязанных этапов:

1.                      Постановочный этап. Формулируется цель исследования, определяется набор участвующих в модели экономических переменных, определяются основные принимаемые предпосылки и допущения.

Целью эконометрического моделирования является анализ изучаемого экономического процесса, анализ возможного развития экономического явления и прогноз его экономических показателей. Выбор переменных участвующих в модели должен быть экономически обоснованными. Отбор переменных осуществляется с помощью теоретической процедуры  с помощью корреляционного анализа.

2. Априорный этап. Проводится анализ сущности изучаемого объекта, формирование и формализация априорной (известной заранее, до начала моделирование) информации в виде гипотез и исходных допущений.

3. Информационный этап. Осуществляется сбор необходимой статистической информации т.е. регистрация значений показателей, участвующих в описание модели.

4. Спецификационный этап модели. В математической форме выражаются обнаруженные связи и соотношения с учётом включенных в модель переменных, формируются исходные предпосылки и ограничения модели. На данном этапе определяется лишь структура модели, её аналитическая запись. Качество эконометрического моделирования зависит от правильной спецификации.

5. Параметризационный этап. Оцениваются параметры (коэффициенты) выбранной зависимости. Оценка осуществляется на основе имеющихся статистических данных.

6. Идентификационный этап. Осуществляется статистический анализ модели и оценка её параметров.

7. Верификационный этап. Проводится проверка адекватности модели, выясняется, насколько удачно решены проблемы спецификации, идентификации, какова точность расчетов по данной модели, насколько соответствует построенная модель реальному экономическому явлению.

 

Тема №4. Выборочная вариация и правила её расчета

 

Вся исследуемая совокупность называется генеральной совокупностью. Из-за недоступности исследования всех элементов генеральной совокупности из неё отбирают случайным образом некоторое ограниченное число объектов. Совокупность случайно отобранных объектов называется выборочной совокупностью или просто выборкой. Например, мы хотим изучить объем месячных продаж всех торговых точек нашей республики. Сплошное исследование практически невозможно или сопровождается большими затратами. Поэтому для изучения объемы продаж, из каждой области случайным образом отбирают скажем по 50 торговых точек. Отобранные по всей республике 350 торговых точек и является выборочной совокупностью. Генеральная совокупность по существу это мыслимая совокупность. Например, это количество торговых точек по всей Республике. Но, ни кто не знает, сколько торговых точек имеется в нашей Республике. Числовые характеристики генеральной совокупности (математические ожидание, дисперсия т.д.) являются по существу теоретическими величинами. Их оценивают с помощью  выборочных характеристик.

Пусть из генеральной совокупности извлечена выбора объема Выборочной средней называется средние арифметическое наблюдаемых значений случайной величины в выборе т.е.

Выборочной дисперсией (вариацией) называется среднее арифметическое квадратов отклонения наблюдаемых значений случайной величины от среднего значения, т.е.

Если возвести в квадрат разности стоящее под суммы и воспользоваться средними величинами, то получим альтернативную формулу расчета вариации

Выборочная дисперсия обладает следующими свойствами:

1.                      Если - константа, то

Это следует из первой расчетной формулы вариации.

2.  если -константа;

3.  если -константы.

Выборочные средние и выборочные вариации являются случайными величинами т.к. эти величины рассчитаны на основании случайных выборах.

 

Тема №5. Числовые меры корреляционной связи

Выборочная ковариация является мерой взаимосвязи между двумя переменными.

     (2)

 Есть несколько важных правил, которые вытекают непосредственно из определения ковариации. Поскольку они будут многократно использоваться в последующих главах. Имеет смысл сформулировать их сейчас.

Правило 1.

Если Y=V+W, то Cov(X,Y)=Cov(X,V)+Cov(X,W)

Правило 2.

Если Y=bZ, где b-константа,  Z-переменная, то Cov(X,Y)=bCov(X,Z)

Правило 3.

Если Y=b, где b- константа, то Cov(X,Y)=0

 

Приставка «Ко» означает  «совместный»  (ковариация – взаимосвязанная или совместная вариация). Генеральное значение ковариации определяется формулой:

                                  (2.1)

 

Здесь М[·] - оператор вычисления математического ожидания, нуль вверху означает центрирование величины.

Заметим что в формуле (2.1) вариация случайных величин Y и X измеряется  их отклонением от математических ожиданий, а условие «совместности» измерения вариаций реализуется операцией умножения внутри квадратных скобок.

 

2.2.2. Выборочная оценка коэффициента линейной парной корреляции

 

На практике вместо генеральной совокупности мы имеем выборку из неё. Будем считать выборку репрезентативной, а связь между случайными величинами Y и X – линейной:

 

                                                         y = b0 + b1x,                                                      (2.2)

 

где b0, b1 – генеральные (теоретические) значения параметров линейного уравнения регрессии (2.2.), которые будем обозначать греческими буквами, а их выборочные оценки b0, b1 – латинскими малыми буквами.

Если нормировать ковариацию (2.1), т.е. разделить ее на произведение средних квадратических отклонений (СКО)  и , то получим коэффициент парной корреляции. Генеральное значение коэффициента равно:

 

                                                                                                   (2.3.)

а выборочная оценка:

 

                                                                                (2.4.)

- выборочные оценки математических ожиданий mx, my;

Sx,Sy – выборочные СКО.

                                                 (2.5)

 

Знак при T определяет форму (характер) корреляционной связи в уравнении (2.2):

 (+) положительный знак соответствует возрастающему виду (при росте случайной величины х другая случайная величина тоже работает в среднем);

 ( - )  отрицательный знак соответствует убывающему виду, зависимости (2.2).

 

Таким образом коэффициент линейной парной корреляции изменяется в пределах .

2.2.3. Математический смысл коэффициента линейной парной корреляции

 

Предположим, что между двумя случайными величинами X и Y в среднем существует линейная связь (2.2), т.е. они связаны линейным уравнением регрессии для математических ожиданий

 

                                                                                                           (2.6)

 

При взгляде на уравнение регрессии видно, что измерителем связи Y и X  может служить коэффициент b1. Действительно, вычисляя производную от функции , получим:

 

т.е. b1 оценивает скорость  изменения функции Y при  изменении аргумента X. Однако b1 неудобен как измеритель связи тем, что b1 зависит  от единиц измерения  X и Y. Хотелось бы иметь безразмерный показатель. Сделаем это, переходя  к нормированным переменным в уравнении регрессии:

 

                                                           (2.7)

 

Коэффициент корреляции Tx,y есть скорость изменения (производная) нормированной функции  при вариации нормированного аргумента  и линейной связи между ними.

 

 

Тема №6. Парная линейная регрессия.

Тема №7. Оценка коэффициентов по методу наименьших квадратов.

 

Коэффициент корреляции может показывать, что две переменные связаны друг с другом, однако он не дает представления о том, каким образом они связаны.

Начнем с рассмотрения простейшей модели:

         (6)

Величина, значение зависимой переменной в наблюдении i, состоит из двух составляющих: 1) неслучайной составляющей ; случайного члена .

Почему же существует случайный член? Имеется несколько причин.

1. Невключение объясняющих переменных.

2. Агрегирование переменных.

3. Неправильное описание структуры модели.

4. Неправильная функциональная спецификация.

5. Ошибки измерения.

Случайный член является суммарным проявлением всех этих факторов.

     Рассмотрим простейшую модель . Величина у рассматривается как зависимая переменная, состоящая из двух частей: неслучайной составляющей , где х – объясняющая переменная,  и - параметры, - случайный член. Имеется несколько причин включения случайного члена.

1. Невключение объясняющих переменных. Соотношение между х и у является упрощением, и существуют другие факторы, влияющие на у. Или переменные, которые мы хотели бы включить, не можем измерить их, например, психологический фактор. Или мы просто не знаем пока какие ещё переменные влияют на у.

4.                      Агрегирование переменных. Во многих случаях рассматриваемая зависимость – это попытка объединить вместе некоторое число микроэкономических соотношений. Например, функция суммарного потребления, т.е. объединение решений многих индивидов. Наблюдаемое расхождение объясняет случайный член.

5.                      Неправильное описание структуры. Структура модели неправильна или не вполне правильна. Например, у зависит не от фактического х, а от уt-1 – предыдущего значения, при этом может казаться, что между х и у существует связь. Расхождения при этом описываются .

6.                      Неправильная функциональная спецификация. Математически зависимость х и у описывается не так. Например, зависимость не является линейной.

7.                      Ошибки измерения. Неизбежны.

Таким образом,  является суммарным проявлением всех этих причин.

     Рассмотрим задачу «наилучшей» аппроксимации набора наблюдений Х t и Уt,   линейной функцией  в смысле минимизации функционала . Необходимое условие экстремума:

                ,

или в стандартной форме нормальных уравнений:

    или     

 

Решение системы можно записать в виде

                        ,          .

Получим значения и  в отклонениях, т.е. пусть

xt = Xt - , yt = Yt - . Можно показать, что  =   = 0. Замена Xt, Yt на xt, yt означает перенос системы координат, а прямая останется прежней. После замены получим:

= 0,               .

     Часто удобно перейти к стандартизованному масштабу:

                          ,                      .

Уравнение регрессии в стандартизованном масштабе примет вид: ,

 где . Связь между обычным и стандартизованным масштабом  выражается следующим образом:  

,                 .

И, наконец, коэффициенты регрессии могут быть определены с помощью ППП Excel, Statgraphic.

     Параметр  называют коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Формально  - значение у при х = 0. Если х не имеет и не может иметь нулевого значения, то  у =  не имеет смысла. Параметр  может не иметь экономического содержания, и попытка его интерпретировать может привести к абсурду. Интерпретировать можно лишь знак : если  > 0, то относительное изменение результата происходит медленнее, чем изменение фактора.

Пример. Предположим по группе предприятий, выпускающих один и тот же вид продукции, рассматривается функция издержек  . Информация, необходимая для расчета   и  дана в таблице.

№ предприятия

1

2

3

4

5

6

7

Выпуск продукции, х

1

2

4

3

5

3

4

Затраты на производство, у

30

70

150

100

170

100

150

 

Решение.

1)                     По данным таблицы определим: , , , ,     .

                  2)   =

                        

  Уравнение регрессии примет вид: у = -5,789 + 36,842 х.

 

Допустим, что  вы имеете четыре наблюдения для X иY, и перед вами поставлена задача получить оценки значений в уравнении           

Оцененное уравнение записывается как:

       (7)

В качестве первого шага нужно определить, что понимается под остатком для каждого наблюдения. Это разность между действительной величиной Y в соответствующем наблюдении и расчетным значением по уравнению регрессии:

            (8)

Подставив соотношение (7) в формулу (8), мы получим:

        (9)

При выполнении определенных условий метод наименьших квадратов (МНК) дает несмещенные и эффективные оценки . По этой причине МНК является наиболее популярным при использовании методов регрессионного анализа в относительно простых приложениях.

Геометрическая интерпретация МНК. Матричная форма определения коэффициентов.

     Рассмотрим n-мерное векторное пространство Rn со стандартным евклидовым скалярным произведением

(Х,У) = ХТУ = . Пусть

    ,     ,   ,   .

Здесь  и - числовые коэффициенты, - вектор, лежащий в плоскости, образованной векторами S и Х ( естественно, что S и Х неколлинеарны, т.е. у Х не все числа одинаковы). Задача состоит в отыскании таких  и , чтобы длина вектора е была минимальна. Очевидно, что решением является такой вектор , для которого вектор е перпендикулярен плоскости, образованной S и Х. Для этого необходимо, чтобы

*       ,    и  или   ,

т.е. опять пришли к стандартным нормальным уравнениям. Обозначим теперь

 ,    ,   условие ортогональности е плоскости (S,X) запишется так ХТе = 0 или ХТ(У - Х) = ХТУ - ХТХ = 0  ХТУ = ХТХ и

                                       .

Нетрудно проверить, что все соотношения для  и  совпадают.

 

Тема №8. Интерпретация уравнения регрессии.

Представим простой способ интерпретации коэффициентов линейного уравнения регрессии:

        (10)

когда Y  и X-переменные с простыми, естественными единицами измерения. Во-первых, мы можем сказать, что увеличение X на одну единицу (в единицах измерения переменной X) приведет к увелечению значения Y на  единиц (в единицах измерения переменной Y). Вторым шагом является проверка, каковы действительно единицы измерения Y  и X, и замена слова “единица” фактической единицей измерения. Третьим шагом является проверка возможности более удобного представления результата без потери его сущности. Постоянная дает прогнозиремое значение Y (в единицах Y), если X=0. Это может иметь или не иметь явного смысла в зависимости от контекста.

 

Тема №9. Качество оценки. Коэффициент детерминации.

Цель регрессионного анализа состоит в объяснении поведения зависимой переменной. Пусть для этого по выборочным данным построено уравнение регрессии. Тогда значение у в каждом наблюдении можно разложить на две составляющие , где е – остаток, т.е. та часть, которую невозможно объяснить. Разброс значений зависимой переменной характеризуется выборочной дисперсией

D(y) = D () = D () + D (e) + 2cov (, e).

Cov (, e) = cov (                               

              D(y)        =           D()        +        D(e)

      общая дисперсия       факторная дисперсия,              остаточная дисперсия,   

                                           объясненная уравнением          необъясненная

Коэффициентом детерминации R2 называют отношение   ,

характеризующее долю вариации зависимой переменной, объясненную уравнением регрессии, .

Если R2 = 1, то  D(y) = D(), D(e) = 0, т.е. все точки наблюдений лежат на регрессионной прямой.

 Если R2 = 0, то регрессия не дает ничего, линия регрессии параллельна оси Ох.

Чем ближе R2  к 1, тем более точно  аппроксимирует у.

 Вычисление R2 корректно, если  включено в уравнение. Полезны следующие соотношения:

;             .

Для определения статистической значимости R2 проверяется гипотеза

                    Н0: R2 = 0 с помощью статистики F =   .

Если F < Fкр(, то Н0 нет оснований отвергать или R2 статистически не значим, в противном случае – значим. В случае парной регрессии R2

Тема 2

 Свойства коэффициентов регрессии и проверка гипотез

 

 Предложения о случайном члене. Условия Гаусса-Маркова.

 

  1. Предложения о случайном члене
  2. Условия Гаусса-Маркова

 

1.До сих пор мы занимались оценкой коэффициентов регрессии. Уравнение зависимости объясняемой переменной  от объясняющей переменной   в координатной форме имеет вид

                                               (5.6)

Допущения, лежащие в основе регрессионного анализа являются условия Гаусса-Маркова.

1.      Математическое ожидание случайного члена в любом наблюдении должно быть равно нулю, т.е.

2.      Дисперсия случайного члена должна быть постоянной для всех наблюдений, т.е.

-константа, 

3.      Случайные члены являются статистически независимыми друг от друга, т.е.

4.      Значения объясняющих переменных   и  ошибок   независимы друг от друга, т.е.

5.      Объясняющая переменная неслучайная. Это означает, что мы имеем фиксированный набор значений 

Если выполняются условия Гаусса-Маркова, то оценки коэффициентов линейной регрессии, полученные с помощью МНК, являются наилучшими оценками, т.е. несмещенными, эффективными и состоятельными.

Наряду с условиями Гаусса-Маркова относительно случайного члена предполагается нормальность его распределения. Напомним, что понятие нормального распределения была рассмотрена во главе II п.2.3.. Так как  и  то график плотность имеет вид шапочки представленную на рисунке 2.2 п. 2.3. гл.II.

Дадим трактовку условий Гаусса-Маркова.

Первое условие означает, что случайный член не должен иметь систематического смещения. Случайные члены будут иметь либо положительные, либо отрицательные знаки. По условию Гаусса-Маркова средние значения отклонений в любом наблюдении равно нулю. Это значит положительные и отрицательные значения уравновешиваются. Случайный член не должен иметь больше смешении ни в одну сторону. Если постоянный член включен в уравнении регрессии, то это условия выполняется автоматически.

Второе условия означает дисперсии для любых наблюдений постоянно.

Под дисперсией  имеется  в виду возможное поведение случайного член до того, как сделана выборка. Величина  неизвестна и одна из задач регрессионного анализа состоит в её оценке.

Постоянство дисперсии случайного члена для любого наблюдения называется гомоскедастичностью (что означает одинаковый разброс).

Изменение дисперсии с изменением номера наблюдения называется гетероскедастичностью.

Таким образом:

·         -константа  - гомоскедастичность;

·         -гетероскедастичность.

На следующих рисунках показаны характерные диаграммы рассеяния случайных членов в случае гомоскедастичности и гетероскедастичности.

               Рис.5.1                                               Рис.5.2

             Если условие гомоскедастичности не выполняется, то оценки коэффициентов регрессии будут неэффективными, хотя и несмещенными.

Третье условие предполагает отсутствие систематической связи между значениями случайного члена в любых двух наблюдениях. Появление одного случайного члена не связана появлением другого случайного члена третье условие Гаусса-Маркова можно записать в другом виде. Поскольку

Так как   то 

Если это условие не выполняется, то регрессия, по методу наименьших квадратов, дает неэффективные оценки.

Четвертое условие  Гаусса-Маркова может быть рассмотрено в двух формах - слабой и сильной. Сильная форма заключается в том, что объясняющая переменная не содержать случайных составляющих. Объясняющая переменная по существу является стохастической. Слабая форма этого условия состоит в том, что объясняющие переменные могут содержать случайные компоненты, но они должны быть распределены независимо от случайного члена.

Если данное условие выполнено, то теоретическая ковариация Это следует из того что  В самом деле

Пятое условие является особенно важным. Если условие о не случайности объясняющий переменной не выполняется, то оценки коэффициентов регрессии оказываются смешенными и несостоятельными. Это связано с ошибками измерения объясняющих переменных. Оценки коэффициентов регрессии обладают теми же основными свойствами, что и оценки, полученные при использовании условия о не случайности объясняющей переменной.

 

Тема №2. Проверка статистических гипотез

 

Статистической гипотезой  называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.

Например, случайная величина  распределена по нормальному закону или математическое ожидание нормально распределенной величины равно 5.

Нулевой (основной )называют выдвинутую гипотезу  Конкурирующей (альтернативной) называют гипотезу  которая противоречит основной. Например, если нулевая гипотеза утверждает, что математическое ожидание нормального распределения равно 5, то альтернативная гипотеза отрицает это утверждение. Эти утверждения записываем в виде Правильности или неправильности выдвинутых гипотез проверяют статистическими методами.

Статистическим критерием называется случайная величина, которая служит для проверки нулевой гипотезы. В качестве статистического критерия выбирают случайную величину, распределение которой подчиняются либо нормальному закону, либо распределению Стьюдента (t-критерий), либо F-распределению, либо -распределению и т.д.

Наблюдаемым значением критерия  называется значение критерия, вычисленное по данным выборки и обозначается

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают. Областью принятия гипотезы называют совокупность значений критерия, при которых гипотезу принимают.

Критическими точками называют точки, отделяющие критическую область от области принятия гипотезы.

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области. Расположение критических областей и области принятия гипотезы в случаях односторонних и двусторонних изображены на следующих рисунках.

 

                          

Рис. 2.4. а)  левосторонняя критическая область

 

    

Рис. 2.4. б)  правосторонняя критическая область

               

Рис. 2.4 в) двусторонняя критическая область.

 

Для проверки гипотез задается уровень значимости  В экономических исследованиях проверку гипотез осуществляют при 5% и 1%-ном уровнях значимости, которые называются стандартными уровнями.

Одно и двусторонние тесты связаны формулировкой альтернативной гипотезы.

Пусть  точное значение параметра генеральной совокупности,  её гипотетическое значение.

1.        Если альтернативная гипотеза имеет вид,  то выбирают правостороннюю критическую область. Если решение должно быть принято с 5%-ным уровнем значимости, то выбирается единственная граница решения, как показана на следующем рисунке

Рис.2.5

2.        Если альтернативная гипотеза имеет вид  то выбирают левостороннюю критическую область. В этом случае на 5%-ном уровне значимости области принятия и отклонение гипотезы имеет вид

Рис.2.6

3.        Если альтернативная гипотеза имеет вид,  то выбирают двухстороннюю критическую область. Если проверка осуществляется с 5%-ом уровнем значимости, то границы расположены симметрично относительно средней и область принятие гипотезы  имеет вид

Рис.2.7.

В эконометрике в качестве критерия проверки нулевой гипотезы используется случайная величина, подчиненная распределению Стьюдента которая обозначается через t (t-статистика), а если используется случайная величина, подчиненная распределению Фишера – через F (F-статистика)

 

Тема №3. Множественная линейная регрессия. Оценка параметров методом наименьших квадратов (МНК)

 

Рассмотрим линейную модель множественной регрессии.

                                      (6.2)

Где  -параметры модели (коэффициенты регрессии),подлежащие оцениванию по выборке,- объясняющие переменные, рассматриваются как неслучайные величины, т.е. они измерены без ошибок,- случайный член.

Уравнение регрессии (6.2) характеризует зависимость среднего значения  от объясняющих переменных 

Коэффициент регрессии   в уравнении (6.2) показывает, на какую величину в среднем изменится результативный признакесли переменную  увеличить на единицу при неизменных значениях остальных объясняющих переменных, входящих в уравнение регрессии. Это легко проверяется прибавлением  к   единицу. Будем иметь

Для оценки параметров модели имеются исходные данные  - наборы значений зависимой переменной  и независимых факторов (объясняющих переменных)

                                                     (6.3)

На основе набора данных получим систему соотношений

                                      (6.4)

Запишем  (6.4) в  матричной форме

                                                                                 (6.5)

где -вектор, столбец (размерности )значений объясняемой переменной;

-матрица (размерности  значений объясняющих переменных;

-вектор-столбец (размерности (к+1)) неизвестных параметров, которые подлежат   оцениванию по выборке;

-вектор столбец (размерности ) случайных членов.

Для оценки вектора неизвестных параметров  применим метод наименьших квадратов. Оценка осуществляется  из условия минимизации скалярной суммы квадратов  по компонентом вектора

                                                   (6.6)

Пусть оценкой вектора   является вектор   Тогда условия минимизации запишется в виде

                                  (6.7)

где   вектор остатков размерности 

Раскрывая скобки и используя свойства транспонированной матрицы условию минимизации  (6.7) запишем в виде

                                       (6.8)

Где  транспонированная матрица  Условия обращения S в минимум является обращения в нуль частных производных S по компонентом вектора b

или в матричной форме

Дифференцируя (6.8), получим

Отсюда

Умножив обе части последнего уравнения слева на матрицу  обратную матрице  получим 

                                                         (6.9)

Таким образом вектор  определяемой по формуле  (6.9) является оценкой вектора  Как и в модели с парной регрессией, случайный член  удовлетворяет условиям Гаусса-Маркова.

Математическое ожидание случайного члена в любом наблюдении равно нулю, т.е.

Дисперсия случайного члена должна быть постоянной для всех наблюдений, т.е.

 - (константа, )

Случайные члены должны быть статистически независимы(не коррелированны) между собой, т.е.        

            Случайные члены должны быть статистически независимы от объясняющих переменных.

Так как найденные по формуле (6.9) оценки  являются лишь выборочными оценками неизвестных параметров   то возникает вопрос об их качестве. Считается, что оценки качественные, если они являются несмещенными, эффективными и состоятельными.  Оценка параметра является несмещенной, если её математическое ожидание равно оцениваемому параметру:  или

Оценка параметра является эффективной, если она имеет наименьшую дисперсию среди всех возможных несмещенных оценок данного параметра по выборкам одного и того же объёма:

Оценка параметра является состоятельной, если с увеличением числа наблюдений оценка параметра стремится к его значению в генеральной совокупности:

Докажем, что оценки наименьших квадратов являются несмещенными оценками.

Подставив в формулу оценки (6.9) вместо его значение из (6.5) имеем

Откуда

                                             (6.10)

Так как матрица  постоянна и используя 1-ое условие Гаусса-Маркова получим

Это означает что вектор  есть несмещенная оценка вектора

Рассмотрим так называемую ковариационную матрицу вектора оценок b являющуюся матричным аналогом дисперсии одной переменной

                                                     (6.11)

где

Рассмотрим статистический смысл элементов этой матрицы. На главной диагонали матрицы (6.11)находятся дисперсии элементов вектора оценок т.е.

 Вне главной диагонали ковариационной матрицы расположены значения ковариации коэффициентов.

Ковариационную матрицу запишем в виде

После замены в неё значение разности  и  из (6.10), получим:

Учитывая свойства транспонированных матриц, будем иметь:

откуда

                                   (6.12)

Рассмотрим

Из условия 2-3) Гаусса-Маркова следует, что   для   и   при   тогда

                                 (6.13)

где -единичная матрица размерности

Учитывая (6.13) ковариационную матрицу запишем в виде

                                                      (6.14)

Итак, с помощью обратной матрицы  определяется не только сам вектор b оценок параметров, но и дисперсии и ковариации его компонент. Взяв другую оценку  вектора  легко доказать что дисперсии компонент векторов оценок  и  удовлетворяют неравенством  Это означает, что оценки коэффициентов регрессии, найденных методом наименьших квадратов, обладают наименьшей дисперсией.

Найдем несмещенную оценку   для  остаточной дисперсии  Рассмотрим вектор остатков

Учитывая, что   и    получим:

Откуда

Вычислим

                            (6.15)

Учитывая, что скалярное произведение  и    для всех    будем иметь:

                                                          (6.16)

Матрица   является симметричной, т.е.  то отсюда следует что

 где 

Используя свойства математического ожидания и того что элементы матрицы   являются неслучайными величинами, получим:

Так как   и    при    по условиям  Гаусса-Маркова, и  - след матрицы   равный сумме диагональных элементов. Подставив вместо  его выражение, получим

                       (6.17)

Здесь пользовались свойством следа матрицы 

Подставив  в  (6.15) найденные выражения  (6.16) и  (6.17), получим

Следовательно, несмещенная оценка остаточной дисперсии   вычисляется по  формуле

                                  (6.18)

Легко видеть, что

После того как вычислена ковариационная матрица, легко найти стандартные ошибки оценок структурных параметров. В ковариационной матрице элементы, лежащие на главной диагонали, представляют собой дисперсии   оценок структурных параметров. Тогда

являются стандартными ошибками оценок

 

Тема №4. Множественная регрессия. Модель с двумя

независимыми переменными.

 

Множественный регрессионный анализ является развитием парного регрессионного анализа применительно к случаям, когда зависимая переменная гипотетически связана с более чем одной объясняющей переменной. Большая часть анализа будет непосредственным расширением парной регрессионной модели, но здесь мы сталкиваемся с двумя новыми проблемами. Во-первых, мы должны будем решить проблему спецификации модели.

     Включение в уравнение множественной регрессии того или иного набора факторов связано, прежде всего, с представлением о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

1)      они должны быть количественно измеримы (качественные показатели могут быть проранжированы);

2)      факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной зависимости.

Включаемые факторы должны объяснять вариацию зависимой переменной. Если строится модель с р факторами, то для неё можно определить R2 – коэффициент детерминации, который фиксирует долю объясненной вариации признака. Влияние других,  не учтенных  в модели, факторов оценивается (1–R2) с соответствующей остаточной дисперсией.  При дополнительном включении в регрессию (р + 1)-го фактора коэффициент R2 должен возрастать, а остаточная дисперсия уменьшаться. Если этого не происходит, то включаемый фактор является лишним. Насыщение модели лишними факторами приводит к статистической незначимости параметров регрессии.

   Как и в парной зависимости возможны разные виды уравнений множественной регрессии: линейные и нелинейные. Ввиду четкой интерпретации параметров наиболее широко используются линейная и степенная функции (степенная легко линеаризуется).

  Рассмотрим линейную модель множественной регрессии:

                              .

По выборке объёма n оценивается уравнение регрессии

                               ,

где неизвестные коэффициенты оцениваются МНК, при котором минимизируется сумма квадратов остатков, позволяя получить систему нормальных уравнений:

Решение системы может быть получено, например, по формулам Крамера:            

                                   , при этом

                               .

     Оценим коэффициенты регрессии МНК в матричной форме. Обозначим

     ,

Значения признака            Матрица объясняющих                        Вектор               Вектор                    Вектор

                                            переменных, столбцами                   регрессора j        случайных           коэффициентов

                                            которой являются Xj                                                        ошибок                регрессии

Модель множественной регрессии примет вид

,

где Х – детерминированная матрица, Y и   - случайные   матрицы. Пусть , где  - вектор модельных значений.  Сумма квадратов остатков минимизируется:

.

Необходимые условия получают дифференцированием  по вектору .

      .

Аналогично парной регрессии, можно показать, что вектор остатков е  всем независимым переменным и S = (1…1)T, а вектор  - есть ортогональная проекция вектора Y на гиперплоскость, образованную S и Х. Кроме того,

           ,         .

     Если перейти к стандартизованному масштабу:

,     ,     … ,    ,

уравнение регрессии примет вид:

                                    ,

где коэффициенты могут быть определены из системы уравнений

  ,

здесь

Тема 3

Временные ряды

Общие сведения о временных рядах.

                                                                                                                                    Стационарные временные ряды.

 

1. Основные элементы временного ряда

2. Модели авторегрессии и модели с распределенным лагом

3. Эконометрическое прогнозирование

 

1.Многие эконометрические модели строится с использованием пространственных данных, характеризующие показатели различных объектов в определенный момент времени. Такие модели называются пространственными моделями.

Модели можно построить на основе данных, характеризующие один объект за ряд последовательных моментов (периодов) времени. Рассмотрим несколько примеров наборов данных об одном временном срезе:

1.      Объемы дневных продаж супермаркета за месяц.

2.      Цена на мясо за последние 20лет с учетом инфляции.

3.      Объем  ВВП Республики за последний 25лет.

4.      Ежедневные цены на фондовом рынке.

При анализе социально – экономических явлений часто используют ежегодные, ежеквартальные, ежемесячные, ежедневные данные.

Совокупность значений какого-либо показателя за несколько последовательных моментов (периодов) времени называется временным (динамическим )рядом.

Отдельные наблюдения называются уровнями ряда, которые будем обозначать  (t=1,2,…,n), где n-число уровней.

Временные ряды отличаются от данных об одном временном срезе в том отношении, что в случае временных рядов сама последовательность наблюдений несет в себе важную информацию. С помощью временного ряда мы будем знать, что произойдет дальше. Например, чтобы составить бюджет на следующий квартал, вам требуется достоверная оценка ожидаемого объема продаж. Этот прогноз послужит основой для прогнозирования других показателей бюджета. Проанализировав временной ряд фактических квартальных объемов продаж за последние несколько лет, можно выдать прогноз, который будет представлять собой наиболее достоверную оценку, базирующуюся на общих тенденциях продаж, с учетом любых сезонных колебаний спроса.

Примеры временных рядов.

 

 

 

1.        Годовые объемы выпуска  продукции предприятия в тыс.штук в 2005-2012гг.

Год,t

2005

2006

2007

2008

2009

2010

2011

2012

Объем продукции

 

28

 

26

 

27

 

25

 

23

 

22

 

20

 

20

 

2.        Динамика интернет услуги (млн. сомов) в Кыргызской республике в 2002-2006гг

Год,t

2002

2003

2004

2005

2006

Услуги

67,9

81,3

119,6

189,3

252,3

 

Временные ряды классифируются по следующим признаком:

 

·         В зависимости от того, как выражают уровни ряда состояние явления на определенные моменты времени или его величину за определенные интервалы времени, различают моментные и интервальные временные ряды;

·         В зависимости от наличия основной тенденции в ряду.

·         В зависимости от способа выражения уровней, ряды динамики подразделяются на ряды абсолютных, относительных и средних величин.

·         В зависимости от расстояния между уровнями, ряды подразделяются на ряды динамики с равностоящими уровнями и не равностоящими уровнями во времени.

Уровни динамического ряда в конкретный период времени t, формируется в результате действия разных факторов. Одни из них являются основными, а другие– случайными

В общем виде уровни временного ряда  является функцией от четырех компонент:

·               тренд ряда, плавно меняющаяся компонента, определяющее основное направление развития явления за длительный период времени;(например, рост населения, изменение структуры потребления и т.п.)

·               Z(t)- сезонная компонента, отражающая повторяемость экономических процессов в течение не очень длительного периода(года, месяца, недели и т.п. например объем продаж товаров в конце недели или перевозок пассажиров в летнее время);

·               C(t)-циклическая компонента, отражающая повторяемость экономических процессов в течение длительных периодов. Циклическая компонента состоит из последовательных повышений и понижений, которые не повторяются каждый год и поэтому исключаются из сезонного компонента

·               u (t)-случайная компонента, отражающая влияние не поддающихся учету и регистрации случайных факторов.

Таким образом, уровень временного ряда  является функцией от четырех компонент:

                                                    (7.1)

График временного ряда и его компонент схематически изображены на одном рисунке в одном и том же масштабе.

 

 

Рис. 7.1.

В зависимости от взаимосвязи компонент уровня временного ряда различают две модели: аддитивную и мультипликативную.

Если уровень временного ряда представлена в виде  суммы компонент

                                           (7.2)

то модель  называется аддитивной;

Если  представлен в виде произведений составляющих

                                                     (7.3)

то модель называется мультипликативной.

Следует обратить внимание на то, что в отличие от u(t)  первые три составляющиеявляются закономерными, неслучайными. Важнейшей задачей при исследовании временных рядов является выявление и статистическая оценка основной тенденции развития изучаемого процесса и отклонений от неё, а также – выявление и придание количественного выражения каждой из перечисленных выше компонент, с тем, чтобы использовать полученную информацию для прогнозирования будущих значений ряда.

Перечислим основные этапы анализа временных рядов:

·         Графическое представление и описание поведения временного ряда;

·         Выделение и удаление закономерных (неслучайных) составляющих временного ряда (тренда, сезонных и циклических составляющих);

·         Сглаживание и фильтрация (удаление низко-или высокочастотных составляющих временного ряда);

·         Исследование случайной составляющей временного ряда:

·         Прогнозирование развития изучаемого процесса на основе имеющегося временного ряда;

·         Исследование взаимосвязи между различными временными рядами:

 Имеются разные методы анализа временных рядов. Наиболее распространенными являются методы корреляционного и спектрального анализа, модели авторегрессии и скользящей средней.

Временные ряды могут иметь следующие статистические характеристики:

Среднее арифметическое значение, которое вычисляется по следующей формуле

Дисперсия  математическое ожидание  среднее квадратичное отклонение  могут быть оценены по наблюдениям

Важное значение в анализе временных рядов имеют стационарные временные ряды. Временный ряд  называется строго стационарным или стационарным в узком смысле, если совместное распределение вероятностей  наблюдений  такое же, как и  наблюдений  при любых  и  Другими словами, свойства строго стационарного временного ряда не зависят от начала отсчета времени.

Если средние, дисперсия и ковариация временного ряда постоянны для любого момента времени  т.е.

  и 

то временной ряд называется стационарным в широком смысле.

Простейшим примером стационарного временного ряда, у которого математическое ожидание равно нулю, а ошибки   некоррелированы, является «белый шум».

Временные ряды, образующие белый шум, удовлетворяют следующим условиям:

где

В случае нормального распределения остатков они образуют гауссовский белый шум.

Регрессионные остатки классической модели линейной регрессии по существу является «белым шумом».

В случае, когда значения   независимы и имеют стандартное нормальное распределение, т.е.  данный процесс называется гауссовским «белым шумом».

 

Тема №3. Сглаживание временных рядов.

Тема №4. Метод скользящей средней и экспоненциальное сглаживание.

 

Основной задачей анализа временного ряда, является выявление основной тенденции в развитии исследуемого явления. В некоторых случаях общая тенденция ясно прослеживается в динамике показателя, в других ситуациях тенденция развития четко не просматривается.

Основным методом выявления тенденции развития является сглаживание временного ряда. Имеются различные методы сглаживание динамического ряда. Суть всех этих приемов состоит в замене фактических уровней временного ряда расчетными уровнями, которые в меньшей степени подвержены колебаниям.

1.        Метод скользящего среднего.  Скользящие средние позволяют сгладить как случайные, так и периодические колебания, выявить имеющуюся тенденцию в развитии изучаемого процесса. Идея сглаживание состоит в замене функции «колючим» графиком, на функцию с «гладким» графиком.

1)      Выбирается определенная длина интервала сглаживания l , включающего в себе l последовательных уровней ряда. Для удобства берут длину интервала сглаживания в виде нечетного числа: , так как в этом случае полученные значения скользящей средней приходится на средний член интервала. Чем сильнее колебания, тем шире должен быть интервал сглаживания.

2)      Затем исходный временной ряд следует разбить на участки, каждый из которых содержит  l уровней. Последующий участок сдвигается по отношению к предыдущему на один шаг.

3)      Центральное значение на каждом участке заменяется на значение средней арифметической из уровней ряда, образующих этот участок.

Наблюдения, которые берутся для расчета среднего значения, называются активным участком сглаживания.

При нечетном значении  все уровни активного участка могут быть представлены в виде

                                        (7.7)

где  - центральный уровень активного участка;

 - последовательность из m уровней активного участка, предшествующих центральному;

 - последовательность из m уровней активного участка, следующих за центральным.

Скользящая средняя уровней активного участка вычисляется по формуле

                                         (7.8)

При реализации простой скользящей средней выравнивание на каждом участке осуществляется с помощью линейной функции  коэффициенты  определяются МНК по данным временного ряда , входящих в длину усреднение.

Процедура сглаживания приводит к устранению периодических колебаний во временном ряду, если длина интервала сглаживания берется равной или кратной периоду колебания.

При четном числе уровней скользящая средняя вычисляется следующим образом

                           (7.9)

Для устранения сезонных колебаний, используются скользящие средние с длиной интервала сглаживания, равной 4 или 12:

 

Контрольные вопросы

 

1.      Что такое временной ряд? Перечислите основные элементы временного ряда?

2.      Дайте определение стационарного временного ряда вузком смысле?

3.      Что такое автокорреляция уровней временного ряда?

4.      Дайте определение автокорреляционной функции временного ряда?

5.      Перечислите составляющие уровней временного ряда?

6.      Какие модели временного ряда называется: а) аддитивной?

б)мультипликативной?

7.      Что такое тренд?

8.      В чем состоит суть сглаживание временного ряда?

9.      Опишите метод скользящей средней?

10.  Что такое экспоненциальное сглаживание и как оно проводиться?

Тема 4

 Эконометрическое прогнозирование

 

Прогнозирование с помощью линейного тренда.

1.Линейный тренд

2. Виды эконометрических прогнозов

 

При моделировании тенденции временного ряда часто используется линейная функция от времени. Линейным трендом называется следующая функция

                                                           

гдевыровненные (теоретические) уровни тренда в период времени t,

параметры тренда.

Коэффициент  означает средней выровненный уровень тренда в момент времени коэффициент тренда, характеризующий среднее изменение уровней ряда за единицу времени.

Параметры  и  определяются из условия минимизации

Для определение параметров   и имеем систему линейных уравнений

                                                    

Переходя к средним систему (7.28) можно записать в виде

                                                                 

где  

Из системы  (7.29) находим

                                                                     

                                                                     

Так как суммы   и   легко вычисляются по известным в математике формулам:

то средние  и  определяются следующим образом:

Пример 7.5. Предположим, что значения уровней    в  2006-2012гг.

формировались следующим образом

Год,

2006

2007

2008

2009

2010

2011

2012

20,8

21,1

22,9

24,0

25,9

27,5

30,3

 

Графическое изображение этого временного ряда в системе координат имеет следующий вид

                                                                                                 Рис.7.3. Динамика уровней ряда.

Из рисунка 7.3. видно, что тенденция изменения уровней ряда имеет линейный характер и описывается линейным трендом. Наблюденные значения уровней ряда расположены вокруг линейного тренда с незначительными отклонениями. Линейный тренд описывает равномерное изменение показателя изучаемого процесса.

Линейный тренд обладает следующими свойствами:

·                    Равные изменения за равные промежутки времени;

·                    Если средний абсолютный прирост - положительная величина, то величина относительного прироста, или темпы прироста, постепенно уменьшаются;

·                    Если среднее абсолютное изменение - отрицательная величина, то относительные изменения, или темпы сокращения, постепенно увеличиваются по абсолютной величине снижения к предыдущему уровню;

·                    Если имеется  тенденция к сокращению уровней, а изучаемая величина по определению положительная, то среднее изменение   не может быть больше среднего уровня;

·                    Разность абсолютных изменений за последовательные периоды равна нулю.

С помощью линейного тренда можно построить эконометрическое прогнозирование изучаемого явления. Эконометрическим прогнозированием называется процесс построения умозаключений о будущем на основе эконометрической модели. Прогнозирование базируется на экстраполяции, т.е. На продлении в будущее тенденции наблюдавшейся в прошлом. При прогнозировании предполагается, что во временном ряду присутствует тренд, характер развития показателя обладает свойством инерционности и сложившаяся тенденция не должна претерпевать существенных изменений в течение периода упреждения. Результат процесса прогнозирования представляет собой оценку неизвестного значения прогнозируемой переменной на интервале прогнозирования.

Для  построения прогноза на основе эконометрической модели должны быть выполнены следующие условия:

1)      Наличие модели прогнозируемой переменной;

2)      Стабильность параметров и аналитической формы модели;

3)      Стабильность распределения случайных отклонений модели;

4)      Знание значений объясняющих переменных на интервале прогнозирования.

5)      Допустимость экстраполяции модели за пределы статистических проб.

Существует два вида эконометрических прогнозов: точечные и интервальные. Точечный прогноз представляет собой число, признаваемое наилучшей оценкой значения прогнозируемой переменной на интервале прогнозирования. Интервальный прогноз  представляет собой численный интервал, который с некоторой заданной вероятностью, называемой достоверностью прогноза, содержит неизвестное значение прогнозируемой переменной.

Рассмотрим прогнозирование на основе линейного тренда:

                                                           

В построенную модель вместо переменной времени   подставляется номер интервала прогнозирования,   что дает прогноз  переменной  на интервале

                                                            

Для интервального прогнозирования  задается средняя погрешность прогнозирования, которая представляет собой среднее отклонение прогнозов от фактических значений прогнозируемой переменной на интервале прогнозирования. Средняя погрешность прогноза рассчитывается по формуле

                                          

где дисперсия остатков модели.

Интервал прогнозирования определяется для заданной достоверности прогноза  так, что

                                                

где нижняя граница интервала прогнозирования рассчитывается следующим образом

                                                        

верхняя граница интервала прогнозирования находим по формуле

                                                         

- значение которого в случае, когда случайные отклонения имеют нормальное распределение, выбирается из таблицы функции нормального распределения для заданной достоверности прогноза Обычно значения  берут на уровне  0,90; 0,95; 0,99.

 

 

Контрольные вопросы.

 

1.      Какую роль играет при прогнозировании стабильность аналитической формы модели?

2.      Какой прогноз называется: точечным? Интервальным?

3.      Как проводится прогнозирование на основе линейного тренда?

 

 

Тема 5

 Множественный регрессионный анализ

 

  1. Множественная регрессия.

2.      t-тесты  и доверительные интервалы для множественной регрессии.

  1. Мультиколлениарность.

 

  1.  Множественная регрессия. Модель с двумя независимыми переменными.

Множественный регрессионный анализ является развитием парного регрессионного анализа применительно к случаям, когда зависимая переменная гипотетически связана с более чем одной объясняющей переменной. Большая часть анализа будет непосредственным расширением парной регрессионной модели, но здесь мы сталкиваемся с двумя новыми проблемами. Во-первых, мы должны будем решить проблему спецификации модели.

     Включение в уравнение множественной регрессии того или иного набора факторов связано, прежде всего, с представлением о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

1)      они должны быть количественно измеримы (качественные показатели могут быть проранжированы);

2)      факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной зависимости.

Включаемые факторы должны объяснять вариацию зависимой переменной. Если строится модель с р факторами, то для неё можно определить R2 – коэффициент детерминации, который фиксирует долю объясненной вариации признака. Влияние других,  не учтенных  в модели, факторов оценивается (1–R2) с соответствующей остаточной дисперсией.  При дополнительном включении в регрессию (р + 1)-го фактора коэффициент R2 должен возрастать, а остаточная дисперсия уменьшаться. Если этого не происходит, то включаемый фактор является лишним. Насыщение модели лишними факторами приводит к статистической незначимости параметров регрессии.

   Как и в парной зависимости возможны разные виды уравнений множественной регрессии: линейные и нелинейные. Ввиду четкой интерпретации параметров наиболее широко используются линейная и степенная функции (степенная легко линеаризуется).

  Рассмотрим линейную модель множественной регрессии:

                              .

По выборке объёма n оценивается уравнение регрессии

                               ,

где неизвестные коэффициенты оцениваются МНК, при котором минимизируется сумма квадратов остатков, позволяя получить систему нормальных уравнений:

Решение системы может быть получено, например, по формулам Крамера:            

                                   , при этом

                               .

     Оценим коэффициенты регрессии МНК в матричной форме. Обозначим

     ,

Значения признака            Матрица объясняющих                        Вектор               Вектор                    Вектор

                                            переменных, столбцами                   регрессора j        случайных           коэффициентов

                                            которой являются Xj                                                        ошибок                регрессии

Модель множественной регрессии примет вид

,

где Х – детерминированная матрица, Y и   - случайные   матрицы. Пусть , где  - вектор модельных значений.  Сумма квадратов остатков минимизируется:

.

Необходимые условия получают дифференцированием  по вектору .

      .

Аналогично парной регрессии, можно показать, что вектор остатков е  всем независимым переменным и S = (1…1)T, а вектор  - есть ортогональная проекция вектора Y на гиперплоскость, образованную S и Х. Кроме того,

           ,         .

     Если перейти к стандартизованному масштабу:

,     ,     … ,    ,

уравнение регрессии примет вид:

                                    ,

где коэффициенты могут быть определены из системы уравнений

  ,

здесь  и  - парные коэффициенты корреляции.

Вернуться от стандартизованного масштаба к обычному можно с помощью соотношений:

                                    .

И, наконец, параметры уравнения множественной регрессии можно определить с помощью ППП:

·         ППП Excel:

а) Сервис/Анализ данных/Описательная статистика

б) Сервис/Анализ данных/Корреляция

в) Сервис/Анализ данных/Регрессия

·         ППП Statgraphic:

а) Describe/Numeric Data/Multiple Variable Analysis/ в доп. меню поставить флажки на Summary Statistics, Correlations, Partial Correlations

б) Relate/Multiple Regression.

 

Пример. Известны следующие данные (условные) о сменной добыче угля на одного рабочего Y (т), мощности пласта Х1 (м) и уровне механизации работ Х2 (%), характеризующие процесс добычи угля на 7 шахтах. Предполагая, что между Y, X1, X2 существует линейная корреляционная зависимость, найти её аналитическое выражение.

 

Х1

Х2

Y

1

8

5

5

2

11

8

10

3

12

8

10

4

9

5

7

5

8

7

5

6

8

8

6

7

9

6

6

Решение.

Проверим однородность выборки.

Vy=

30,86067%

 

 

Vx1=

17,26919%

 

 

Vx2=

20,55514%

 

 

Так как все значения меньше 35 %, то выборка однородна, и её можно использовать для анализа.

 

Выводы и интерпретация коэффициентов множественной регрессии.

Как и в случае парной регрессии, мы так выбираем значения коэффициентов регрессии, чтобы обеспечить наилучшее соответствие наблюдениям в надежде получить оптимальные оценки для неизвестных истинных значений параметров.

Необходимые условия первого порядка для минимума, т.е.       (19)

Перегруппировав получаем следующее:

          (20)

Аналогичное выражение можно получить для .

 

2.       t-тесты  и доверительные интервалы для множественной регрессии.

 

Для коэффициентов множественной регрессии t- тесты выполняются так же, как это делается в парном регрессионном анализе. Отметим, что критическое значение t при любом уровне значимости зависит от числа степеней свободы, которое равно n-k: число наблюдений минус число оцененных параметров. Доверительные интервалы определяются точно так же, как и впарном регрессионном анализе, в соответствии с указанным примечанием относительно числа степеней свободы.

Проверка значимости коэффициентов регрессии.

    Как и в случае парной регрессии можно показать, что вектор оценок  имеет нормальное распределение со средним  и матрицей ковариаций , т е.

                                                    .

Таким образом, случайные величины 

 и  имеют распределение Стьюдента с (n-р-1) степенями свободы. В общем случае проверяются гипотезы:  Н0: а = а0    или о значимости     Н0: а = 0

Н0: b = b0                                       Н0: b = 0

Проверка состоит  в следующем:

- если , то нет оснований отвергать Н0 (р- число факторов);

- если , то Н0 отвергают.

     Соответствующие доверительные интервалы для оценок коэффициентов регрессии ():   ()    и    ().

Пример. , k = np1 = 7-2-1 = 4, tkp(0,05;4) = 2,78.

     1)  H0: ,    Н0 отвергается и

          значим при 5 - % -ом уровне значимости.

          Доверительный интервал: (0,698; 1,748).

2)          H0: ,   Н0 принимается и

     не значим.

Доверительные интервалы.

     Наряду с интервальным оцениванием коэффициентов регрессии весьма важным для оценки точности определения зависимой переменной является построение доверительного интервала для функции регрессии или условного математического ожидания зависимой переменной Мх(y). Обобщая соответствующие выражения на случай множественной регрессии, можно получить доверительный интервал:

,

, - стандартная ошибка,  .

Доверительный интервал для индивидуальных значений зависимой переменной yi примет вид:  ,   .

Доверительный интервал для параметра  во множественной регрессии строится аналогично парной модели:    .

Пример. Известно: S2 = 0,4175;  S = 0,64614;

 ;    .

 По данным примера оценить сменную добычу угля на одного рабочего для шахт с мощностью пласта 10 м и уровнем механизации 6,5 %. Найти 95 % -й доверительный интервал для индивидуального и среднего значений и интервальную оценку дисперсии при .

1) (т).

2)      ,     ,

          =.

           .

                      

3)   .

            .

4)  ;

          ;

;

.

 

Оценка надежности результатов множественной регрессии и корреляции.

Для определения статистической значимости R2 проверяется гипотеза

                    Н0: R2 = 0 с помощью статистики F =   .

Если F < Fкр(), то Н0 нет оснований отвергать или R2 статистически не значим,  не значимо и уравнение в целом. В противном случае – уравнение и Rзначимы.

Пример. .  Fkp (0,05;2;4) = 6,94.

Т.к. F > Fkp, то уравнение значимо.

     Оценивается не только значимость уравнения в целом, но и значимость фактора, дополнительно включенного в модель. Мерой оценки включения фактора в модель служит частный F- критерий, Fxi.

     Если оценивается значимость влияния фактора хр после включения в модель факторов х1, х2,…,хр-1, то формула частного F- критерия примет вид:

                              .

В общем виде для xi  .

С помощью частного F- критерия можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор вводится в уравнение последним. Зная Fxi можно определить t-критерий: . Взаимосвязь частного коэффициента корреляции, частного F-критерия и t-критерия для коэффициентов чистой регрессии можно использовать в процедуре отбора факторов (на каждом шаге исключается фактор с наименьшим незначимым значением Fxi или tbi).

 

 

  1. Мультиколлениарность.

Предшествующее обсуждение мультиколлениарности было ограничено случаем двух объясняющих переменных. В моделях с большим числом объясняющих переменных мультиколлениарность также может быть вызвана нестрогой линейной зависимостью между ними. Может оказаться затруднительным различить воздействие одной переменной и линейной комбинации остальных переменных. В модели с двумя объясняющими переменными  нестрогая линейная зависимость автоматически означает высокую корреляцию, но если имеются три или больше переменных, то это не объязательно так. Если теоретическая дисперсия случайного члена мала, то число наблюдений велико и велика дисперсия объясняющих переменных.

Мультиколлинеарность – это коррелированность двух или нескольких объясняющих переменных в уравнении регрессии. Она может быть функциональной (явной) и стохастической (скрытой). При функциональной мультиколлинеарности  матрица ХТХ– вырождена и, (ХТХ)-1 не существует, поэтому невозможно определить . Чаще мультиколлинеарность проявляется в стохастической форме, при этом МНК – оценки формально существуют, но обладают рядом недостатков:

1) небольшое изменение исходных данных приводит к существенному изменению оценок регрессии;

2) оценки имеют большие стандартные ошибки, малую значимость, в то время как модель в целом является значимой (высокое значение R2);

3) расширяются интервальные оценки коэффициентов, ухудшая их точность;

4) возможно получение неверного знака у коэффициента регрессии.

Обнаружение.    

Существует несколько признаков, по которым может быть установлено наличие мультиколлинеарности.

     Во-первых, анализ корреляционной матрицы парных коэффициентов корреляции:

                             

   - если имеются пары переменных, имеющих высокие коэффициенты корреляции (> 0,75 – 0,8), говорят о мультиколлинеарности между ними;

   - если факторы некоррелированы, то det Q = 1, если полная корреляция, то det Q = 0.

Можно проверить Н0: det Q = 1; используя статистический критерий      , где n – число наблюдений, m = р+1.

Если , то Н0 отвергается, и мультиколлинеарность доказана.

Во-вторых, определяют множественные коэффициенты детерминации одной из объясняющих переменных и некоторой группой других.  Наличие высокого R2 (> 0,6) свидетельствует о мультиколлинеарности.

В третьих, близость к нулю  - минимального собственного значения матрицы ХТХ (т.е. решения уравнения ) свидетельствует о близости к нулю и det(XTX) и, следовательно, о мультиколлинеарности.

В-четвертых, высокие частные коэффициенты корреляции.

, где - алгебраические дополнения элементов  матрицы выборочных коэффициентов корреляции. Коэффициенты частной корреляции более высоких порядков можно определить через коэффициенты частной корреляции более низких порядков по рекуррентной формуле:

.

      В-пятых, о присутствии мультиколлинеарности говорят некоторые внешние признаки построенной модели, являющиеся её следствиями. К ним следует отнести такие:

  • некоторые из оценок имеют неправильные с точки зрения экономической теории знаки или неоправданно большие по абсолютной величине значения;
  • небольшое изменение исходных статистических данных (добавление или изъятие некоторых наблюдений) приводит к существенному изменению оценок коэффициентов модели, вплоть до изменения их знаков;
  • большинство или даже все оценки коэффициентов регрессии оказываются статистически незначимыми по t-критерию, в то время как модель в целом является значимой по F-критерию.

Существует и ряд других методов определения мультиколлинеарности.

     Если основная задача модели – прогноз будущих значений зависимой переменной, то при достаточно большом коэффициенте детерминации R2 (> 0,9) наличие мультиколлинеарности обычно не сказывается на прогнозных качествах модели. Это утверждение будет обоснованным, если и в будущем между коррелированными переменными сохранятся те же соотношения.

     Если целью исследования является определение степени влияния каждой из объясняющих переменных на зависимую переменную, то наличие мультиколлинеарности, приводящее к увеличению стандартных ошибок, скорее всего, исказит истинные зависимости между переменными. В этой ситуации мультиколлинеарность является серьезной проблемой.

 

Способы устранения мультиколлинеарности.

Отбор наиболее существенных факторов.

  

      Единого метода устранения мультиколлинеарности, годного в любом случае, не существует. Это связано с тем, что причины и последствия мультиколлинеарности неоднозначны и во многом зависят от результатов выборки. Все методы, которые могут быть использованы, делятся на две категории: к первой относятся попытки повысить степень выполнения условий Гаусса-Маркова, ко второй – использование внешней информации.

1. Так как проблема практически всегда возникает в регрессиях по временным рядам, то можно увеличить число наблюдений (от ежегодных к поквартальным). Однако надо не забывать об усилении автокорреляции и ошибок измерения.

2. При перекрестных данных можно увеличить дисперсию наблюдений независимых переменных в выборке.

3. Отбор наиболее существенных факторов. Можно использовать процедуры пошагового включения или исключения факторов. Например, процедура пошагового отбора состоит в следующем:

а) строят уравнение регрессии с полным набором факторов;

б) определяют матрицы парных и частных  коэффициентов корреляции;

в) отбирают фактор с наименьшей (отбор) или наибольшей (включение) величиной коэффициента частной корреляции по t-критерию: , r – должен быть существенным для включения и несущественным для исключения;

г) строят новое уравнение регрессии:

- при отсеве – пока все факторы не будут существенно отличны от нуля;

- при включении – пока увеличивается .

4. Переход от несмещенных оценок к смещенным, т.е.

           , где - некоторое положительное число (=0,10,4). Таким образом,  - невырожденная, увеличивается определитель, и уменьшаются ошибки параметров.

5. Переход от исходных объясняющих переменных к новым, представляющим линейные комбинации исходных. В качестве таких переменных используют, например, главные компоненты вектора исходных объясняющих переменных (Метод главных компонент).

 

Контрольные вопросы

  1. Модели с двумя переменными
  2. Как интерпретируется коэффициенты множественной регрессии
  3. Дайте определение понятию мультиколлинеарность
Название: Электронный учебно-методический комплекс по дисциплине "Эконометрика (прод. уровень)" для магистрантов 1 курса (1-семестр) для направлений "Экономика"
Автор(ы): к. э. н., и.о. доцент- Супаева Гулназ Тынаевна

  Глоссарий

 

Автокорреляция - явления взаимосвязи между рядами: первоначальным и этим же рядом, сдвинутым относительно первоначального положения на моментов времени.

Авторегрессия-регрессия, учитывающая влияние предыдущих уровней ряда на последующее.

Аддитивная модель временного ряда- модель, в которой все компоненты ряда динамики представлены как сумма этих составляющих

                                                    

Верификация модели- проверка истинности модели, определение соответствия построенной модели реальному экономическому явлению.

Гетероскедастичность-неоднородность относительно дисперсии остатков т.е. дисперсия остатков не является постоянной.

Идентификация модели-проведение статистического анализа модели и оценивания качество ее параметров, установление соответствия между приведенной и структурной формами модели.

Ковариация-сопряженность вариации двух признаков и представляет собой статистическую меру взаимодействия двух случайных переменных.

Корреляционная зависимость это связь, при которой каждому значению независимой переменной х соответствует определенное математическое ожидание (среднее значение) зависимой переменной у.

Множественная корреляция-это зависимость между результативным признаком и двумя и более факторными признаками, включенными в исследование.

Множественная регрессия- характеризует связь между результативным признаком и двумя и более факторными признаками.

Мультиколлинеарность-это тесная зависимость между факторными признаками, включенными в модель.

Мультипликативная модель временного ряда-модель, в которой факторы влияния представлены в виде произведения составляющих  .Такую модель применяют в случае, если происходят существенные сезонные изменения.

Параметризация-определения вида экономической модели, выражение в математической форме взаимосвязи между ее переменными, формулирование исходных предпосылок и ограничений модели.Парная корреляция-это связь между двумя признаками (результативным и факторным или двумя факторными)

Парная регрессия - характеризует связь между двумя признаками: результативным и факторным.

Пространственные данные - набор сведений по разным объектам, взятым за один и тот же период времени.

Ряд динамики - это ряд последовательно(в хронологическом порядке)расположенных статистических показателей, изменение которых имеет определенную тенденцию развития изучаемого явления.

Статистическая зависимость- это связь, при которой каждому значению независимой переменной  х  соответствует множество значений зависимой переменной у ,причем неизвестно заранее, какое именно значение примет  у .

Тренд-это основная достаточно устойчивая тенденция во временном ряду, более или менее свободная от случайных колебаний.

Экзогенные (независимые)-это переменные, значения которых задаются извне модели.

Эндогенные (зависимые)-это переменные, значения которых определяются внутри модели.

Адаптивные модели – математические модели, используемые в сочетании с человеко-машинными процедурами в принятии решений, в которых основываются лишь на предположении о существовании некоего обобщенного критерия задачи многокритериальной оптимизации, а необходимая дополнительная информация получается лицом,

принимающим решение (ЛПР) последовательно, одновременно с анализом  множества альтернатив. Применение А.м. целесообразно, когда ЛПР затрудняется в оценке вклада

частных критериев в интегральный критерий. А.м. выгодны тем, что в процессе выработки решения используется информация, поступающая как от ЭВМ, так и от самого ЛПР.Важным преимуществом является и то, что перед специалистом последовательно проходит развитие модели многокритериальной ситуации от начального состояния к некоторому промежуточному (или окончательному) решению, что способствует более объективной оценке возможности улучшения значений обобщенных критериев. Существуют различные подходы к построению адаптивных человеко-машинных процедур.

Аддитивный критерий (критерий справедливой абсолютной уступки) – критерий оптимальности, относящийся к группе прямых априорных методов многокритериальной оптимизации, сформулированный в виде суммирования выходных параметров (критериев оценки) исследуемого объекта. В А.к. используется следующий прием свертки нескольких критериев kij в обобщенный критерий (тенденция которого может быть к min или к mах):

,

или в матричной форме – U = К ґ W, где wj – коэффициент важности (вес) j-го кри-

терия; U = [u (хi)] – матрица-столбец критерия u; K kij – нормализованная критериальная матрица; W = [wj] – матрица-столбец коэффициентов веса. Принцип справедливой абсолютной уступки приводит к утверждению, что оптимальное решение означает максимизацию суммы нормированных частных критериев. Метод имеет строгое математическое обоснование. Однако введение весовых коэффициентов создает существенные трудности, один из путей преодоления которых состоит в применении экспертных оценок.

Алгоритм – 1) совокупность предписаний, необходимая и достаточная для решения какой-либо конкретной задачи; 2) совокупность правил, определяющих эффективную процедуру решения любой задачи из некоторого заданного класса задач. Понятие А использовалось в математике давно, но как математический объект исследуется в связи с

решением ряда проблем оснований математики с 30-х гг. XX в. Тогда же были разработаны основные понятия теории алгоритмов. В связи с развитием ЭВМ и их широким применением понятие А стало одним из центральных в прикладной математике.

Алгоритмическая модель – математическая модель, представленная в форме алгоритма, перерабатывающего заданный набор входных данных в заданный набор выходных данных.А.м. применяют, когда использование аналитических (расчетных) моделей затруднено либо нецелесообразно. Частным видом А.м. являются имитационные модели.

Анализ – 1) изучение, научное исследование чего-либо, основанное на расчленении целого на составные части; 2) исследование объектов и явлений окружающего мира, основанное на изучении их внутренней структуры, закономерностей поведения или внешнего проявления их свойств. Анализ в САПР – проектная процедура или группа проект.

Аналитическая модель – математическая модель, представляющая собой совокупность аналитических выражений и зависимостей, позволяющих оценивать определенные свойства моделируемого объекта. Аналитические модели могут относиться к функциональным моделям (совокупность явных зависимостей выходных величин от входных), геометрическим (совокупность уравнений поверхности и (или) линий, задаю-их геометрическую форму моделируемого объекта), к обеспечению программному.

Априорные модели – математические модели, используемые в принятии многокритериальных решений, в которых структура и вид обобщенного критерия постулируются вначале, т.е. вся информация, позволяющая определить наилучшее решение, скрыта в формальной модели задачи.

Архиватор – программа или программный пакет, предназначенный для «сжатия» (архивации) файла или группы файлов с целью уменьшения занимаемого файлами дискового пространства.

Временной ряд – это последовательность наблюдений, упорядоченных во времени (или пространстве). Если какое-нибудь явление наблюдают на протяжении некоторого времени, имеет смысл представить данные в том порядке, в котором они возникали, из-за того, в частности, что последовательные наблюдения могут быть зависимыми. В. р. хорошо представлять на диаграмме рассеяния. Значение ряда Х откладывают по вертикальной оси, а время t – по горизонтальной. Время называют независимой переменной.Существует два типа временных рядов:

1. Непрерывные, в которых мы имеем наблюдения в каждый момент времени, например, показатели детектора лжи, электрокардиограммы. Их обозначают как наблюдение Х в момент t, X(t).

2. Дискретные, в которых наблюдения делаются через некоторые (обычно одинаковые) интервалы времени. Их обозначают Xi.

Примеры

1. Экономические: недельные цены на акции; месячные прибыли.

2. Метеорологические: дневные осадки; скорость ветра; температура.

3. Социологические, показатели преступности (например, число арестов), показатели безработицы.

Генеральная совокупность – это (как правило, лишь воображаемое) полное собрание объектов (людей, животных, растений или вещей), являющееся источником данных. Она представляет все множество статистических единиц (группу интересующих нас предметов).

Информацию о генеральной совокупности мы получаем, изучая выборки из нее; из каждой совокупности можно сделать много разных выборок. По выборке мы получаем информацию об интересующих нас параметрах совокупности. Например, выборочное среднее дает информацию о среднем всей совокупности. Важно, чтобы перед формированием выборки исследователь тщательно и полно определил генеральную совокупность, а также способ извлечения выборки. Выборка должна быть репрезентативной.

Гетероскедастичность – условие, когда дисперсии регрессионных остатков не отвечают условию гомоскедастичности. См. гомоскедастичность дисперсии.

Гистограмма – это способ представления данных, измеренных в интервальной шкале (как дискретных, так и непрерывных). Часто используется в разведочном анализе данных для иллюстрации основных характеристик распределения. Гистограмма делит диапазон возможных значений множества данных на классы, или группы. Каждой группе соответствует прямоугольник, длина которого равна диапазону значений в заданной группе, а площадь пропорциональна числу наблюдений в этой группе. Это означает, что прямоугольники скорее всего будут различаться по высоте. Гистограмма годится только для числовых переменных, измеренных в номинальной шкале. Как правило, она используется для больших множеств данных (>100 наблюдений), когда не хотят строить диаграммы ствол-лист. Гистограммы помогают выявить необычные наблюдения (выбросы) и пропуски в множестве данных.

Гомоскедастичность – условие постоянства дисперсий регрессионных остатков.

Корреляция – когда говорят, что две случайные переменные коррелированны,

имеют в виду, как правило, что они друг с другом как-то связаны. Стандартной мерой связи переменных является коэффициент корреляции. Следует, однако, помнить, что он измеряет лишь силу линейной связи.

Коэффициент корреляции – меняется в пределах от -1 до 1, измеряет степень линейной связи двух случайных переменных. Положительное значение коэффициента корреляции означает, что с ростом одной из переменных другая также растет, с убыванием одной из них убывает и другая. Отрицательное значение означает, что с ростом одной из переменных другая убывает, с убыванием одной из них другая растет. Коэффициент корреляции, равный нулю, означает, что между нашими переменными отсутствует линейная связь.Обратите внимание: даже если коэффициент корреляции равен 1 по абсолютной величине и, следовательно, переменные функционально связаны (линейно), ничего нельзя сказать о причинно-следственной связи между ними. В статистической практике в ходу два коэффициента корреляции: для числовых переменных используется коэффициент корреляции Пирсона, для ранговых— коэффициент корреляции Спирмена.

Критерий согласия – проверяют гипотезу о совпадении наблюденной эмпирической функции распределения с теоретической функцией постулируемого распределения. Критерий согласия хи-квадрат делает это путем сравнения наблюденных и ожидаемых частот. Критерий Колмогорова – Смирнова основывается на максимальной разности между эмпирической и постулируемой функциями распределения.

Линейная  регрессия – в линейной регрессии модельное (теоретическое, предсказанное) значение Y является линейной комбинацией значений одного или более предикторов:

У = b0 + b1 Х1 + b2 Х2 +. . .+bk Xk.

Медиана выборки – это точка, по обе стороны которой располагается одинаковое

количество элементов выборки. Если объем выборки нечетен и равен 2n + 1, то медиана

равна элементу вариационного ряда с номером n + 1. Если объем выборки четен и равен 2n, то медиана равна полу сумме элементов вариационного ряда с номерами n и n + 1.

Метод наименьших квадратов – это распространенный метод оценивания параметров. Ищутся оценки, минимизирующие сумму квадратов отклонений между смоделированными (предсказанными) и наблюденными значениями.

Метод максимального правдоподобия – это общий метод вычисления оценок параметров. Ищутся такие оценки, чтобы функция правдоподобия выборки, равная произведению значений функции распределения для каждого наблюденного значения

данных, была как можно большей.М. м. п. лучше работает на больших выборках, где он, как правило, дает оценки с минимальной дисперсией. На маленьких выборках оценки максимального правдоподобия часто оказываются смещенными.

Мультиколлинеарность – два или более предиктора коллинеарны, если  сильна линейная связь между ними; их можно представить в виде линейной комбинации друг друга. Мультиколлинеарность может сделать проводимые для линейной регрессии вычисления неустойчивыми, а то и невозможными, поскольку в этом случае матрицы плохо обусловлены. Кроме того, она может вызвать завышенные оценки стандартных ошибок для коэффициентов при предсказывающих переменных.

Независимость – две случайные переменные независимы, если их совместная плотность распределения равна произведению отдельных (маргинальных) плотностей. Менее формально: две случайные переменные А и В независимы, если информация о значении В не влияет на распределение вероятностей значений А, и наоборот. Выборка взаимно независимых случайных переменных называется независимой выборкой.

Независимая переменная – переменная, используемая для объяснения зависимой переменной. Синонимы: предиктор, объясняющая переменная. Смотрите также зависимую переменную.

Нелинейная регрессия – предполагается, что зависимость отклика от предикторов является нелинейной функцией предикторов.

Однородность – равенство дисперсий переменной, подсчитанных в пределах разных групп. Является стандартным требованием в таких, например, методах, как регрессионный и дисперсионный анализы. Синоним: гомоскедастичность. Антоним: гетероскедастичность.

Производственная функция (production function) – отражает зависимость между количеством применяемых ресурсов и максимально возможным объемом выпускаемой продукции в единицу времени; описывает всю совокупность технически эффективных способов производства (технологий).

Сезонная компонента – один из способов описания временного ряда – разложение его на компоненты: тренд, периодическую и случайную. Когда временная ось связана с датами, а период – с месяцами или кварталами, периодическую компоненту называют сезонной.

Сглаживание, фильтрация – сглаживание применяется для уменьшения иррегулярности (случайных изменений) временных рядов. Распространенным методом сглаживания является сглаживание простым скользящим средним (хотя существуют и другие способы). Способ сглаживания определяется свойствами ряда и целями его обработки.

Статистика – это функция элементов выборки. Дает информацию о неизвестных значениях параметров генеральной совокупности. Например, среднее выборки является, как правило, оценкой среднего совокупности, из которой была взята выборка.

Статистическая независимость – отсутствие связи между переменными. Независимость двух непрерывных переменных часто ошибочно отождествляют с равенством нулю их корреляции (ковариации), однако это верно, только если они подчиняются двумерному нормальному распределению.

Статистический критерий – статистический критерий состоит из следующих компонент: пара гипотез – нулевая и альтернативная, статистика критерия и уровень значимости; по ним находится критическая область.

Проверка гипотезы начинается с вычисления статистики. Если значение попадает в критическую область, мы отвергаем нулевую гипотезу и считаем истинной ее альтернативу. В противном случае у нас нет оснований отвергнуть нулевую гипотезу. Из генеральной совокупности можно сделать много разных выборок, причем значение статистики в общем случае будет меняться от выборки к выборке; другими словами, выборка является случайной, а значит, случайной величиной является и статистика. Например, выборочные средние для разных выборок из одной и той же совокупности мо-

гут различаться между собой.

Статистики обычно обозначают латинскими буквами, а оцениваемые ими параметры – греческими.

Стационарные показатели – показатели, среднее которых можно считать неизменным; нестационарными – называются показатели, среднее которых изменяется со временем.

Системы одновременных эконометрических уравнений являются третьим основным классом моделей, которые применяются для анализа и (или) прогноза. Эти модели описываются системами уравнений, которые могут состоять из тождеств и регрессионных

уравнений, каждое из которых может, кроме объясняющих переменных, включать в себя

также объясняемые переменные из других уравнений системы. Т.е. набор объясняемых переменных связан через уравнения системы.

Таблица сопряженности – таблица (ТС), каждый элемент (клетка) которой соответствует клетке кросс-табуляции. В случае двух факторов клетки ТС располагают так, чтобы элементы одной строки соответствовали одному и тому же значению одного фактора, а элементы одного столбца – одному и тому же значению другого фактора; говорят, что уровни одного фактора расположены по строкам, а другого – по столбцам. Такие таблицы часто обозначают rхc, где r – количество уровней фактора, соответствующего строкам, с – столбцам. В случае трех факторов считают, что ТС состоит из совокупности ТС, каждая из которых соответствует значению третьего фактора, являясь при этом (условной) ТС первых двух факторов. Можно, конечно, построить ТС и для большего числа факторов. В каждой клетке ТС стоит количество элементов соответствующей клетки кросстабуляции.

ТС – не слишком удобный способ представления данных для их визуального анализа, если велико количество уровней факторов, тем более, если велико количество факторов.

Для проверки гипотезы о независимости факторов, по которым построена кросс-табуляция, используется критерий независимости хи-квадрат Пирсона. Для таблиц 2х2 (два фактора, по два уровня у каждого) используется также точный критерий Фишера. Общий метод анализа таблиц сопряженности – лог-линейный анализ.

Тренд – для лучшего понимания временного ряда мы выделяем его основные характеристики. Одной из таких характеристик является тренд. Тренд – это долговременное изменение временного ряда. Это направление (тенденция к повышению или снижению) и скорость изменения временного ряда, при сделанных допущениях о других компонентах.

Циклическая компонента – чтобы лучше понять поведение временного ряда, выделяют его основные характеристики. Одной из таких характеристик является циклическая компонента. В недельных или месячных данных циклическая компонента описывает любые регулярные колебания. Это не сезонная компонента, изменение которой подчиняются некоторому распознаваемому циклу.

Экспоненциальное сглаживание – метод сглаживания временного ряда, используемый для уменьшения иррегулярности (случайных колебаний) временного ряда, что позволяет получить более ясное представление о лежащих в основе этого ряда закономерностях. Используется также для прогнозирования значения ряда (для 1-2 шагов) прогноза.

Экстраполяция – предсказание значения переменной за пределами интервала анализа. Термин применяется, как правило, при анализе временных рядов. Для коротких промежутков времени применяются количественные предсказания, интерполяции. Количественное предсказание далекого будущего, как правило, менее полезно и применяется для указания на необходимость изменения построенной модели. 

Учебно-методическое и информационное обеспечение

 

а) Основная:

 

  1. Доугерти К. Введение в эконометрику. М.: ИНФРА – 1997г.
  2. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основа эконометрики: Учебник для вузов. М.: ЮНИТИ, 1998г.
  3. Тихомиров Н.П., Дорохина Е.Ю. Эконометрика. Учебник «Экзамен» М.: 2003
  4. Орлов А.И. Эконометрика. Учебник «Экзамен» М.,2003г.
  5. Катышев П.К., Пресецкий А.А. Сборник задач к начальному курсу по эконометрике. – М.:дело,1997г.
  6. Кулинич Е.И. Эконометрия – Финансы и статистика,1999г.
  7. Магнус Я.Р., Катышев П.К. Пересецкий А.А. Эконометрика. Начальный курс – М.:дело 1997г.
  8. Андерсон Т. Статистический анализ временных рядов – М.: Мир,1976
  9. Бриллинджер д. Временные ряды: Обработка данных и теория – М.: Мир,1980
  10. Кендал М. Дж., Стюарт А. Многомерный статистический анализ и временные ряды – М,: Наука,1976
  11. Кендал М, Временные ряды – М.: Финансы и статистика, 1981
  12. Феллер Ф. Введение в теорию вероятностей и ее приложения – М,:Мир, Т1,2, 1984
  13. Менкью Н.Г. Макроэкономика М.,1994
  14. Макконелл К, Брю С., Экономикс – М., 1992
  15. Дорнбуш Р., Фишер С.,  Макроэкономика – М.,1997

 

б) Дополнительная:

 

  1. Андерсон Т. Введение в многомерный статистический анализ. М.: Физматгиз, 1963
  2. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление – М.: Мир, 1974 выпуск 1 и 2
  3. Джонстон Дж. Эконометрические методы М.: Статистика,1980
  4. Кендалл М.Дж., Стюарт А. Теория распределений М.: Наука 1966
  5. Математика в социологии. Моделирование и обработка информации М.: Мир,1977
  6. Замков О.О., Черемных Ю.А., Толстопятенко А.В. Математические методы в экономике –М.: Дело и сервис, 1999
  7. Селищев А.С. Макроэкономика, Учебник для вузов М.,2000
  8. Смирнов А.Д. Лекции по макро – экономическому моделированию – М.,2000
  9. Елисеева И.И. и др. Теория статистики с основами теории вероятностей. Под ред. И.И. Елисеевой – М.: ЮНИТИ,2001
  10. Боровков А.А. Математическая статистика. Оценка параметров. Проверка гипотез- М.: Наука,1984

 

Учебные материалы по эконометрике на английском языке  в интернете

 

11.  1. Herman   Bierens (Penn State), http: ekon. La.psu.edu/ /-bbierens/   LECNOTES. HTM.

12.  2. Michael Creel (Barcelona), http// pareto.uab.es / mcreel / Econometrics /ekonometrics. Pdfs.

13.  3. Daniel/ Mc Fadden (Berkeley), http;//elsa.berkeley.edu/users / Powell /e 240b fo2/e 240 b.html.

 

Вопросы теста ещё не готовы