Построение модели на мультиколлинеарность

Задание к лабораторной работе № 2


На основе показателей, характеризующих социально-экономическое развитие городов и районов Оренбургской области, провести анализ построенной модели на мультиколлинеарность и в случае необходимости устранить мультиколлинеарность.


Исходные данные для анализа

мультиколлинеарность линейный зависимость экономический

Таблица 1 - Значения социально-экономических показателей, характеризующих города и районы Оренбургской области.

YX1X2X3X4X5716,5950031,352226,11329,714791,4416,73552,25135701,342008,045677,952,92630,11-8567,611458,211571,245,5260,17-36522,681821,813704,4640,91410,3717280,552005,233304,5972,71730,17-23702,211583,714367,3958,3430,072327,561283,092127,9652,65740,77-20227,661556,3313657,1516,7670,1590494,931543,572252,9955,6900,22-21387,792376,392242,3881,8210,6-66252,51855,852803,2742,91512,94-38968,181780,371984,0541,23191,8395392,981746,813618,35252150,92-6880,281738,922438,1952,9500,73-12601,5660,662074,2981,2400,08-19203,871614,862172,7811,1510,1227154,791479,7510893,461,914681,11-88359,712791,045723,3140,59981,5253771,062447,894967,231,22210,076046,842109,2520071,131,119846,9222587,219987,581795,3217,61610,1111834,971600,043561,1530,81102,125089,9324662217,0281,82717,11-4358,731663,794551,414,37142,0747042,612252,943384,8405540,3918636,052442,463775,8364,37390,28-31576,963104,972264,221,4550,2912573,252041,391047,46812381,42-27755,42749,792833,9433,36110,23-41927,34992,496881,0755,64480,4319211,061932,971755,2154,21630,172703,441623,233196,66502600,14-18052492,353649,0226,31222,0929131,251848,447148,8310003,86-70126,162688,392784,3925106210,6528860,675245,524229,9738,935040,7693608,096175,0261679,5327,7120026,228735783,878125,7727338,481081800,381526864,987199,352012,3627,321920,3527775,537323,7611170,0131,240332,18321986,135295,2729743,6439,52441313,081476312,516902,3721460,6522,35206626,49144294,9710336,034301,3328,8244920,47710226,746455,67440142,910350,1529769,647020,263446,1412,58790,8540383,387599,743539,325040840,87282356,737508,34

Таблица 2 - Наименование показателей.

ОбозначениеНаименованиеYОбъем инвестиций в основной капитал на душу населения, рублейХ1Удельный вес убыточных предприятий и организаций, в процентах от общего числа предприятийХ2Среднегодовая численность работников, занятых в промышленности, человекХ3Число зарегистрированных иностранных рабочих, в промилле от численности населения в трудоспособном возрастеХ4Сальдированный финансовый результат (прибыль минус убыток) на одно предприятие, рублейХ5Объем платных услуг на душу населения, рублей


Мультиколлинеарность


Термин «мультиколлинеарность» используется для обозначения линейной зависимости или корреляции между двумя и более объясняющими переменными.

Различают полную и частичную мультиколлинеарность.

Если существует функциональная линейная зависимость между объясняющими переменными, то говорят, что существует полная мультиколлинеарность.

Реальная или частичная мультиколлинеарность возникает в случаях существования достаточно тесных линейных статических связей между объясняющими переменными.

Признаки мультиколлинеарности.

Внешние признаки:

.Неоправданно большие с экономической точки зрения коэффициенты уравнения регрессии.

.Небольшие изменения исходных статистических данных приводит к существенному изменению оценок коэффициентов моделей.

.Неправильные с экономической точки зрения знаки отдельных коэффициентов регрессии.

.Среди коэффициентов уравнения регрессии много незначимых, хотя сама модель значима.

.Стандартные ошибки коэффициентов велики настолько, что сравнимы или даже превосходят сами коэффициенты.

.Доверительные интервалы для коэффициентов уравнения регрессии содержат внутри себя точку 0.

Данные признаки являются необходимыми, но недостаточными.

Формальные признаки:

.Среди оценок коэффициентов парной корреляции между объясняющими переменными есть такие, которые по абсолютной величине превосходят значение 0,6.

.Среди оценок коэффициентов детерминации между одной объясняющей переменной и всеми остальными есть такие, которые больше 0,6.

.Необходимым условием плохой обусловленности является маленькое значение определителя матрицы Хт*Х.

.Достаточным условием плохой обусловленности является высокое значение числа обусловленности.

Наиболее простой способ устранения мультиколлинеарности построить линейную модель множественной регрессии, исключая незначимые факторы.


Практическая часть


Модель значима, но из пяти коэффициентов при объясняющих переменных значимы только два - при переменных Х4 и Х5.

Исследование модели на наличие мультиколлинеарности опирается на проверку наличия у модели внешних и формальных признаков.

Итак:

.У коэффициента Х1 отрицательный знак, что с экономической точки зрения неправильно.

.Три из пяти коэффициентов незначимы, хотя сама модель значима (рисунок 1).

.Стандартные ошибки коэффициентов велики настолько, что превосходят сами коэффициенты (рисунок 1).


Рисунок 1 - Внешние признаки наличия мультиколлинеарности


Проанализируем оценку матрицы парных коэффициентов корреляции между объясняющими переменными. Считается, что наличие значимых коэффициентов корреляции, по абсолютной величине превосходящих 0,6, свидетельствует о присутствии мультиколлинеарности.

Для вычисления оценки матрицы парных коэффициентов корреляции в GRETL выбираем пункт Корелляционная матрица. После того, как все 5 объясняющих признака будут перенесены в список выбранных переменных, открываем окно для вычисления оценки матрицы парных коэффициентов корреляции (рисунок 2).


Коэффициенты корреляции, наблюдения 1 - 47 5% критические значения (двухсторонние) = 0,2876 для n = 47

X1X2X3X4X51,0000-0,22410,0125-0,1731-0,3529X11,00000,51080,25740,6122X21,00000,10000,2336X31,00000,3782X41,0000X5Рисунок 2 - Окно для вычисления оценки матрицы парных коэффициентов корреляции


Как видно из рисунка 2, между объясняющими переменными Х2 и Х5 наблюдается тесная связь. Это один из признаков мультиколлинеарности.

Таким образом, можно сделать вывод, что перечисленные ранее проблемы, связанные с незначимыми коэффициентами, неверными знаками коэффициентов являются следствием мультиколлинеарности.

Мультиколлинеарность будем устранять построением линейной модели множественной регрессии на основе только значимых коэффициентов (рисунок 3).


Модель 2: МНК, использованы наблюдения 1-47 Зависимая переменная: Y

КоэффициентСт. ошибкаt-статистикаP-значениеconst1540,231041,341,47910,14624X40,006211060,00053233611,6676<0,00001***X51,067390,2607734,09320,00018***Среднее зав. перемен6921,888Ст. откл. зав. перемен10415,57Сумма кв. остатков8,30e+08Ст. ошибка модели4343,167R-квадрат0,833681Испр. R-квадрат0,826121F(2, 44)110,2759Р-значение (F)7,26e-18Лог. правдоподобие-458,8290Крит. Акаике923,6580Крит. Шварца929,2084Крит. Хеннана-Куинна925,7466Рисунок 3 - ЛММР на основе значимых коэффициентов


Получаем следующую оценку модели регрессии:


(1041,34) (0,0005) (0,26)


Проверка подтвердила нормальный характер распределения регрессионных остатков модели (таблица 1)


Таблица 1 - Результаты проверки гипотезы о нормальности регрессионных остатков модели

№КритерийР-значение1Хи-квадрат0,112Дурника-Хансена0,113Шапиро-Уилка0,0024Лиллифорса05Жака-Бера0,08

Для значимых коэффициентов модели можно построить доверительные интервалы, знание которых позволит получить больше информации о диапазоне влияния исследуемых факторов на результативный показатель - Объем инвестиций в основной капитал на душу населения.

Доверительный интервал имеет вид:


,


Где - оценка коэффициента

- стандартная ошибка оценки коэффициента

- 100%-я точка или квантиль уровня ? распределения Стьюдента.

Для построения доверительных интервалов нам понадобится tкрит, найденное для числа степеней свободы v=n-k-1=47-2-1=44, тогда tкрит=2,015.

Доверительный интервал для коэффициентов при Х4: 0,0049925??4?0,0070075

Доверительный интервал для коэффициентов при Х5: 0,5401??5?1,5879

Интерпретация результатов

Модель регрессии значима, коэффициенты при всех переменных также значимы. Коэффициент детерминации составил 0,83, т.е. 83% вариации объема инвестиций в основной капитал на душу населения можно объяснить сальдированным финансовым результатом на одно предприятие и объемом платных услуг на душу населения, а 17% вариации, вероятно, объясняется неучтенными в модели факторами.

Анализируя отношение результативного и факторных признаков, можем сказать, что при увеличении на 1 единицу сальдированного финансового результата (прибыль минус убыток) на одно предприятие (рублей) объем инвестиций в основной капитал на душу населения (рублей) в среднем увеличится на 0,006 единиц; а при увеличении на 1 единицу объема платных услуг на душу населения (рублей) объем инвестиций в основной капитал на душу населения (рублей) в среднем увеличится на 1,064 единиц.


Теги: Построение модели на мультиколлинеарность  Практическое задание  Менеджмент
Просмотров: 27830
Найти в Wikkipedia статьи с фразой: Построение модели на мультиколлинеарность
Назад