Исследование взаимосвязей между рядами данных

Министерство образования и науки, молодежи и спорта

Одесский национальный морской университет

Кафедра "Системный анализ и логистика"

Дисциплина "Статистика"


Расчетно-графическое задание

на тему: "Исследование взаимосвязей между рядами данных"


Исполнила студентка

ФТТС 3 курс 2 группа

Меленец М.А.

Проверила

Смрковская В.Ю.


Одесса - 2013

План


. Дисперсионный анализ

. Корреляционно-регрессионный анализ


1. Дисперсионный анализ


Необходимо выявить взаимосвязь между случаями несвоевременной доставки (х) и временем работы на рынке (у).

Разобьем данную совокупность на несколько групп по факторному признаку. Так как число групп не должно быть очень большим и очень маленьким, поэтому разобьем совокупность сначала на 4 группы (табл. 1).

m=4: ?3.


Таблица 1

4 группыГруппы по хni?y0,85-3,8415835,533,85-6,84181277,056,85-9,8452049,84-12,857344,86?45264

Среднее значение у для всей совокупности рассчитаем по формуле:


(1)


=5,87.

Группировка на 4 группы не является корректной, поскольку значения во первой, третьей и четвертой группах меньше, чем во второй группе, что не позволяет задать тенденцию взаимосвязи. Поэтому уменьшаем количество групп до 3 (табл. 2).=3: ? 4


Таблица 2

3 группыГруппы по хni?y0,85-4,84251596,364,85-8,8411615,548,85-12,859444,88?45264

Группировка на 3 группы является оптимальной. В общем виде она задает тенденцию взаимосвязи.

На базе аналитической группировки проведем дисперсионный анализ, который позволяет количественно определить тесноту связи.

Рассчитаем общую и межгрупповую дисперсию:


(2)


((4-5,87)2 + (3-5,87)2 + (2-5,87)2 + (2+5,87)2 + (3-5,87)2 + (8-5,87)2 + (10-5,87)2 + (10-5,87)2 + (2-5,87)2 + (9-5,87)2 + (3-5,87)2 + (9-5,87)2 + (9-5,87)2 + (4-5,87)2 + (5-5,87)2 + (6-5,87)2 + (7-5,87)2 + (2-5,87)2 + (8-5,87)2 + (9-5,87)2 + (8-5,87)2 + (10-5,87)2 + (8-5,87)2 + (8-5,87)2 + (10-5,87)2 + (7-5,87)2 + (7-5,87)2 + (7-5,87)2 + (7-5,87)2 + (6-5,87)2 + (6-5,87)2 + (6-5,87)2 + (5-5,87)2 + (2-5,87)2 + (3-5,87)2 + (5-5,87)2 + (4-5,87)2 + (6-5,87)2 + (5-5,87)2 + (5-5,87)2 + (9-5,87)2 + (4-5,87)2 + (3-5,87)2 + (6-5,87)2 + (2-5,87)2) / 45=6,52


(3)


=0,34.

Эмпирический коэффициент детерминации определяется как


(4)


?5,2 %.

Эмпирический коэффициент детерминации показывает, что фактор "Случаи несвоевременной доставки" на 5,2% определяет вариацию результативного признака "Время работы компании на рынке".

Эмпирическое корреляционное отношение определяется как


(5)


=0,224.

Эмпирическое корреляционное отношение показывает, что связь между группировочным признаком "Случаи своевременной доставки" и результативным признаком "Время работы компании на рынке" составляет всего 0,224, т.е. время работы на рынке практически не зависит от случаев несвоевременной доставки.

Для оценки существенности корреляционного отношения используется критерий Фишера при заданном уровне значимости ?=0,05.

Расчетное значение Фишера определяется из формулы:


(6)

=+ ?=-=6,52-0,34=6,18.


Определим табличное значение критерия Фишера, ?3,2.

Так как , то следует утверждать, что группировочный признак не является варьирующим.


. Корреляционно-регрессионный анализ

дисперсионный корреляция регрессия вариационный

Определяем коэффициент корреляции


(7)


где - показатель тесноты линейной связи и коэффициент корреляции, изменяется от -1?r?1.


(8)

(9)


Все необходимые данные указаны в таблице 3.


Таблица 3

хiyix2х3х4xiyi(xi-)2(yi-)2123456780,8540,720,610,523,421,813,51,5232,313,515,344,5616,008,242,1724,7110,2222,174,3411,2214,982,1924,8010,5023,004,3811,0914,982,2234,9310,9424,296,6610,898,242,5386,4016,1940,9720,246,854,542,86108,1823,3966,9128,67,0717,063,03109,1827,8284,2930,36,217,063,5212,2542,88150,0674,0814,983,53912,4643,99155,2731,773,969,83,6312,9646,66167,9610,83,698,243,65913,3248,63177,4932,853,59,83,7913,6950,65187,4233,33,319,83,7413,6950,65187,4214,83,313,53,8514,4454,87208,51192,960,763,9615,2159,32231,3423,42,620,024716,0064,00256,00282,311,284,04216,3265,94266,398,082,1914,984,1816,8168,92282,5832,82,024,544,2917,6474,09311,1737,81,749,84,2817,6474,09311,1733,61,744,544,31018,4979,51341,88431,4917,064,32818,6680,62348,2934,561,24,544,47819,9889,31399,2435,761,14,544,811023,14111,28535,2848,10,517,064,87723,72115,50562,4934,090,421,284,99724,90124,25620,0134,930,281,285,24727,46143,88753,9236,680,081,285,27727,77146,36771,3336,890,061,285,54630,69170,03941,9733,240,00040,025,66632,04181,321026,2833,960,020,026,01636,12217,081304,6636,060,240,026,33540,07253,641605,5231,650,660,766,97248,58338,612360,1013,942,114,988,02364,32515,854137,1124,066,258,248,24567,90559,484610,0841,27,40,769,07482,26746,146767,5136,2812,63,59,29686,30801,777448,4055,7414,210,0210,15102,011030,3010406,0450,520,980,7610,125102,411036,4310488,7150,621,160,7610,269105,271080,0511081,2792,3422,179,810,874118,161284,3713961,0543,4828,623,511,643135,491577,1018357,4334,9237,458,2412,326151,781869,9623037,9073,9246,240,0212,412154,011911,2423718,4924,8247,4714,98?=248,412641775,19?=15311,95?=148745,261396,40?=401,26?=295,34=5,525,87=31,03=2,92=2,56

= -0,18.

Линейный коэффициент корреляции показывает и тесноту, и направление. Поскольку 0 и приближается к нулю, то характеризуется обратной связью другого характера.

Выравнивание динамического ряда будем производить по параболе.

т= a0+a1?x+ a2?x2,


где a0, a1 и а2 - параметры уравнения, которые находим из системы уравнений:


(10)


Решив систему уравнений методом Крамера, получили следующие значения:

а0=0,38; а1=1,31; а2=-1,07.

Уравнение регрессии принимает вид:

т= 0,38+1,31?x-1,07?x2.


Полученные значения указаны в таблице 4.


Таблица 4

хiyiут(yi-)2(ут-)2123450,8540,723,526,521,523-0,108,2435,652,172-1,8214,9859,072,192-1,8814,9860,112,223-1,998,2461,702,538-3,154,5481,442,8610-4,6317,06110,163,0310-5,4717,06128,693,52-8,1414,98196,353,539-8,339,8201,613,63-8,778,24214,363,659-9,099,8223,913,79-9,429,8233,823,74-9,423,5233,823,85-10,090,76254,813,96-10,790,02277,4147-11,501,28301,724,042-11,7914,98311,944,18-12,244,54327,824,29-12,999,8355,814,28-12,994,54355,814,310-13,7717,06385,784,328-13,934,54392,024,478-15,144,54441,584,8110-18,0717,06573,344,877-18,621,28599,634,997-19,731,28655,175,247-22,141,28784,295,277-22,431,28801,085,546-25,200,02965,515,666-26,480,021046,756,016-30,400,021315,186,335-34,200,761605,726,972-42,4714,982336,848,023-57,948,244071,298,245-61,480,764535,499,074-75,763,56663,749,296-79,800,027338,5810,15-95,540,7610283,9310,125-95,950,7610366,5410,269-98,829,810959,1010,874-111,813,513848,1511,643-129,358,2418283,2212,326-145,890,0223030,4812,412-148,1514,9823722,64?=248,41264?=401,26?=149058,58=5,525,87?2=8,92=33312,41

Определим теоретический коэффициент детерминации R2, который покажет долю общей вариационной зависимости переменной, обусловленной регрессией. Он рассчитывается по формуле:


R2= (11)


Из таблицы 4


==;

=.

2=371,35.

Теоретический коэффициент детерминации показывает, что доля общей вариации переменной, обусловленной регрессией, составляет всего 0,081.

Рассчитаем теоретическое корреляционное отношение:


R= (12)

=19,27.

Теоретическое корреляционное отношение показывает, что связь между вариацией факторного признака "Случаи несвоевременной доставки" и вариацией результативного признака "Время работы на рынке" достаточно высокая.

Проверяем значимость уравнения регрессии, используя значение Фишера. Расчетное значение получаем по эмпирическим данным:


(13)



Теги: Исследование взаимосвязей между рядами данных  Контрольная работа  Математика
Просмотров: 40605
Найти в Wikkipedia статьи с фразой: Исследование взаимосвязей между рядами данных
Назад