Понятия выборочной теории. Ряды распределения. Корреляционный и регрессионный анализ

Содержание


Введение

Постановка задачи на выполнение курсовой работы (рабочая легенда)

. Основные понятия выборочной теории (тема 7)

.1 Выборочный метод

.2 Построение статистических рядов распределения

.3 Графическое представление рядов распределения

. Теория статистического оценивание параметров распределения (тема 8)

.1 Точечные оценки характеристик положения и мер изменчивости

.2 Интервальные оценки и доверительные интервалы

. Проверка статистических гипотез (тема 9)

.1 Гипотезы о параметрах распределения

.2 Гипотеза о законе распределения

. Корреляционный и регрессионный анализ (тема 10)

.1 Корреляционная зависимость

.2 Уравнение регрессии

Заключение

Список литературы

Приложения


Введение


В данной курсовой работе отрабатываются выборочный метод математической статистики, точечное и доверительное оценивание и проверка статистических гипотез.

Цели выполнения курсовой работы:

·подготовить курсантов к практическому применению методов математической статистики последующих дисциплин; профессионального и математического цикла (фундаментальное изложение которых предполагает использование понятий и методов математической статистики);

·привить необходимые в профессиональной деятельности навыки использования методов математической статистики для обработки и анализа статистической информации, изучить методы построения точечных и интервальных оценок, критерии согласия;

·развить аналитические способности курсантов, логику, интуицию, умение оперировать строгими определениями и проводить строгие доказательства.

В результате выполнения курсовой работы курсант должен приобрести практические навыки решения следующих задач:

·построения точечных и интервальных статистических рядов;

·нахождения точечных и интервальных оценок параметров распределения;

·проверки гипотезы о законе распределения с помощью критериев Пирсона и Колмогорова;

·проверки параметрических гипотез.

При выполнении курсовой работы необходимо провести обработку статистических данных соответствующей таблицы и получить необходимые результаты.

По данным таблиц наблюдения для каждого ряда распределения необходимо:

·вычислить статистики среднего значения, вариации, асимметрии и эксцесса;

·построить гистограмму и полигон частот;

·подобрать гипотетические кривые распределения;

·найти точечные оценки для параметров гипотетических распределений;

·построить доверительные интервалы для параметров нормального распределения;


Постановка задачи на выполнение курсовой работы (рабочая легенда)


В ходе выполнения курсовой работы (КР) необходимо провести исследование конкретной генеральной совокупности, которая представляет собой результаты тестирования 401 курсанта. Тестирование проводилось в целях получения оценки способностей курсантов к восприятию гуманитарных (признак Х) и военно-технических (признак Y) дисциплин.

В результате выполнения заданий КР курсант должен сформулировать конкретные выводы о законе распределения исследуемых признаков, а также о наличии и характере статистической связи между численными оценками способностей курсантов к восприятию гуманитарных и военно-технических дисциплин данной группы обучаемых.

Исследование генеральной совокупности проводится на материале парной выборки объемом n = 20. Такой объем выборки позволяет, с одной стороны, оценить подразделение в составе взвода (учебной группы), с другой стороны, обеспечивает объем вычислений, достаточный для приобретения курсантами необходимых практических навыков. Чтобы выполнить условие репрезентативности выборки, когда все объекты генеральной совокупности имеют одинаковую вероятность попасть в нее, необходимо обеспечить случайность выбора. Поэтому выборку курсанты получают (по заданию преподавателя) с помощью таблицы случайных чисел (см. приложения).

Из генеральной совокупности (Приложение 1), содержащей 401 пару значений признаков Х и Y, выбираются пары с номерами, соответствующими случайным числам, взятым из таблицы Приложения 2.


1. Основные понятия выборочной теории (тема 7)


1.1 Выборочный метод


Изучить:

а) понятия генеральной и выборочной совокупностей-

б) определение состава выборки:

-репрезентативность выборки-

-способы отбора-

-определение достаточного объема выборки.

в) устройство таблицы случайных чисел и правило ее использования при составлении выборки определенного объема.

Математическая статистика - раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений.

Генеральная совокупность (ГС) - множество всех объектов, подлежащих изучению.

Выборочная совокупность (ВС) - совокупность случайно выбранных объектов.

Определение состава выборки: поскольку ГС представляет собой всю изучаемую совокупность, то ее называют основной выборкой. Отбор единиц в ВС может быть повторным и бесповторным.

Для того, чтобы получить наиболее правильные ответы необходимо, чтобы выборка была представительной (репрезентативной), то есть правильно представлять совокупности.

Способы отбора:

1. Случайная выборка - отбор единиц из генеральной совокупности в целом без разделения на группы.

2. Механическая выборка - применяется в тех случаях, когда генеральная совокупность каким - то образом упорядочена.

3. Типическая выборка - используется в тех случаях, когда все единицы генеральной совокупности объединены в нескольких типических групп.

4. Серийная выборка. Сущность: В собственно случайной, либо механической выборке групп элементов проводится сплошная выборка.

Для определения объёма выборки можно воспользоваться таблицей достаточно больших чисел. При неограниченном увеличение число n независимых опытов, частность события А сходится по вероятности к его вероятности в отдельном опыте.


5.


где - величина допустимой ошибки, которую мы можем себе позволить. P- показатель надежности.

Задание 1

1.1 Из генеральной совокупности данных, состоящей из N = 401 пары значений признаков X и Y, имеющих вполне определенное смысловое содержание, выделить систему двух выборок - выборка признака X и выборка признака Y - объемом n = 20.


Случайные числа по 19 варианту1451441831591942402433483613633543552702602195149299296333

X5956636060636260626458596362646461626162Y8382797676848483817981838081848078818381


1.2 Построение статистических рядов распределения


Изучить:

а) понятия варианта, вариационного и статистического рядов распределения и методику их построения-

б) понятия размаха выборки, частоты, относительной частоты (частости), накопленной частоты (частости) признака-

в) понятия интервального ряда, величины (шага) интервала, шкалы интервалов, методику их расчета и построения.

Каждое значение называется вариантом, а изменение этого значения - варьированием.

Различные значения признака являются вариантами, а их последовательность, записанная в возрастающем или убывающем порядке, называется вариационным рядом. Для построения вариационного ряда необходимо упорядочить значения данных .

Статистический ряд - это перечень вариантов и соответствующих им частотам или относительных частот. Для построения необходимо записать значение признаков в возрастающем порядке, частоту признака (кол-во повторений), и относительную частоту.

Частота варианта - число , показывающие сколько раз повториться значение вариант в ряде наблюдений, а его отношение к объему выборки - относительная частота варианта (частость) (). Сумма частостей равна единице или 100 %.

Накопленная частота - сумма частот, накопленная с 1- ого варианта до данного.

Для построения интервального ряда необходимо определить величину, шаг, интервал, рассчитать шкалу интервалов, произвести расчёт интервальных частот.

Вариационные ряды строятся на основе количественного группировочного признака и состоят из двух элементов: вариант и частот.

Вариационные ряды в зависимости от характера вариации подразделяются на дискретные (прерывные) и интервальные (непрерывные). Дискретные ряды распределения основаны на дискретных (прерывных) признаках, имеющих только целые значения.

Интервальные ряды распределения базируются на непрерывно изменяющемся значении признака, принимающем любые (в том числе и дробные) количественные выражения, поэтому значение признаков таких рядах задается в виде интервала.

Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов, необходимо установить оптимальное число групп (интервалов), на которые следует разбить все единицы изучаемой совокупности.

Задание 2

2.1 Для выборок признаков X и Y построить вариационный и статистический ряды распределения.


Таблица 1

Вариационный ряд

X5956636060636260626458596362646461626162

Таблица 2

Статистический ряд

Xi5658596061626364mi11232533miнк12479141720?i0,050,050,10,150,10,250,150,15?iнк0,050,10,20,350,450,70,851


Таблица 3

Вариационный ряд

Y8382797676848483817981838081848078818381

Таблица 4

Статистический ряд

Yi7678798081828384mi21225143miнк235712131720?i0,10,050,10,10,250,050,20,15?iнк0,10,150,250,350,60,650,851

m1нк =m1

mi+1нк = miнк + mi

?i

?1нк =?1

?i+1нк = ?iнк +?i


.2 Для выборки признака X построить интервальный ряд распределения.

Составляем ряд распределения X используя статистический ряд распределения X по формулам:



где максимальное значение X,

- минимальное значение X,

- объем выборки.



Таблица 5

Интервальный ряд для X

Интервалы(55,25-56,75](56,75-58,25](58,25-59,75](59,75-61,25](61,25-62,75](62,75-64,25)Xинт5657,55960,56263,5mi112556miнк12491420?i0,050,050,10,250,250,3?iнк0,050,10,20,450,71

.3 Для выборки признака Y построить интервальный ряд распределения

Составляем ряд распределения Y используя статистический ряд распределения Y по формулам:



где максимальное значение Y,

- минимальное значение Y,

- объем выборки.



Таблица 6

Интервальный ряд

для YИнтервалы(75,25-76,75](76,75-78,25](78,25-79,75](79,75-81,25](81,25-82,75](82,75-84,25)Yинт7677,57980,58283,5mi212717miнк235121320?i0,10,050,10,350,050,35?iнк0,10,150,250,60,651

1.3 Графическое представление рядов распределения


Изучить:

а) понятие полигона распределения и методику его построения;

б) понятие гистограммы и методику ее построения;

в) понятие эмпирической функции распределения и методику ее построения для дискретного и интервального рядов.

Полигон распределения дискретного ряда - ломанная линия последовательно соединяющая в прямоугольной системе координат точки с координатами

Гистограммой частот (частостей) называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины h, а высоты равны плотности частоты или плотность частости.

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

Эмпирической (выборочной) функцией распределения (или функцией распределения выборки) называется функция F*(x), задающая для каждого значения х относительную частоту события Х<х.

Кумулятивная кривая - это график выборочной функции F*(x), дающий приближенное представление о графике теоретической функции F(x)(Кумулята - это сумма накопленных частностей)

Ряд распределения - представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.

Задание 3

3.1 Для выборки признака X построить полигон и эмпирическую функцию распределения для статистического ряда. (По таблице 2)


Рисунок 1


Рисунок 2


.2 Для выборки признака Y построить полигон, гистограмму и эмпирическую функцию распределения для интервального ряда. (По таблице 6.)


Рисунок 3


Рисунок 3


Рисунок 4


2. Теория статистического оценивание параметров распределения (тема 8)


.1 Точечные оценки характеристик положения и мер изменчивости


Изучить:

а) числовые характеристики, описывающие центр распределения (среднее арифметическое, выборочные мода и медиана);

б) нахождение средней арифметической наблюденных значений случайной величины;

в) нахождение моды выборочной совокупности;

г) нахождение медианы выборочной совокупности.

д) понятие и формулы для нахождения выборочных начальных моментов;

е) понятие и формулы для нахождения выборочных центральных моментов;

ж) понятия и формулы для нахождения выборочной дисперсии, исправленной дисперсии, эмпирических коэффициентов асимметрии и эксцесса.

Среднее арифметическое значение выборочной совокупности рассчитывается по формуле:



Мода () - значение признака, которое наблюдалось наибольшее число раз.

Модальный интервал - интервал которому соответствует наибольшая частота(mi ).

Медиана ()(Вариационного ряда)- значение варианта соответствует середине вариационного ряда.

Медиана ()(Интервального ряда) - значение признака, приходящегося на середину интервального ряда наблюдений.

Если объем выборки равен 2k-1 (нечетное число), тогда медианой является то значение признака которое приходится на середину интервального ряда наблюдений:



Если n=2k, тогда за медиану мы принимаем половину между и :



Для нашей задачи:


: ;


Аналогично статистическому ряду среднее арифметическое значение интервального ряда распределения рассчитываем по формуле:



Мода для интервального ряда рассчитывается по формуле:


где - начало модального интервала;

- длина интервала (шаг);

- частота модального интервала;

- частота домодального интервала;

- частота следующего за модальным интервала.

Начальный выборочный момент первого порядка:



Центральный выборочный момент второго порядка:



Эмпирической (выборочной) дисперсией () называют среднюю арифметическую квадратов отклонений результатов наблюдений от их средней арифметической:



Исправленной эмпирической дисперсией называется



Эмпирический коэффициент асимметрии:

Асимметрия - характеризует скошенность распределения вероятности случайной величины относительно математического ожидания.



Эксцесс (коэффициент крутости)- мера остроты пика распределения случайной величины.



Задание 4

4.1 Для выборки признака X:

по статистическому ряду (Таблица 2.) найти среднюю арифметическую, выборочные моду и медиану.


Для статистического ряда X

61,25Mo6262

.1 Для выборки признака X:

по интервальному ряду (Таблица 5.) найти среднюю арифметическую, выборочные моду и медиану.



Для выборки признака Y:

по статистическому ряду (Таблица 4.) найти среднюю арифметическую, выборочные моду и медиану.



Для статистического ряда Y

80,95Mo80,43Mе80,82

Задание 5

5.1 Найти выборочную дисперсию , исправленную выборочную дисперсию , среднеквадратическое отклонение , эмпирические коэффициенты асимметрии и эксцесса для статистического ряда признака X.


Таблица 7

XimiXi-Xср(Xi-Xср)2·mi(Xi-Xср)3·mi(Xi-Xср)4·mi561-5,2527,56-144,7759,69581-3,2510,56-34,32111,56592-2,2510,12-22,7851,25603-1,254,68-5,857,32612-0,250,12-0,030,0076250,752,812,11,586331,759,1816,0728,136432,7522,6862,39171,57

S24,38S2и4,61и=Sи2,14S3и9,92S4и21,32Aи-0,64Eи-0,34

5.5 Найти выборочную дисперсию, исправленную выборочную дисперсию, среднеквадратическое отклонение , эмпирические коэффициенты асимметрии и эксцесса для статистического ряда признакаY.


Таблица 8

YimiYi - Yср(Yi - Yср)2· mi(Yi - Yср)3· mi(Yi - Yср)4· mi762-4,9549,005-242,571200,74781-2,958,7-25,6775,73792-1,957,6-14,8228,91802-0,951,8-1,71,628150,050,010,0060,0008211,051,11,511,218342,0516,8134,4670,648433,0527,985,11259,6

S25,64S2и5,94и=Sи1,96S3и14,49S4и35,33Aи-0,5Eи-0,6


2.2 Интервальные оценки и доверительные интервалы


Изучить:

а) понятия интервальной оценки и доверительного интервала;

б) построение интервальных оценок;

в) интервальные оценки числовых характеристик;

г) как влияет на величину интервала объем выборки и доверительная вероятность ?;

д) интервальная оценка вероятности события.

Оценки неизвестных параметров бывают двух видов - точечные и интервальные.

Точечная оценка - оценка имеющая конкретное числовое значение. Например, среднее арифметическое:

= (x1+x2+…+xn)/n,


где: X - среднее арифметическое;1,x2,…xn - выборочные значения;- объем выборки.

Интервальная оценка - оценка, определяемая двумя числами, которые являются концами доверительного интервала.

Доверительный интервал - интервал, который с заданной точностью покрывает исследуемый параметр.

Задание 6

6.1 Рассчитать доверительные интервалы для оценки математического ожидания признаков Х и Y по выборочным средним и . Если ,, а надежность ?=0,9

Используя таблицу распределения Стьюдента, находим

в зависимости от числа степеней свободы

Для X


и=Sи2,141,730,831xср-<M(x)<xср+60,4186< M(x)<<62,0814

Для Y


и=Sи2,431,730,943yср-<M(x)<yср+80,0068< M(x)<<81,8932

6.1 Рассчитать доверительные интервалы для оценки математического ожидания признаков Х и Y по выборочным средним и .

Если ,, а надежность ?=0,9

Найдем и по таблице Пирсона:

(0,9;19)= 11,65091;

(==3,413

(0,1;19)= 27,20357;

(0,1;19)==5,216

Доверительный интервал для СКО:



Для распределения X

Для распределения Y;

(==3,413

(0,1;19)==5,216

статистический выборочный точечный корреляционный


3. Проверка статистических гипотез (тема 9)


3.1 Гипотезы о параметрах распределения


Изучить:

а) понятие статистической гипотезы. Классификация гипотез (параметрическая, непараметрическая, нулевая, альтернативная, простая, сложная);

б) понятия ошибок первого и второго рода;

в) статистический критерий проверки нулевой гипотезы;

г) уровень значимости статистического критерия и его связь с ошибками первого и второго рода. Критическая область и критические точки;

д) методика проверки статистических гипотез;

е) проверка гипотезы о генеральной средней при известной и неизвестной генеральной дисперсии;

ж) проверка гипотезы о генеральной дисперсии.

Статистическая гипотеза представляет собой некоторое предположение о законе распределения случайной величины или о параметрах этого закона, формулируемое на основе выборки. Гипотезы, в основе которых нет никаких допущений о конкретном виде закона распределения, называют непараметрическими, в противном случае - параметрическими.

Статистическая гипотеза называется непараметрической, если в ней сформированы предположения относительно вида функции распределения или закона распределения.

Статистическая гипотеза называется параметрической, если в ней сформулированы предположения относительно значений параметров функции распределения известного вида.

Нулевой гипотезой называют основную выдвинутую гипотезу и обозначают .

Альтернативной () называют гипотезу, конкурирующую с основной в том смысле, что если нулевая гипотеза отвергается, то принимается альтернативная.

Статистическая гипотеза называется простой, если она имеет вид: .

Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.

Статистический критерий проверки нулевой гипотезы:

) Если выборка принадлежит критическому множеству , то отвергают основную гипотезу.

) Если выборка не принадлежит критическому множеству , то нет оснований отвергать основную гипотезу.

Критическая точка - точка раздела между критической областью и областью допустимых значений. Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

Задание 7

7.1 Предположив, что признак X распределен по нормальному закону с известным стандартным отклонением sг = 2,003, по имеющейся выборке проверить гипотезу о том, что генеральная средняя равна числу a0 = 61,27. Проверку провести для трех основных видов альтернативных гипотез при уровне значимости a = 0,05.

1) ,;;;

) a = 0,05

) U - нормальный закон распределения


) ;

= 0,067

) Вычислим :

5.1: Для двусторонней области:



находим по таблице Лапласа:

: ±1,96



Вывод: не отвергается

5.2:



находим по таблице Лапласа:

: 1,65



Вывод: Н0 не отвергается


5.3:



находим по таблице Лапласа:

: -1,65


Вывод: Н0 не отвергается


7.2 Предположив, что признак X распределен по нормальному закону, по имеющейся выборке проверить гипотезу о том, что генеральная дисперсия равна числу = 4,2. Проверку провести для трех основных видов альтернативных гипотез при уровне значимости a = 0,05.

1)



)

) -распределение

По критерию Пирсона:

Правосторонняя область:


30,1



Гипотеза не отвергается, т.к.не лежит в области

Левостороння область:




Гипотеза не отвергается, т.к.не лежит в области

Двустороння область:


32,9



Гипотеза не отвергается


.2 Гипотеза о законе распределения


Изучить:

а) формулировку задачи, решаемой с помощью критериев согласия;

б) критерий Пирсона проверки гипотезы о нормальном распределении генеральной совокупности;

в) критерий Колмогорова и схему его применения.

Критерий К. Пирсона

Использование этого критерия основано на применении такой меры (статистики) расхождения между теоретическим F(x) и эмпирическим распределением Fп(x), которая приближенно подчиняется закону распределения . Гипотеза Н0 о согласованности распределений проверяется путем анализа распределения этой статистики. Применение критерия требует построения статистического ряда.

Критерий Пирсона сконструирован так, что чем ближе нулевое значение статистики, то вероятнее, что нулевая гипотеза справедлива. Критерий Пирсона имеет только правостороннюю критическую область.

Примечание. Использование критерия Пирсона можно считать правомерным при объемах выборки не менее 50 наблюдений. Однако такой объем исходных данных значительно усложнил бы выполнение курсовой работы. Поэтому применение критерия Пирсона при выполнении задания 8 носит более иллюстративный характер.

Задание 8

8.1 Используя критерий Пирсона, при уровне значимости a = 0,05 проверить, согласуется ли гипотеза о нормальном распределении признака X, представленного в виде интервального ряда.

=61,25и = 2,14

1) Нулевая гипотеза: ГС распределена по нормальному закону

) a = 0,05


Таблица 9

Итервалы(55,25-6,75](56,75-8,25](58,25-9,75](59,75-1,25](61,25-2,75](62,75-4,25)Xср5657,55960,56263,5mi112556Xинт-Xср инт-5,25-3,75-2,25-0,750,752,25(Xинт-Xср инт)/Sи-2,44-1,74-1,05-0,350,351,05F((Xинт-Xср инт)/Sи)0,01670,08780,25410,39390,32710,1456miтеор0,261,394,026,235,172,30

4)


) Найдем по таблице Пирсона




Вывод: Гипотезу не отвергаем, т.к. не выходит за пределы

8.2 Используя критерий Пирсона, при уровне значимости a = 0,05 проверить, согласуется ли гипотеза о нормальном распределении признака Y, представленного интервальным рядом.

инт = 80,77и = 1,95

1) Нулевая гипотеза: ГС распределена по нормальному закону

) a = 0,05


Таблица 10

Интервалы(75,25-76,75](76,75-78,25](78,25-79,75](79,75-81,25](81,25-82,75](82,75-84,25)Yинт7677,57980,58283,5mi212717Yинт-Yср инт-4,87-3,37-1,87-0,371,122,62((Yинт-Yср инт)/Sи-2-1,38-0,77-0,150,461,08F((Yинт-Yср инт)/Sи)0,0620,18040,33320,3980,30560,1518miтеор0,822,394,425,284,052,01

4)


) Найдем по таблице Пирсона



Вывод: Гипотезу отвергаем, т.к. входит в пределы

4. Корреляционный и регрессионный анализ (тема 10)


4.1 Корреляционная зависимость


Изучить:

а) виды зависимостей между признаками (функциональная, статистическая, корреляционная);

б) двумерная случайная величина и ее числовые характеристики;

в) момент связи (ковариация) между составляющими X и Y двумерной случайной величины;

г) коэффициент корреляции и его свойства;

д) выборочный коэффициент корреляции;

е) проверка гипотезы о значимости коэффициента корреляции генеральной совокупности.

Корреляционный анализ (correlation analysis) [лат. correlatio - соотношение] - раздел математической статистики, объединяющий практические методы исследования корреляционной связи между двумя и более случайными признаками или факторами.

Цель корреляционного анализа - обеспечить получение некоторой информации об одной переменной с помощью другой переменной. В случаях, когда возможно достижение цели, говорят, что переменные коррелируют. В самом общем виде принятие гипотезы о наличии корреляции означает что изменение значения переменной X, произойдет одновременно с пропорциональным изменением значения Y.

Если зависимость между признаками на графике указывает на линейную корреляцию, рассчитывают коэффициент корреляции , который позволяет оценить тесноту связи переменных величин, а также выяснить, какая доля изменений признака обусловлена влиянием основного признака, какая - влиянием других факторов. Коэффициент варьирует в пределах от -1 до +1. Если =0, то связь между признаками отсутствует. Равенство =0 говорит лишь об отсутствии линейной корреляционной зависимости, но не вообще об отсутствии корреляционной, а тем более статистической зависимости. Если = ±1, то это означает наличие полной (функциональной) связи. При этом все наблюдаемые значения располагаются на линии регрессии, которая представляет собой прямую.

Практическая значимость коэффициента корреляции определяется его величиной, возведенной в квадрат, получившая название коэффициента детерминации.

Задание 9

.1 По выборке X и Y построить поле корреляции и выдвинуть предположение о существовании (или не существовании) зависимости между признаками X и Y.


Рисунок 5


Из рисунка 5 видно, что точки на графике расположены беспорядочно, соответственно можно сделать такой вывод, что корреляционной зависимости между признаками X и Y нет.

.2 Найти выборочный коэффициент корреляции и подтвердить (опровергнуть) вывод, сделанный в пункте 9.1.

Данные в корреляционной таблице представляют случайную выборку. Статистические числовые характеристики (Sх,Sy), полученные по этой выборке, являются оценками параметров генеральной совокупности, поэтому о тесноте зависимости между признаками X и Y мы судим по величине оценки коэффициента корреляции . Следует проверить его значимость, т.е. установить - достаточна ли его величина при данном объеме выборки (n=20) для вывода о наличии корреляционной зависимости между признаками X и Y.

Выборочный коэффициент корреляции рассчитывается по формуле:



Таблица 11

№XY((15677-5,3-3,628,0912,9619,0825879-3,3-1,610,892,565,2835979-2,3-1,65,292,563,6846079-1,3-1,61,692,562,0856079-1,3-1,61,692,562,0866179-0,3-1,60,092,560,4876179-0,3-1,60,092,560,4886179-0,3-1,60,092,560,4896180-0,3-0,60,090,360,18106180-0,3-0,60,090,360,18116180-0,3-0,60,090,360,18126181-0,30,40,090,16-0,121362810,70,40,490,160,281462820,71,40,491,960,981562820,71,40,491,960,981663821,71,42,891,962,381764832,72,47,295,766,481864832,72,47,295,766,481964842,73,47,2911,569,182065843,73,413,6911,5612,58

Так как значение коэффициента корреляции очень мало, то можно подтвердить предположение, сделанное в п. 9.1 и сказать, что связь слабая.

.3 Проверить гипотезу о значимости выборочного коэффициента корреляции

Проверим значимость выборочного коэффициента корреляции , т.е. установим достаточна ли его величина при данном объеме выборки для обоснованного вывода о наличии корреляционной связи.

) H0: =0;

H1: 0

) - уровень значимости.

) По распределению Стьюдента:



) (двусторонняя критическая область)


Вывод: Нулевая гипотеза не отвергается, т.е. между признаками X и Y отсутствует корреляционная зависимость.


4.2 Уравнение регрессии


Изучить:

а) понятие парной линейной регрессии;

б) составление системы нормальных уравнений;

в) свойства оценок по методу наименьших квадратов;

г) методику нахождения уравнения линейной регрессии.

Предположим, что между двумя признаками Х и У существует некоторая взаимосвязь (корреляционная зависимость), при которой с изменением одного признака изменяется и другой, но каждому значению признака Х могут соответствовать разные, заранее непредсказуемые значения признака У, и наоборот.

Основная задача корреляционного анализа состоит в выявлении связи между случайными переменными путем точечной и интервальной оценок различных (парных, множественных, частных) коэффициентов корреляции Дополнительная задача корреляционного анализа (являющаяся основной в регрессионном анализе) заключается в оценке уравнений регрессии одной переменной по другой.

Связь между признаками бывает положительной и отрицательной.

Если с увеличением (уменьшением) одного признака в основном увеличиваются (уменьшаются) значения другого, то такая корреляционная связь называется прямой или положительной.

Если с увеличением (уменьшением) одного признака в основном уменьшаются (увеличиваются) значения другого, то такая корреляционная связь называется обратной или отрицательной.

Задание 10

10.1 Предположив, что между признаками X и Y существует линейная зависимость, найти коэффициенты уравнения регрессии Y на X и записать уравнение в виде y = b0 + b1x.


Рисунок 6.



Заключение


Итак, статистические ряды распределения представляют собой один из наиболее важных элементов статистического исследования.

Статистические ряды распределения являются базисным методом для любого статистического анализа.

Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку, характеризует структуру изучаемого явления. Анализируя рассчитанные показатели статистического ряда распределения, можно делать выводы об однородности или неоднородности совокупности, закономерности распределения и границах варьирования единиц совокупности. Изучив основные приемы исследования и практики применения рядов распределения, а также методику вычисления наиболее важных статистических величин, необходимо отметить, что конечная цель изучения статистики в целом - анализ изучаемого явления - крайне важен для всех сфер человеческой жизни. Анализ отображает явления в целом и вместе с этим учитывает влияние каждого фактора в отдельности. На основании проведенного анализа можно учитывать и прогнозировать факторы, негативно влияющие на развитие событий.

Социально-экономическая статистика обеспечивает предоставление важной цифровой информации об уровне и возможностях развития страны: ее экономическом положении, уровне жизни населения, его составе и численности, рентабельности предприятий, динамике безработице и т.д. Статистическая информация является одним из решающих ориентиров государственной экономической политики.


Список литературы


1.Гмурман В.Е. Теория вероятностей и математическая статистика. - М.: Высшая школа, 2011. - 479 с.

2.Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. - М.: Высшая школа, 2004. - 400 с.

3.Вентцель Е.С. Теория вероятностей. - М.: Издательский центр «Академия», 2010. - 576 с.

4.Вентцель Е.С. Задачи и упражнения по теории вероятностей. - М.: Издательский центр «Академия», 2005. - 448 с.

5.Бочаров П.П., Печинкин А.В. Теория вероятностей и математическая статистика: Учебное пособие. - М.: ФИЗМАТЛИТ 2005. - 296 с

.Вентцель Е.С. Теория вероятностей и её инженерные приложения: Учебное пособие для вузов. - М.: «Академия», 2009. - 432 с.

.Кибзун А.И., Горяинова Е.Р., Наумов А.В. Теория вероятностей и математическая статистика: Базовый курс с примерами и задачами. - М.: ФИЗМАТЛИТ, 2012. - 232 с.

.Гнеденко Б.В. Курс теории вероятностей: Классический университетский учебник. - М.: ЛКИ, 2007. - 448 с.

.Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. - М.: ЮНИТИ ДАНА, 2009. - 551 с.


Приложение 1


Генеральная совокупность статистических данных по результатам тестирования курсантов


№ п/пXY№ п/пXY№ п/пXY№ п/пXY№ п/пXY618064816182647958826281628362836577578163846182648260796181628260836383618062826379617959806279638362765979618163816484618061786082618059826281627761836379588160806480628262795780638259816383628058796179588259766381597960766081587764826180598060825779618363816081618056805984647961806283558157826379627963845982587962796378618061835981638164796379628056826081627764806481598361806380607863805782628162825976647958806175618158795980578262766280568058815883637763825982568260826079608359845683617959786484588157806281607661815982587960806178598260805980617962795880618460816281637559826283618361806281618059846081607963826382588159825978618062826082597860766081618262806176618161836283637862815982618563816479638260836284648062775980618263836479637960815981608263815981598160806181618258836180598162806280578262815882637863796084638159836479

№ п/пXY№ п/пXY№ п/пXY№ п/пXY№ п/пXY61816184608163836383628362806180628259816382637862816083608064796479617958826281628062816078617964826379617963776378637964825980597962816482638362785882598064836484597757815881638161825879598359836179628058806285628240160776379598263846383647760836282648460766284617962836177638062786182627661796380628163756278648363816076637961846479617964826283638362816281638462826383638264835977608262816382587861836382648159796281628365806182638061836279638364816084637865816080628461796480618161856082638162836281588362836384638059846180648564836085627960856082618264806284618162816078608362806479597663826381637658776483647964765778618265786078597963766477627962816278627964826383617963816581648563806183618063846481628462796485658361826379608564826281648161826285618064826284


Приложение 2


Значения случайных чисел для различных вариантов исходных данных


№1073211052378096057078064139082058389043369046076223002087056№2268070329128002083341265074052094053212096043089333008039077№3076265196093080135074303070361340045020053035085149065047077№4100375084099128325048068025097076064196313080135074303070361№5346248232383064054240256311264367353068090358094042074057342№6174177066142050080077214291068058045043369046076223002087056№7005052068296234073077067110341065080074069098176356099268205№8073211045076096057078064139082002143268094054165053026056145№9068269085111165276368047020344046070329128040083341265074052№10291128087259341085135151065165125376092362281047073220149304№11382067008313250285034163124093274118191307136322266274076401№12221050137367291158045043369046040268170067089076203102187156№13340245020053135076182065147064366353168090358361242057074342№1419811804506809917725416304016711123418608335229109788256243№15221150137367091248170167353089260294184090293143242061276368№16186273284260398143085165287203366353068190358361242257074342№17145296333183299051363354049144355159240243348270260219194381№18346248232383032054240125311366076064196093080135074303070361№19273211245176096194253157097143058178064139279089333240188077№20366353068290358361042157074342221050137367091340170167268189№21055159400143348070206215094281344289201269310188148233205246№22080206159088198091104347174168065186073284060398074085287203№23073211052378096057078064139082058389043369046076223002087056


Приложение 3



Приложение 4



Приложение 5



Приложение 6



Теги: Понятия выборочной теории. Ряды распределения. Корреляционный и регрессионный анализ  Курсовая работа (теория)  Математика
Просмотров: 12700
Найти в Wikkipedia статьи с фразой: Понятия выборочной теории. Ряды распределения. Корреляционный и регрессионный анализ
Назад