Вариационные ряды

1.Построение и графическое изображение вариационных рядов


Имеем статистическую совокупность из 30 сельскохозяйственных организаций, охарактеризованных двумя признаками: качеством почв и урожайностью зерновых.

вариационный сельскохозяйственный почва ряд

Таблица 1. Исходные данные

№ хозяйстваКачество почв, балл (х)Урожайность зерновых, ц/га (у)180302642136821467215883668937779358782596520107935116520126925137530146830156521168836177036188030199037207830215821226536238030248830257025267830278035288836297835306420В результате логического рассуждения приходим к выводу, что зависимым, результативным признаком в данном случае является урожайность зерновых, а независимым, факторным - качество почв.

Следовательно, в соответствии с заданием дискретный вариационный ряд строим по результативному признаку - урожайности зерновых, интервальный вариационный ряд - по факторному признаку - качеству почв.

Для того чтобы составить дискретный вариационный ряд, необходимо расположить значения признака в порядке возрастания, т.е. произвести ранжирование статистических данных, а затем подсчитать частоты.


Таблица 2. Дискретный ряд распределения урожайности зерновых

ВариантыЧастотыНакопленные частоты203321811227182362424529258372684527853287602966630137931129132111023310112349121351013136131443713157

Для графического изображения дискретного ряда служит многоугольник (полигон). При его построении на оси абсцисс откладываются варианты, на оси ординат - частоты.

Рис. 1. Полигон распределения сельскохозяйственных предприятий по урожайности зерновых


Для построения интервального вариационного ряда:

·определяется число групп (число интервалов) по формуле Стерджесса:


К=1+3.32*log(n), (1)


где К - число групп (интервалов); n - число единиц наблюдения;

К=1+3.32*log(30) = 5.9 ? 6

·рассчитывается величина интервала, т.е. разность между верхним и нижним значением признака в группе:


, (2)


где xmax - максимальное значение признака; xmin - минимальное значение признака.

·формируются группы, т.е. устанавливаются верхние и нижние границы для каждого интервала;

·рассчитываются частоты и накопленные частоты для интервального ряда;

Графически интервальный ряд изображают с помощью гистограммы. На оси абсцисс берутся отрезки, соответствующие величине интервала. На каждом отрезке строят прямоугольник, длина второй стороны которого соответствует частоте.

Для построения диаграммы необходимо найти середины интервалов по формуле:


, (3)


Таблица 3. Интервальный вариационный ряд распределения качества почв

ИнтервалыЧастотыНакопленные частотыСередины интервалов58,0 - 63,331160,6763,33 - 68,670166,0068,67 - 74,08971,3374,0 - 79,33101976,6779,33 - 84,67163582,0084,67 - 90,0195487,33

Рис. 2. Гистограмма распределения сельскохозяйственных предприятий по качеству почв


2.Статистические характеристики рядов распределения


2.1Показатели центра распределения


·средняя арифметическая;

·мода;

·медиана.

Средняя арифметическая вычисляется по формулам:

простая


; (4)


взвешенная


, (5)


где среднее значение признака; - варианты; - частоты;

Мода вычисляется по формуле:


, (6)


где - нижняя граница интервала, содержащего моду;

- величина модального интервала;

- частота модального интервала;

- частота интервала, предшествующего модальному;

- частота послемодального интервала.

Медиана рассчитывается по формуле:

, (7)


где - нижняя граница медианного интервала;

- величина медианного интервала;

- сумма накопленных частот, предшествующих медианному интервалу;

- частота медианного интервала.


2.2Показатели колеблемости признака


·размах вариации;

·среднее линейное отклонение;

·дисперсия;

·среднее квадратическое отклонение;

·коэффициент вариации.

Дисперсия определяется по формуле:


, (8)


Среднеквадратическое отклонение вычисляется по формуле:


, (9)


Коэффициент вариации вычисляется по формуле:


, (10)

- коэффициент вариации для качества почв

- коэффициент вариации для урожайности зерновых


2.3Показатели формы распределения


·коэффициент асимметрии определяется по формуле:


; (11) или , (12)


где - центральный момент третьего порядка.


·коэффициент эксцесса определяется по формуле:


, (13)


где - центральный момент четвертого порядка.


Таблица 4. Показатели центра, вариации и формы распределения

Качество почв, балл (х)Урожайность зерновых, ц/га (у)Название показателяРазмерНазвание показателяРазмерСреднее80,91Среднее29,13Стандартная ошибка1,15Стандартная ошибка1,12Медиана82Медиана30Мода85,4Мода30Среднее квадратическое отклонение6,28Среднее квадратическое отклонение6,15Дисперсия выборки39,39Дисперсия выборки37,85Эксцесс0,24Эксцесс- 1,48Асимметричность- 0,83 (- 0,71)Асимметричность- 0,14Интервал32Интервал17Минимум58Минимум20Максимум90Максимум37Сумма2254Сумма874Счет30Счет30Уровень надежности (95,0%)3,43Уровень надежности (95,0%)2,34Коэффициент вариации7,76%Коэффициент вариации21,11%

На основе данных таблицы формулируем выводы.


В данной совокупности сельскохозяйственных предприятий средняя урожайность зерновых составляет 29,13 ц/га, средний показатель качества почв составляет 80,91 баллов.

Медиана показывает, что половина сельскохозяйственных предприятий совокупности имеет качество почв меньше 82 баллов, а половина - больше 82 баллов; Медиана = 30 показывает, что половина сельскохозяйственных предприятий имеет урожайность зерновых меньше 30 ц/га, а половина - больше 30 ц/га.

Мода = 85,4 показывает, что наиболее часто в данной совокупности встречается качество почв 85,4 баллов; Мода = 30 показывает, что наиболее часто в данной совокупности встречается урожайность зерновых 30 ц/га.

Коэффициент вариации свидетельствует о слабой вариации обоих признаков, так как оба коэффициента меньше 33%.

Коэффициенты эксцесса показывают, что распределение хозяйств по качеству почв является островершинным, так как = 0,240, а распределение по урожайности зерновых является плосковершинным, так как .

По коэффициентам асимметрии можно сделать вывод, что распределение хозяйств по урожайности зерновых и по качеству почв имеет левую асимметричность, так как .


2.4Статистические оценки параметров распределения


Изучаемую совокупность можно считать выборкой из генеральной совокупности, состоящей из большого множества сельскохозяйственных предприятий. На основе показателей, рассчитанных по выборке, дают статистическую оценку параметров генеральной совокупности.

Возможное расхождение между выборочными и генеральными характеристиками составляет ошибку выборки.

Стандартная ошибка выборки определяется по формуле:


, (14)


Для определения интервальной оценки необходимо найти доверительный интервал:


, (15)

, (16)

,


где - предельная ошибка выборочной средней; - коэффициент доверия, который определяют по таблице распределения Стьюдента по заданным n и при малой выборке n 30.

Коэффициент доверия по таблице Стьюдента равен 2,0452.

Для урожайности зерновых предельная ошибка

Строим доверительный интервал:

Для качества почв предельная ошибка

Строим доверительный интервал:

.

С вероятностью 0,95 можно утверждать, что генеральная средняя урожайности зерновых не выйдет за пределы от 26,79 до 31,47 ц/га.

С вероятностью 0,95 можно утверждать, что генеральная средняя качества почв находится в интервале от 78,52 до 83,3 баллов и не выйдет за его пределы.


2.5Проверка гипотезы о законе нормального распределения по критерию Пирсона


Для объективной оценки степени соответствия эмпирического распределения теоретическому используется ряд особых показателей, называемых критериями согласия. На их базе проверяется гипотеза о законе нормального распределения. Это критерии Пирсона, Колмогорова, Романовского и др.

Критерий Пирсона (хи-квадрат) определяется по формуле:


, (17)


где (хи-квадрат) - критерий Пирсона; - эмпирические частоты;

- теоретические частоты.

Теоретические частоты вычисляются по формуле:


, (18)


где - теоретические частоты; - фактические частоты; h - шаг;

- нормированные отклонения; - значения функции плотности стандартизированного нормального распределения.

Вычисления выполняются в следующей последовательности:

1)Определяются нормированные отклонения;

)При рассчитанных значениях нормированных отклонений по таблице плотности нормального распределения отыскиваются значения функции плотности стандартизированного нормального распределения;

3)Вычисляется выражение ;

)Определяются теоретические частоты;

)Рассчитывается критерий Пирсона.


Таблица 5. Расчет теоретических частот

Группа предприятий по качеству почвФактические частотыСередины интерваловt?(t)(h??)/?58,0 - 63.33160.67-3,220,002245,8363.33 - 68.67066.0-2,370,024145,8368.67 - 74,0871.34-1,520,125745,8374,0 - 79.331076.67-0,680,316645,8379.33 - 84.671682.00,170,393245,8384.67 - 90,01987.341,020,237145,8354

Критерий согласия Пирсона рассчитываем в следующей таблице.


Таблица 6. Расчет критерия согласия Пирсона

ВариантыЧастотыэмпирическиетеоретические58.0 - 63.3310,1008260,8991740,8085148,01890363.33 - 68.6701,104503-1,10451,2199271,10450368.67 - 74.085,7608312,2391695,0138780,87033974.0 - 79.331014,50978-4,5097820,33811,40168279.33 - 84.671618,02036-2,020364,0818380,22651384.67 - 90.01910,866298,13370766,157196,088294

17,71023 (фактическое значение критерия Пирсона)

(критическое значение критерия Пирсона по таблице)

Так как фактическое значение критерия Пирсона больше критического значения, можно утверждать, что исследуемое эмпирическое распределение имеет отличный от теоретического закон распределения, т.е. нулевая гипотеза о том, что распределение подчиняется закону нормального распределения, не принимается.

Генеральная совокупность не распределена по нормальному закону.


3.Корреляционно-регрессионный анализ


В процессе корреляционно-регрессионного анализа решаются следующие задачи:

)Определение формы и направления связи, ее количественное выражение в виде уравнения регрессии.

)Определение характеристики тесноты связи.

)Определение значимости выборочных характеристик тесноты корреляционной связи.


Таблица 7. Результаты вычисления параметров и показателей для КРА

ВЫВОД ИТОГОВРегрессионная статистикаМножественный R0,754929R-квадрат0,569918Нормированный R-квадрат0,554558Стандартная ошибка0,079849Наблюдения30Дисперсионный анализdfSSMSFЗначимость FРегрессия1647,1226647,122637,103821,43E-06Остаток28488,344117,44086Итого291135,467Коэф.Станд. ошибкаt-статистикаР-значениеНижние 95%Верхние 95%Y-пересечение-9,532096,393286-1,490950,147155-22,62813,563966Переменная X10,5146240,0844856,0912911,43E-060,3415640,687684

На основе данных таблицы построим уравнение регрессии:


ух = - 9,532 + 0,515х

Выводы


Коэффициент регрессии а1 = 0,515 означает, что с повышением качества почв на 1 балл урожайность зерновых повышается на 0,515 ц/га.

Коэффициент корреляции r = 0,750,7, следовательно, связь между изучаемыми признаками в данной совокупности тесная.

Коэффициент детерминации r2 = 0,57 показывает, что 57% вариации результативного признака (урожайности зерновых) вызвано действием факторного признака (качества почв).

В таблице критических точек распределения Фишера-Снедекора находим критическое значение F - критерия при уровне значимости 0,05 и числе степеней свободы К1 = m - 1=2 - 1=1 и К2 = n - m=30 - 2=28, оно равно 4,21.

Так как рассчитанное значение F - критерия больше F табличного (F=37,1, то уравнение регрессии признается значимым.

Для оценки значимости коэффициента корреляции рассчитываем t - критерий Стьюдента:



В таблице критических точек распределения Стьюдента найдем критическое значение t-критерия при уровне значимости 0,05 и числе степеней свободы n - 1=30 - 1=29, оно равно 2,0452.

Так как рассчитанное значение t-критерия больше табличного, то коэффициент корреляции является значимым.


Теги: Вариационные ряды  Практическое задание  Математика
Просмотров: 24818
Найти в Wikkipedia статьи с фразой: Вариационные ряды
Назад