Статистические модели в геологии

Введение


В данной контрольной работе рассматриваются методы построения статистических моделей при обработке гидрогеологической, инженерно-геологической и геоэкологической информации. Эти методы в настоящее время являются наиболее широко применяемыми при гидрогеологических, инженерно-геологических и геоэкологических исследованиях. С их помощью можно получить качественно новые выводы и обобщения, которые имеют как практическую, так и научную ценность.

Целью работы является приобретение навыков статистического анализа. Для этого необходимо освоить теоретический материал, методики анализа и осуществить его практическую реализацию с помощью использования специальных программ, наиболее широко распространённой из которых в настоящее время является STATISTICA (StatSoft).


1.Задание, исходные данные


В данном задании даны механические и физические свойства рыхлых несвязных горных пород (модуль деформации Е1, кГ/см2, коэффициент пористости ?1 моренных суглинков - Московская морена и коэффициент пористости ?2 моренных суглинков - Днепровская морена) Подмосковья

Для решения контрольной работы необходимо:

)Построить гистограммы распределения показателей, выявить законы распределения, при необходимости нормализовать исходные данные. Вычислить обобщенные статистические характеристики, оценить точность их вычисления.

)Проверить гипотезы:

§о законе распределения выборок;

§об однородности выборок;

§об изменчивости показателей;

§сравнить выборки между собой.

4)Рассчитать нормативные (эффективные) и расчетные показатели.

5)Определить необходимое количество наблюдений.

Исходные данные Е1, кГ/см2, ?1 и ?2 сведены в таблицу 1.


Таблица 1. Исходные данные

Номер пробыЕ1, кГ/см2?1?215000,490,6124600,50,4733600,540,5245300,460,5153800,50,5765700,440,4974200,540,4983800,60,5595000,480,55104400,520,52113000,570,53125300,460,6134900,50,49148700,460,62154600,490,51165000,470,54174300,540,47183100,580,621912000,480,42205200,440,54215700,480,51224900,50,50234300,520,46243700,580,55254200,490,67

. Группировка данных, построение гистограмм и их анализ


Результаты наблюдений и экспериментальных исследований, отраженные в количественных показателях, обычно заносят в таблицу, где каждое значение отвечает точке наблюдения, номеру образца или пробы.

Большую наглядность обеспечивает расположение исходных данных в таблице в определенной последовательности. Такую последовательность называют вариационным рядом. Далее разбивают вариационный ряд на определенные интервалы, количество которых можно вычислить по формуле


К?a*lgn+1


Где n - количество исходных данных (объем выборки);

а - коэффициент, который следует принимать от 3 до 5 при n<30, а=3, при n=30-70, а=4, при n >70, а=5. Количество интервалов всегда является целым числом, поэтому необходимо применить правило округления.

После определения количества интервалов вычисляется шаг


?h=


Где Хмакс и Хмин - максимальное и минимальное значения в исходных данных.

Затем определяют границы интервалов группировки:

интервал - от Хмин до Хмин + ?h;

интервал - от Хмин + ?h до Хмин + 2?h;

………………………………………

Кй интервал - от Хмин +(К-1) ?h до Хмакс

Далее подсчитывается количество исходных данных, попавших в каждый интервал группировки, которое обычно обозначается ni и называется частотой. Относительная частота рассчитывается по формуле:


?i =


Гистограммы


Данные распределены по нормальному закону.


Данные распределены по нормальному закону.


Данные распределены по нормальному закону.


3.Вычисление обобщенных статистических характеристик


Центральные значения

Выборочным аналогом математического ожидания, характеризующим положение центра, является среднее арифметическое


Хср=


Выборочная медиана представляет собой срединное значение вариационного ряда. Если вариационный ряд имеет нечетное число членов 2к+1, медиане отвечает средний, к+1, член ряда, если четное - 2к, медиана равна среднему арифметическому из значений центральных членов ряда:


me=


Модой называется абсцисса точки, имеющая максимальную ординату кривой распределения.

Е1, кГ/см2?1?2Среднее арифметическое, 497,20,50520,5324Медиана, me4600,50,52Мода5000,50,51

Характеристики рассеяния

Основной мерой рассеяния является дисперсия. Выборочная дисперсия вычисляется по формуле


при n>30

или

при n<30


Квадратный корень из дисперсии называется среднеквадратичным отклонением или стандартом:


S=


Относительной характеристикой изменчивости является коэффициент вариации, выборочное значение которого вычисляется по формуле

V=


Е1, кГ/см2?1?2Дисперсия, 33737,670,0019590,003386Среднеквадратич. отклонение, S183,67820,0442640,058186Коэффициент вариации, V0,3694250,0876170,109291

Характеристики симметрии и степени сжатости кривых распределения

Степень симметричности кривой по оси абсцисс характеризует коэффициент асимметрии, выборочное значение которого вычисляется по формуле



Коэффициент асимметрии может быть - или +. Положительные значения коэффициента асимметрии свидетельствуют о том, что распределение вытянуто в сторону больших значений(правостороння асимметрия), отрицательное значение - о его вытянутости в сторону малых значений. При строго симметричных распределениях коэффициент асимметрии равен нулю. Если , распределение практически симметрично, при - слабо симметрично, при - ассиметрично и при - резко симметрично.


Коэффициент асимметрии, Е1, кГ/см2?1?22,7472010,6057070,508214распределениерезко симметричнорезко симметричнорезко симметрично

Для характеристики степени сжатости или растяжения кривой распределения по оси ординат служит эксцесс, выборочное значение которого вычисляется по формуле



Коэффициент эксцесса может быть положительным и отрицательным. Положительный эксцесс свидетельствует о скоплении исходных данных в середине вариационного ряда и о сжатой форме кривой распределения, отрицательный - о более равномерном распределении вариант и распластанной кривой. Нулевое значение коэффициента эксцесса отвечает нормальному распределению.


Коэффициент эксцесса, Е1, кГ/см2?1?29,149804-0,388470,15573

Оценка точности вычисления обобщенных статистических характеристик

Величину стандартной ошибки среднего арифметического вычисляют по формуле



Показатель точности вычисляется по формуле



Стандартная ошибка медианы вычисляется по формуле



Стандартная ошибка стандартного отклонения вычисляется по формуле



Стандартная ошибка коэффициента вариации вычисляется по формуле



Стандартная ошибка асимметрии вычисляется по формуле



Стандартная ошибка эксцесса вычисляется по формуле



Е1, кГ/см2?1?2Величина стандартной ошибки, 36,735630,0088530,011637Показатель точности, 0,0738850,0175230,021858Стандартная ошибка медианы, 46,029750,0110930,014582Стандартная ошибка стандартного отклонения, 73,471260,0177060,023275Стандартная ошибка коэффициента вариации, 0,0522450,0123910,015456Стандартная ошибка ассимметрии, 0,4636840,4636840,463684Стандартная ошибка эксцесса, 0,9017210,9017210,901721

. Проверка статистических гипотез


Проверка гипотезы о нормальности распределения

Нормальное распределение симметрично и характеризуется определенной степенью сжатости. Коэффициент асимметрии и эксцесс нормального распределения равны нулю. Принято считать, что если выборочные значения коэффициента асимметрии и эксцесса удовлетворяют неравенствам: и , то гипотеза о нормальном распределении может быть принята. Если же не выполняется хотя бы одно из приведенных неравенств, то гипотеза о нормальности распределения должна быть отвергнута.


Проверка гипотезы о нормальности распределения.

Е1, кГ/см2|A|> 1.5 Sa |E| > 1.5 Se Гипотеза о нормальности распределения может быть отвергнута?1|A| <1.5 Sa |E| <1.5SeГипотеза о нормальности распределения может быть принята?2|A|< 1.5Sa |E| <1.5SeГипотеза о нормальности распределения может быть принята

Проверка принадлежности вариант к статистической совокупности

Наиболее употребимым критерием является «правило трех сигм». Критические точки при применении этого критерия вычисляются по формуле . Далее все варианты проверяются исходя из следующего неравенства



Если все значения в выборке входят в этот интервал, то выборка считается однородной. Те варианты, которые не попадают в установленный интервал из выборки, должны быть удалены.


Проверка принадлежности варианта к статистической совокупности

ПределыАномальные значенияЕ1, кГ/см2-53,83451048,234Выборка неоднородна?10,3724070,637993Выборка однородна?20,3578410,706959Выборка однородна

Проверка независимости определений

Определения независимы друг от друга - стационарная изменчивость (нулевая гипотеза), или имеет место пространственная зависимость - тренд (альтернативная гипотеза). Для проверки используется величина



Проанализируем выборку Е1, кГ/см2:

Проанализируем выборку ?1:

Проанализируем выборку ?2:

Нулевая гипотеза отвергается в пользу альтернативной, если эта величина будет меньше или равна критическому значению (см. табл. 1.1. в методичке). Критическое значение критерия для установления тренда из таблицы с объемом выборки n=25 равно 1,367. Критическое значение выборки по всем 3 показателям больше табличного значения, значит имеет место стационарная изменчивость (нулевая гипотеза).

Проверка различия между выборочными совокупностями

Для сравнения двух выборочных совокупностей используют средние и дисперсии. Для проверки по среднему применяется критерий Стьюдента



Величина Т при выполнении нулевой гипотезы распределена по закону Стьюдента с . Критические точки распределения Стьюдента можно найти в табл. 1.2. (см. методичку). Из данной таблицы Ткр= 2,00. Расчетные значения меньше критических, то подходит нулевая гипотеза.

Для проверки по дисперсии используется критерий Фишера



Критические точки распределения Фишера представлены в табл. 1.3. (см. методичку). По таблице Fкр=1,7. Расчетное значение меньше критического, то подходит нулевая гипотеза.


5. Определение нормативных и расчетных параметров


Согласно ГОСТ 20522-96 при инженерно-геологических изысканиях в качестве нормативного показателя Хн всех характеристик грунтов за исключением удельного сцепления С и угла внутреннего трения ? принимают среднее арифметическое значение Х и вычисляют по формуле



Однако при распределениях значительно отличающихся от нормального среднее является неэффективным параметром. Поэтому для его нахождения, например при логнормальном законе распределения, применяется зависимость



Во избежание ошибок при расчетах, требующих повышенной точности и надежности, применяются не обобщенные, нормативные или эффективные, а расчетные значения показателей. Для вычисления расчетных показателей наиболее часто применяют метод доверительных пределов, основанный на вычислении такого значения показателя, которое с заданной надежностью не будет меньше (больше) истинного среднего.

Согласно ГОСТ 20522-96 расчетное значение характеристик Xp устанавливают для модуля деформации, временного сопротивления одноосному сжатию скальных грунтов, влажности, плотности , пластичности нескальных грунтов , вычисляют по формуле



где ? - показатель точности оценки среднего значения характеристики вычисляемый по формуле



где Т? - коэффициент, применяемый в зависимости от заданной односторонней доверительной вероятности ? и числа степеней свободы f = n-1 (Т?=1,71)


Показатель точности, Е1, кГ/см2?1?20,130,030,04497,2±0,130,5±0,030,53±0,04

6.Установка числа определений


Одним из методов установления числа определений для вычисления обобщенных показателей является метод, основанный на стабилизации выборочной дисперсии или коэффициента вариации при увеличении объема выборки. Для удобства строят графики в координатах S2 от n или V от n.

Число определений можно считать достаточным, когда изменения характеристик рассеяния становится меньше 5-10 % от их значения.

Количество частных определений для установления нормативного и расчетного значения инженерно-геологических характеристик вычисляют по формуле


Значения Т?=1,70 принимают по табл. 1.2. из методички при односторонней доверительной вероятности ? = 0,05 и числе степеней свободы ? = n-1.


Графики для установления числа определений n по величине выборочной дисперсии


Рис.1


Для Е1, кГ/см2 количество частных определений равно:



Из рисунка 1 и полученного значения n=24, можно сказать, что количество частных определений достаточно для данной выборки.


Рис.2


Для ?1 количество частных определений равно:


,


Из рисунка 2 и полученного значения n=25, можно сказать, что количество частных определений достаточно для данной выборки.


Рис.3

Для ?2 количество частных определений равно:


.


Из рисунка 3 и полученного значения n=22, можно сказать, что количество частных определений достаточно для данной выборки.


Заключение

статистический геологический информация

В процессе выполнения данной работы сформировался методический подход к построению статистических моделей при обработке гидрогеологической, инженерно-геологической и геоэкологической информации. Такой подход является наиболее универсальным, так как содержит множество методов, использование которых позволяет сделать новые научные и практические выводы. Реализация данного подхода может быть применима для любых природных условий и любых типов объектов при обработке гидрогеологических, инженерно-геологических и геоэкологических показателей.


Список литературы


1.Семячков А.И., Почечун Статистические методы в гидрогеологии, инженерной геологии и геоэкологии: Екатеринбург, 2005, с.86.

2.ГОСТ 20522-96 Грунты. Методы статистической обработки.


Теги: Статистические модели в геологии  Курсовая работа (теория)  Геология
Просмотров: 23477
Найти в Wikkipedia статьи с фразой: Статистические модели в геологии
Назад