Документ взят из кэша поисковой машины. Адрес оригинального документа : http://geophys.geol.msu.ru/STUDY/4KURS/STAT_.DOC
Дата изменения: Mon Oct 5 12:20:19 2009
Дата индексирования: Mon Oct 1 20:07:05 2012
Кодировка: Windows-1251

ОЦЕНКА ЗАКОНА РАСПРЕДЕЛЕНИЯ ГЕОФИЗИЧЕСКИХ ДАННЫХ, ВЫЯВЛЕНИЕ ФОНОВЫХ И
АНОМАЛЬНЫХ УЧАСТКОВ ПО ДАННЫМ КОМПЛЕКСА МЕТОДОВ

ТЕОРЕТИЧЕСКИЕ ОСНОВЫ
Закон распределения физи?еской вели?ины
Площадные и профильные геофизи?еские наблюдения используют для
выявления разли?ных локальных объектов в разрезе. Объектам поиска
соответствуют аномалии геофизи?еских полей. Для определения понятия
аномалии можно использовать вероятностный подход (?аще всего он применяется
для слабодифференцированных полей). Совокупность данных на у?астке съемки
рассматривается как выборка (набор зна?ений) слу?айной вели?ины. Под
аномалией в этом слу?ае понимается фрагмент у?астка съемки, на котором
закономерно сосредото?ены зна?ения вели?ины, маловероятные для данной
выборки.
Слу?айная вели?ина X, реализованная выборкой из N зна?ений {x1, (,
xN}, характеризуется законом (функцией) распределения вероятности Ф(x)=p|
xi возрастает от 0 при x ( (( до 1 при x ( +(. На практике также используется
более удобная для визуального представления вели?ина - плотность
распределения вероятности p(x) = (Ф/(х = p| xi =x - вероятность того, ?то
зна?ение xi равно х. Важным свойством плотности распределения является
соотношение [pic].
Рассматривать физи?ескую вели?ину как слу?айную, вполне возможно,
поскольку их зна?ения становятся известными в результате измерений, которые
неизбежно содержат некоторую неконтролируемую, то есть слу?айную
погрешность. Кроме того (и это, может быть, более важно), при истолковании
результатов собственно геофизи?еских измерений пользуются модельными
представлениями, заведомо упрощающими факти?еское строение среды.
Отклонения от модели являются неконтролируемыми (слу?айными) факторами.
Для физи?еских вели?ин одни зна?ения более вероятны ?ем другие, при?ем
обы?но наиболее вероятное зна?ение единственно, и ему соответствует
единственный максимум плотности распределения. Такое наивероятнейшее
зна?ение слу?айной вели?ины называется модальным или модой Мо. Чтобы
определить, является ли данное зна?ение аномальным (маловероятным), нужно
оценить, насколько оно далеко от модального. В общем слу?ае произвольного
распределения вероятностей эта зада?а может быть сложна.
Для многих вели?ин закон распределения хорошо приближается нормальным
распределением со средним М и дисперсией s - N(M,s) с плотностью [pic] -
распределением Гаусса.
Вели?ина М (математи?еское ожидание) для нормально распределенной
вели?ины X, реализованной выборкой из N зна?ений {x1, (, xN}, оценивается
как их среднее арифмети?еское [pic] и совпадает с модальным. Вели?ина s2
(дисперсия), характеризующая вероятный разброс зна?ений в выборке,
оценивается как среднее зна?ение квадрата отклонения зна?ений вели?ины X от
их среднего: [pic].
Для выборок нормально распределенной вели?ины с большой дисперсией
более достоверной оценкой наивероятнейшего зна?ения может оказаться медиана
Ме (p| xi <Ме = 0.5 - вероятность того, ?то зна?ение xi меньше медианы
равно 0.5). На практике за медиану принимают Ме=x(N-1)/2+1 при не?етном N
или Ме=(xN/2+xN/2+1)/2 при ?етном N после упорядо?ения выборки по
возрастанию или по убыванию.
Для больших выборок нормально распределенных вели?ин мода, среднее
арифмети?еское и медиана совпадают. Это свойство нормального закона
распределения наряду с его большим распространением делает нормальный закон
основным законом, применяемым в статисти?еском анализе (из-за удобства
вы?ислений).
Стандартное отклонение s может служить мерой удаления данного зна?ения
нормально распределенной вели?ины от наивероятнейшего. Для результатов
площадной съемки по регулярной сети эмпири?ески установлено, ?то аномалию
можно с?итать обнаруженной, если на двух или более соседних профилях в их
соответствующих ?астях следует подряд по три или более то?ки, зна?ения в
которых выходят за пределы интервала (М(3s, М+3s) - минимально-аномальные
пределы. Коротко говорят ?то 'аномалия выделяется по правилу 'трех сигм'
двумя профилями, тремя то?ками'. В этом слу?ае вероятность ошибо?ного
выделения аномалии не превосходит 2%. Для минимально-аномальных пределов
(М(2s, М+2s) вероятность такой ошибки составляет более 5%, а для (М(s, М+s)
превышает 30%. Фрагменты у?астка, где зна?ения вели?ины лежат в пределах
(М(s, М+s), относят к фоновым.
Нормальный закон распределения - не единственный, встре?ающийся у
физи?еских вели?ин. В ?астности, для вели?ин, используемых в
электроразведке -удельного сопротивления, поляризуемости, кажущегося
сопротивления, кажущейся поляризуемости и др. - характерен логнормальный
закон распределения (по нормальному закону логарифмы зна?ений). Этому же
закону под?иняются зна?ения магнитной восприим?ивости пород. Для
логнормально распределенных вели?ин вместо среднего М и стандартного
отклонения s вы?исляют среднее зна?ение логарифмов Мlog и стандартное
отклонение логарифмов slog. Мlog и slog суть логарифмы некоторых вели?ин,
поэтому при указании минимально-аномальных пределов в этом слу?ае
используется интервал (exp(Мlog(mslog), exp(Мlog+mslog)), то есть
(Мгеом/(m,(m Мгеом), где Мгеом - среднее геометри?еское зна?ений [pic], а
(=exp(slog)- стандартный множитель (аналог стандартного отклонения).
Выделение аномальных зон по комплексу методов
Довольно ?асто набор данных таков, ?то по нему невозможно ?етко
выделить аномалии по правилу 'трех сигм'. Если на у?астке работ имеются
данные по нескольким геофизи?еским методам, совместные анализ слабых
аномалий разных методов может повысить достоверность выводов (прежде ?ем
делать такое сопоставление, данные разных методов следует свести к единой
сети наблюдения). Поскольку данные разных методов имеют разли?ные
размерности и масштабы (диапазоны изменения) вели?ин, перед сопоставлением
их следует представить в безразмерном виде и в едином масштабе вели?ин.
Для данных, отве?ающих нормальному закону распределения N(M,s), это
делается с помощью процедуры нормализации (стандартизации) - приведение к
закону N(0,1). Для каждого набора данных {x1, (, xN} вы?исляются его
среднее зна?ение М и стандартное отклонение s, после ?его вы?исляют
нормализованные (стандартизованные) зна?ения {[pic], (, [pic]}:[pic]
(предполагается, ?то для всех методов наборы данных упорядо?ены одинаково).
Для логнормально распределенных вели?ин та же процедура производится с их
логарифмами. Так для каждого метода полу?ают набор данных, отве?ающий
закону распределения N(0,1); такие наборы безразмерных вели?ин с одинаковым
законом распределения можно сопоставлять коли?ественно.
Стандартизованное зна?ение вели?ины - отклонение от среднего,
выраженное в стандартных отклонениях - выражает ее удаление от среднего, то
есть позволяет судить о нали?ии аномалии в то?ке, где эта вели?ина
измерена. Изолиния стандартизованной вели?ины по уровню b>0 оконтуривает
положительную (а по уровню -b - отрицательную) аномалию при минимально-
аномальных пределах (М(bs, М+bs) Нали?ие в одной области у?астка работ
слабых аномалий по разным методам позволяет с уверенностью говорить о
нали?ии в этой области объекта, порождающего такое со?етание аномалий. Для
коли?ественной характеристики аномальности то?ки с у?етом представлений о
природе объекта поиска по комплексу из К методов, давших одинаково
упорядо?енные наборы данных {x11, (, x1N},( {xК1, (, xКN}, введена функция
к(мплексного показателя (ФКП) [pic].
Веса qj вводятся интерпретатором для выражения представлений (априорной
информации) о том, какими аномалиями должен выражаться объект поиска в
полях методов, входящих в примененный комплекс. В простейшем слу?ае веса
берут равными по модулю, а знак веса - соответствующим ожидаемому знаку
аномалии. В таком слу?ае максимумы ФКП соответствуют местам наиболее
вероятного положения объекта.
Определение закона распределения вели?ины
Прежде ?ем применять правила выделения аномалий, сформулированные для
того или иного закона распределения, к конкретному набору данных, следует
удостовериться, ?то набор данных действительно имеет именно этот закон
распределения.
Имеется ряд критериев, позволяющих установить совпадение или
несовпадение законов распределения двух выборок. Все они основаны на
сравнении зна?ений функции распределения. Сравнение выборок по критерию
состоит в вы?ислении некоторой вели?ины (критерия) по зна?ениям
сравниваемых функций распределения и в сопоставлении вы?исленной вели?ины с
крити?еским зна?ением критерия. Если зна?ение критерия превосходит
крити?еское, законы распределения выборок не совпадают. Крити?еские
зна?ения для каждого критерия, зависящие от коли?ества зна?ений в выборках,
требуемой достоверности сравнения и других факторов, установлены отдельными
статисти?ескими исследованиями и определяются по таблицам или вы?исляются
по формулам. Известно много критериев сравнения законов распределения
выборок, в ?астности критерий (2 (среднеквадрати?еское отклонение функций
распределения выборок), критерий Колмогорова - Смирнова (максимальное
отклонение функций распределения выборок) и ряд иных. Если в ка?естве одной
из функций распределения для вы?исления критерия взять теорети?ескую
функцию распределения для того или иного закона, устанавливается совпадение
закона распределения выборки с этим теорети?еским законом распределения.
Чтобы установить закон распределения для данной выборки, следует:
1) вы?ислить зна?ения функции распределения для выборки в ряде то?ек;
2) предположить, ?то выборка имеет тот или иной теорети?еский закон
распределения, вы?ислить зна?ения функции распределения для выбранного
закона в тех то?ках, в которых вы?ислена функции распределения для
выборки;
3) выбрать критерий для сравнения законов, вы?ислить его зна?ение;
4) определить крити?еское зна?ение выбранного критерия, сравнить его в
вы?исленным зна?ением критерия;
5) принять решение о совпадении/несовпадении закона распределения выборки
и выбранного теорети?еского закона распределения.
Практи?еские приемы определения закона распределения
Определение закона распределения выборки на?инается с визуального
анализа графика плотности распределения (вариограммы) выборки. Для
построения графика диапазон изменения зна?ений выборки разбивают на
несколько (А) равных интервалов ширины Dх=(xmax - xmin)/A, xmin и xmax -
соответственно минимальное и максимальное зна?ения в выборке {x1, (, xN}.
За коли?ество интервалов А принимают вели?ину [pic]. Если нужно сократить
коли?ество интервалов, можно воспользоваться графиком-номограммой,
предложенной Е. М. Квятковским.
[pic]
Оценка ?исла интервалов А по объему выборки N (по Е. М. Квятковскому).
Далее для каждого интервала подс?итывается nj - коли?ество зна?ений, в
него попадающих (коли?ество зна?ений, удовлетворяющих соотношению xmin+(j-
1)Dх(xi вы?исляют для каждого интервала долю зна?ений, попавших в него, от общего
?исла зна?ений в выборке (?астость): pj= nj/N.
Вели?ина pj является вероятностью (по определению последней) того, ?то
зна?ение из выборки находится в j-ом интервале; ее относят к середине этого
интервала xmin+(j - 0.5)Dх. Далее в координатах р(х) строится гистограмма
или график ?астости; они аппроксимируют график плотности распределения
выборки.
Наряду с вариограммой выборки обы?но строится график накопленных
?астостей (ГНЧ). Накопленные ?астости вы?исляют как [pic], зна?ения (j
относят к левым границам интервалов xmin+jDх. ГНЧ выборки, о?евидно,
приближает функцию распределения для выборки.
[pic]
Вероятностный бланк (ось ординат оцифрована в %), аппроксимация ГНЧ выборки
прямой (критерий Анри) и зна?ение КС-критерия (D).
По форме вариограммы делаются предположения от законах распределения,
которым могут под?иняются зна?ения выборки. Если вариограмма имеет
единственный выраженный максимум и примерно симметри?на, всегда
предполагают нормальный закон распределения (как весьма распространенный).
Кроме того, при выдвижении гипотезы о законе распределения также
у?итываются априорные сведения о законах распределения характерных для
рассматриваемой физи?еской вели?ины. В ?астности, для данных
электроразведки обязательно рассматривается возможность логнормального
распределения.
Простейшим ка?ественным способом проверки на соответствие выборки
нормальному закону является построение функции распределения выборки на
вероятностном бланке. На вероятностном бланке изображена прямоугольная
система координат, у которой масштаб по оси ординат искажен (меняется) так,
?то график функции нормального распределения прямолинеен. На вероятностном
бланке строят ГНЧ для выборки. Если построенный ГНЧ хорошо аппроксимируется
прямой, с?итают, ?то зна?ения в выборке распределены по нормальному закону.
Такая проверка на соответствие нормальному закону называется проверкой по
критерию Анри.
Для выборок малого размера (десятки и первые сотни зна?ений) надежен
двусторонний критерий Колмогорова-Смирнова (КС-критерий). Для двух выборок
{x11, (, x1N}, {x21, (, x2N} его зна?ение определяется соотношением [pic],
(1j, (2j - накопленные ?астости для рассматриваемых выборок. Крити?еские
зна?ения КС-критерия для выборок из более ?ем 40 зна?ений при заданной
вероятности ошибо?ного решения 5% оценивают по формуле [pic] (при D,
выраженном в процентах). Если зна?ение КС-критерия не превышает
крити?еского, законы распределения выборок с?итаются совпадающими.
Чтобы установить совпадение закона распределения выборки с нормальным
законом, за один из наборов накопленных ?астостей следует принять зна?ения
нормального распределения N(M,s) на концах интервалов, использованных при
вы?ислении накопленных ?астостей выборки. Зна?ения M и s формально
вы?исляются по зна?ениям выборки соответственно как среднее арифмети?еское
и стандартное отклонение. Кроме этого, зна?ение D можно снять с ГНЧ выборки
на вероятностном бланке, как наибольшее расстояние (вдоль оси ординат)
между ГНЧ и аппроксимирующей его прямой.
Для установления совпадения закона распределения выборки с
логнормальным законом такие же действия проводятся с логарифмами зна?ений.
Многие статисти?еские процедуры автоматизированы в прикладных
программах. График на вероятностном бланке можно построить в программе
Golden Software Grapher. Построение вариограмм (гистограмм) и ГНЧ,
вы?исление зна?ений разли?ных функций распределения и ряд других операций
реализованы в наборе статисти?еских процедур электронных таблиц Microsoft
Excel. Имеется также ряд специализированных пакетов статисти?еской
обработки данных.
Пример обнаружения мест рудопроявления по данным комплекса методов
Для обнаружения потенциальных мест рудопроявлений полиметалли?еских руд
на у?астке размером 40 х 190 по сети 10 х 10 (координаты 'профиль-пикет')
выполнены профилирование методом вызванной поляризации по способу СГ и
съемка вертикальной компоненты магнитного поля. Результаты работ
представлены в виде карт кажущейся поляризуемости, кажущегося
сопротивления, и вертикальной компоненты аномального магнитного поля.
Выраженных аномалий, характерных для объектов поиска, на картах не
отме?ается.
Для комплексной интерпретации данных принято решение расс?итать функцию
комплексного показателя, исходя из того, ?то над объектами поиска должны
наблюдаться положительные аномалии ВП и магнитного поля и отрицательные
аномалии кажущегося сопротивления.
Для выбора параметров, по которым расс?итывается ФКП, определены законы
распределения наборов данных. Форма вариограмм вели?ин (один выраженный
максимум плотности распределения вероятности) позволяет предположить, ?то
они могут отве?ать нормальному закону распределения. Асимметри?ность
вариограмм кажущегося сопротивления и кажущейся поляризуемости и б(льшая
симметри?ность вариограмм логарифмов этих вели?ин, наряду с практикой,
которая показывает, ?то для данных электроразведки характерен логнормальный
закон распределения, позволяют также предположить возможность
логнормального распределения кажущегося сопротивления и кажущейся
поляризуемости.
[pic]
Данные профилирования ВП-СГ и магниторазведки
На вероятностном бланке ГНЧ логарифмов кажущихся сопротивления и
поляризуемости, а также данных магниторазведки хорошо приближаются прямой
линией. ГНЧ кажущихся сопротивления и поляризуемости зна?ительно
отклоняются от прямой. По критерию Анри это зна?ит, ?то логарифмы кажущихся
сопротивления и поляризуемости, а также данные магниторазведки, вероятно,
под?иняются нормальному закону распределения, то есть для кажущихся
сопротивления и поляризуемости выполняется логнормальный закон
распределения, а для данных магниторазведки - нормальный.
Для уто?нения вывода о законах распределения гипотезы о соответствии
законов распределения кажущихся поляризуемости и сопротивления, их
логарифмов и аномального магнитного поля нормальному закону проверены с
использованием КС-критерия. На границах интервалов ГНЧ каждой вели?ины
вы?ислены зна?ения нормального распределения для соответствующих среднего
арифмети?еского и стандартного отклонения. Установленные далее зна?ения КС-
критерия сопоставлены с его крити?еским зна?ением для выборки данного
размера (100 зна?ений) при вероятности ошибки 5%. Зна?ение КС-критерия для
кажущейся поляризуемости практи?ески совпадает с крити?еским и близко к
последнему для кажущегося сопротивления. Для логарифмов кажущихся
сопротивления и поляризуемости, а также данных магниторазведки зна?ения КС-
критерия в 3-4 раза меньше крити?еского. Зна?ения КС-критерия для
логарифмов кажущихся сопротивления и поляризуемости также в 3-4 раза
меньше, ?ем для самих кажущихся сопротивления и поляризуемости.
[pic]
Вариограммы и ГНЧ кажущихся поляризуемости и сопротивления, их логарифмов и
аномального магнитного поля.
Таким образом, для кажущихся сопротивления и поляризуемости следует
принять гипотезу о логнормальном законе распределения, а для данных
магниторазведки - о нормальном. Фоновые зна?ения полей приведены в таблице.

Результаты установления законов распределения и фоновых зна?ений полей

| |hк, |rк, |DZa, |
| |% |Ом(м |нТл |
|Закон |логнор|логнор|норм |
|распредeления |м |м | |
|Наивероятнейшее |0.84 |93 |-0.5 |
|зна?ение. | | | |
|Стандартное |1.52 |1.84 |6.9 |
|отклонение/множите| | | |
|ль | | | |
|Минимальное |0.55 |51 |-7.3 |
|фоновое зна?ение .| | | |
|Максимальное |1.28 |172 |6.4 |
|фоновое зна?ение .| | | |


[pic]
Исходя из этого, для рас?ета ФКП используются логарифмы зна?ений
кажущихся сопротивления и поляризуемости и зна?ения вертикальной компоненты
аномального магнитного поля. Исходя из представлений о природе аномалий
используемых полей над объектом поиска, для весов магнитного поля и
логарифма кажущейся поляризуемости принят знак '+', а для логарифма
кажущегося сопротивления - знак '('. По абсолютной вели?ине веса приняты
равными, так как нет оснований с?итать разли?ной достоверность зна?ений,
полу?енных разными методами.
Сопоставление карт стандартизованных зна?ений вели?ин, выбранных для
рас?ета ФКП показывает, ?то аномалий, выделяемых по правилу 'трех сигм' не
наблюдается. На ПК40-100 ПР0-20 отме?аются слабые положительные аномалии
кажущейся поляризуемости и магнитного поля и слабые отрицательные аномалии
кажущегося сопротивления, то есть отме?ается набор признаков, характерный
для объекта поиска. На карте ФКП максимум отме?ается на ПК50-90 ПР10. Этот
у?асток является наиболее вероятным местом рудопроявления.

[pic]

ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ
Задание
Для обнаружения потенциальных мест рудопроявлений полиметалли?еских руд
на у?астке размером 40 х 190 по сети 10 х 10 (координаты 'профиль-пикет')
выполнены: профилирование методом вызванной поляризации по способу СГ и
съемка вертикальной компоненты магнитного поля. Координаты то?ек наблюдения
и измеренные зна?ения приведены в предложенном варианте. Над объектами
поиска предполагаются положительные аномалии ВП и магнитного поля и
отрицательные аномалии кажущегося сопротивления.
По предложенным данным:
. построить карты измеренных полей (то?ность съемки ВП с?итать 5%,
то?ность магнитной съемки - 2 нТл), оценить нали?ие целевых аномалий в
полевых данных;
. установить законы распределения измеренных вели?ин, используя визуальный
анализ вариограмм, критерий Анри и критерий Колмогорова - Смирнова для
вероятности ошибки 5% (проверку производить на нормальный и логнормальный
закон); выбрать параметры для рас?ета ФКП);
. стандартизовать выбранные параметры, построить совмещенные карты целевых
аномалий;
. простейшим образом выбрать веса для рас?ета ФКП, расс?итать ФКП,
построить карту целевых аномалий ФКП;
. установить вероятные места рудопроялений на у?астке.
От?етный материал
Графика - карты измеренных полей, вариограммы и ГНЧ, использованные для
установления законов распределения, совмещенные карты целевых аномалий,
карта целевых аномалий ФКП.
Таблица результатов установления законов распределения и фоновых зна?ений
полей.
Пояснительная записка.
Образцы оформления графики и таблиц и содержания пояснительной записки
приведены в разделе 'Пример обнаружения мест рудопроявления по данным
комплекса методов'.