Документ взят из кэша поисковой машины. Адрес оригинального документа : http://www.sevin.ru/fundecology/Literature/tv3.html
Дата изменения: Fri Jan 27 17:24:04 2012
Дата индексирования: Tue Oct 2 13:41:49 2012
Кодировка: Windows-1251
Фундаментальная экология: Учебные материалы: В.Д. Мятлев, Л.А. Панченко, А. Т. Терехин. Характеристики распределений
Фундаментальная Экология
Фундаментальная Экология

НАУЧНО-ОБРАЗОВАТЕЛЬНЫЙ ПОРТАЛ

Кафедра общей экологии Биологического факультета МГУ им. М.В. Ломоносова
Институт проблем экологии и эволюции им. А.Н. Северцова РАН
  
Сегодня 

 Новости
 Научные семинары
 Научные коллективы
 Экология человека
 Диссертации
 Учебные материалы
 Конференции
 Книжная полка
 Выставки
 Полезные адреса
 О проекте
 Статистика

На главную страницу


3. ХАРАКТЕРИСТИКИ РАСПРЕДЕЛЕНИЙ

Полная информация о случайной величине дается ее распределением вероятностей (функцией распределения, функцией плотности). Однако для решения многих задач достаточно знать лишь некоторые числовые характеристики, называемые характеристиками распределения или случайной величины, дающие относительно полное представление о свойствах случайной величины. Важнейшими среди них являются математическое ожидание, дисперсия, среднее квадратическое отклонение, коэффициент вариации, моменты, центральные моменты, коэффициент асимметрии, коэффициент эксцесса, медиана, мода, первая квартиль, третья квартиль, интерквартильный размах, квантили.

 

3.1. Математическое ожидание

Определение. Математическим ожиданием случайной величины x (иногда применяется термин среднее или генеральное среднее) называется число (другие распространенные обозначения: , равное

если - дискретная случайная величина и

если - непрерывная случайная величина.

Математическое ожидание является характеристикой положения центра распределения, или, как иногда говорят, мерой центральной тенденции, или средним по вероятностям случайной величины.

В табл. 3.1 приведены значения математических ожиданий для рассмотренных в предыдущем пункте распределений. Читателю советуем, хотя бы для двух распределений одного дискретного и одного непрерывного, вычислить математические ожидания самостоятельно.


Таблица 3.1

Основные характеристики некоторых теоретических распределений

 

Распределение

Математическое ожидание

Дисперсия

Дискретное равномерное (множество возможных значений: )

Распределение Бернулли с параметром р

p

p(1-p)

Биномиальное распределение с параметрами n и p

nр

Np(1-p)

Распределение Пуассона с параметром

Равномерное распределение на отрезке [а,b]

Нормальное распределение с параметрами и

- распределение с п степенями свободы

t - распределение с п степенями свободы

 

n

 

0

 

2n

F - распределение с п и т степенями свободы

Экспоненциальное распределение с параметром Q

1/Q

Логнормальное распределение с параметрами

 

Свойства математического ожидания:

1.       МС = С, где С - константа

2.       , где a и b - константы

3.       Для любых двух случайных величин и

4.       Если и - независимые случайные величины, то

5.       Если некоторая функция, то (при довольно общих ограничениях)

для дискретной случайной величины и

для непрерывной случайной величины .

 

3.2. Дисперсия. Среднее квадратическое отклонение. Моменты

Для описания многих практически важных свойств случайной величины необходимо знание не только ее математического ожидания, но и отклонения возможных ее значений от среднего значения. Так, у случайных величин

математические ожидания совпадают и равны 0, но отклонение их от 0 разное.

Для измерения разброса значений случайной величины около среднего значения часто используют такие характеристики как дисперсия, среднее квадратическое отклонение, коэффициент вариации.

Определение. Дисперсией случайной величины называется число (другие распространенные обозначения: , равное

если - дискретная случайная величина, и

если - непрерывная случайная величина.

Дисперсия характеризует средний квадрат отклонения случайной величины от своего математического ожидания.

В табл. 3.1 приведены значения дисперсий для рассмотренных в предыдущем параграфе распределений. Читателю советуем, хотя бы для двух распределений - одного дискретного и одного непрерывного - вычислить дисперсии самостоятельно.

Свойства дисперсии:

1.      

2.      

3.       DС=0, где С - константа

4.       , где а и b - константы

5.       Если и - независимые случайные величины, то

Из свойств следует, что (докажите это), причем равенство имеет место только при . Т.е. минимизирует средний квадрат отклонения .

Сколь вероятными могут оказаться большие отклонения от ? Ответ на этот вопрос дает неравенство Чебышева, которое позволяет оценивать вероятность отклонения случайной величины от своего математического ожидания, зная лишь .

Приведем вывод этой формулы для дискретной случайной величины. Пусть случайная величина имеет конечную дисперсию и пусть - любое положительное число. Если в этой сумме выбросим все слагаемые, для которых , а оставшиеся множители , для которых , заменим их минимальным значением , то

Но

следовательно

Это соотношение называется неравенством Чебышева.

Определение. Средним квадратическим отклонением случайной величины (иногда применяется термин 'стандартное отклонение случайной величины') называется число , равное

Среднее квадратическое отклонение, следовательно, является, как и дисперсия, мерой рассеяния распределения, но измеряется, в отличие от дисперсии, в тех же единицах, которые используют для измерения значений случайной величины.

Определение. Коэффициентом вариации случайной величины называется число , равное, если ,

Таким образом, коэффициент вариации является, как и дисперсия, и среднее квадратическое отклонение, мерой рассеяния распределения, но служит для измерения среднего квадратического отклонения в долях математического ожидания.

Определения

1.       Моментом порядка (иногда применяют термин 'начальный момент порядка ') случайной величины называется число , равное

2.       Центральным моментом порядка случайной величины называется число , равное

Таким образом, математическое ожидание случайной величины есть момент первого порядка, а дисперсия - центральный момент второго порядка. Термин "момент" заимствован из теоретической механики. Известно, что первый момент , т.е. , - это абсцисса центра тяжести массы распределения, а второй центральный момент , т.е. , - момент инерции массы относительно перпендикулярной оси, проходящей через центр тяжести .

Кроме этих моментов наиболее часто используется третий и четвертый центральные моменты.

Определение. Коэффициентом асимметрии случайной величины называется величина

а коэффициентом эксцесса случайной величины - величина

Рис. 3.1. Пример распределений с положительной () и отрицательной () асимметрией.

 

Если плотность распределения случайной величины симметрична, то коэффициент асимметрии . На рис. 3.1 приведены графики функций плотности в двух случаях: . Для нормального распределения коэффициент эксцесса равен 3. Если же распределение сосредоточено вокруг среднего теснее, чем нормальное, то , в противном случае .

Задачи

1.       Вычислить математическое ожидание и дисперсию для распределения Бернулли с параметром p.

2.       Вычислить математическое ожидание и дисперсию для биномиального распределения с параметрами n и p.

3.       Вычислить математическое ожидание для Пуассоновского распределения.

4.       Cтанок может остановиться с вероятностью p. Число изготовленных деталей до остановки - случайная величина. Найти закон ее распределения и математическое ожидание.

5.       Доказать, что дисперсия числа появлений успеха при одном испытании не превосходит 1/4.

6.       В некоторой партии зерна 1/3 зерен невсхожие. Наугад выбираем 4 зерна. Случайная величина - число всхожих среди них зерен. Найти закон ее распределения, среднее и дисперсию.

 

3.3. Медиана. Мода. Квартили

Как уже говорилось, математическое ожидание является характеристикой положения центра распределения. Другими характеристиками положения являются медиана и мода.

Определение. Медианой случайной величины называется такое число Q2, что

и

Если - непрерывная случайная величина, то определение медианы полезно интерпретировать через функцию плотности, как это показано на рис. 3.2. Таким образом, для непрерывной случайной величины .

Рис. 3.2. Медиана распределения

 

Если распределение случайной величины симметрично, как, например, в случае нормального распределения, то медиана совпадает с математическим ожиданием. Иногда математическому ожиданию приписывается смысл медианы, что, конечно же, неверно, так как математическое ожидание и медиана для несимметричных распределений, вообще говоря, не совпадают.

Определение. Модой непрерывной случайной величины называется такое значение х, в котором f(x) достигает своего локального максимума.


Рис. 3.3. Мода, медиана и математическое ожидание.

Мода есть 'центр сгущения' случайной величины в смысле наиболее часто встречающихся значений случайной величины. Распределение с одной модой называется унимодальным, а распределение с несколькими модами - мультимодальным. Для симметричного унимодального распределения мода совпадает с математическим ожиданием, а следовательно, и с медианой. Как в случае с медианой, иногда математическому ожиданию приписывают смысл моды, что, конечно же, неверно, так как математическое ожидание и мода для несимметричных распределений не совпадают.

На рис. 3.3 для несимметричного унимодального распределения показаны все три характеристики положения распределения.

Можно ввести еще две характеристики распределения, аналогичные медиане: первую квартиль и третью квартиль.

Определение. Первой квартилью распределения случайной величины называется такое число Q1 что

и

а третьей квартилью распределения случайной величины называется такое число Q3, что

и

Если - непрерывная случайная величина, то это определение квартили полезно интерпретировать через функцию плотности в соответствии с рис. 3.4.

Рис. 3.4. Первая и третья квартили распределения.

 

Таким образом, для непрерывной случайной величины и. Следовательно, вероятность того, что случайная величина примет значение в интервале (Q1, Q3), равна

Заметим, что длина этого интервала Q3-Q1 называется интерквартильным размахом и может служить, аналогично среднеквадратическому отклонению, мерой рассеяния значений случайной величины.

 

3.4. Квантили

Определение. Квантилью порядка р распределения F(x) называется число Cp, такое, что F(Cp)=p

Для непрерывной случайной величины это определение полезно интерпретировать через функцию плотности, как показано на рис. 3.5.

Рис. 3.5. Графическая иллюстрация определения квантили.

Из определения квантили следует, что медиана есть квантиль порядка 0.5, первая квартиль - квантиль порядка 0.25, а третья квартиль - квантиль порядка 0.75.

Для некоторых, наиболее распространенных в математической статистике распределений созданы таблицы квантилей.

Очень часто, особенно в пакетах прикладных программ по статистической обработке, вместо термина 'квантиль' используется термин 'процентиль', когда порядок квантили выражается в процентах..