Функция распределения случайной величины. Виды распределения. Смотреть страницы где упоминается термин логарифмически-нормальное распределение Отрывок, характеризующий Логарифмическое распределение

Случайная переменная Y имеет логарифмически нормальное распределение с параметрами μ и σ, если случайная переменная X = lnY имеет нормальное распределение с теми же параметрами μ и σ. Зная характер связи между переменными X и Y, можем легко построить график плотности вероятности случайной переменной с логарифмически нормальным распределением (Рисунок 4.2).

Рисунок 4.2 – Кривые плотности логарифмически нормального распределения при различных значениях параметров μ и σ

Если случайная переменная X имеет функцию плотности вероятности, определяемую формулой (4.6), и если X = lnY, то:

Откуда имеем для у > 0:

Из определения следует, что случайная переменная, подчиняющаяся логарифмически нормальному распределению, может принимать только положительные значения. Как показано на рисунке 4.2, кривые функции f(y) имеют левостороннюю асимметрию, которая тем сильнее, чем больше значения параметров μ и σ. Каждая кривая имеет один максимум и является определенной для всех положительных значений у.

Вычисление математического ожидания и дисперсии случайной переменной с логарифмически нормальным распределением не составляет особых трудностей:

Путем подстановок и ввода новых переменных в интегралах 4.15 и 4.16 получим:

Вообще, для исчисления вероятности того, что случайная переменная Y с логарифмически нормальным распределением и плотностью f(y, μ, σ), примет значение в интервале (а, b), следует взять интеграл:

Однако на практике удобнее воспользоваться тем, что логарифм случайной переменной Y имеет нормальное распределение. Вероятность того, что а ≤ Y ≤ b равнозначна вероятности того, что
lnа ≤ lnY ≤ lnb.

Вычислим вероятность того, что случайная переменная с логарифмически распределением μ = 1, σ = 0,5, примет значение в интервале (2, 5). Имеем:

Из таблиц логарифмов находим ln2 = 0,6932 и ln5 = 1,6094.

Обозначив lnY = X, можем написать:

Причем случайная переменная X подчинена нормальному распределению со средним значением μ = 1 и стандартным отклонением σ = 0,5. Теперь искомую вероятность нетрудно вычислить по таблицам интегральной функции нормального распределения:

Вопросы для самоконтроля

1 Определение прямоугольного распределения.

2 График плотности вероятности случайной переменной с прямоугольным распределением

3 Основополагающее значение прямоугольного распределения.

4 Математическое ожидание и дисперсия случайной переменной в прямоугольном распределении.



5 Роль нормального распределения в математической статистике.

6 Что такое нормальное распределение и как оно связано с биномиальным?

7 График плотности вероятности случайной переменной с нормальным распределением.

8 Какими статистическими параметрами может быть задано нормальное распределение?

9 Почему нормальное распределение является непрерывным?

10 Уравнение нормальной кривой.

11 Что такое нормированное отклонение?

12 Уравнение кривой нормального распределения в нормированной форме.

13 Какими значениями μ и σ характеризуется нормальная совокупность в нормированной форме?

14 Какая доля данных выборки укладывается в пределах ±1σ, ±2σ, ±3σ?

15 Что показывает таблица нормального интеграла вероятностей?

16 Уравнение логарифмически нормальной кривой.

17 График плотности вероятности случайной переменной с логарифмически нормальным распределением.

18 Какие необходимо выполнить преобразования, чтобы из логарифмически нормального распределения получить нормальное распределение?

19 Какими статистическими параметрами задается логарифмически нормальное распределение?

ТЕМА 5 Распределения параметров выборки

5.1 t – распределение Стьюдента

5.2 F-распределение Фишера–Снедекора

5.3 χ 2 –распределение

5.1 t – распределение Стьюдента

Закон нормального распределения проявляется при числе признаков n > 20–30. Однако экспериментатор часто проводит ограниченное число измерений, основывает свои выводы на малых выборках. При небольшом числе наблюдений результаты обычно близки и редко появляются большие отклонения. Это легко объяснить законом нормального распределения, согласно которому вероятность появления малых отклонений больше, чем отклонений значительных. Так, вероятность отклонений, превышающих по абсолютной величине ±2σ, равна 0,05, или один случай на 20 измерений, а отклонений ± 3σ – 0,01, или один случай на 100.

Если же полевой опыт проводят, например, в 4 – 6 повторностях, то естественно ожидать, что среди показаний урожаев на параллельных делянках очень больших отклонений не будет. Поэтому стандартное отклонение s, подсчитанное по малой выборке, в большинстве случаев будет меньше, чем по всей генеральной совокупности . Следовательно, в этих случаях полагаться на критерии нормального распределения в своих выводах нельзя.

С начала XX века в математической статистике стало разрабатываться новое направление, которое можно назвать статистикой малых выборок. Наибольшее практическое значение для экспериментальной работы имело открытое в 1908 г. английским статистиком и химиком В. Госсетом t–распределение, получившее название распределения Стьюдента (англ. стьюдент – студент, псевдоним В. Госсета).

Распределение t Стьюдента для выборочных средних определяется равенством:

Числитель формулы означает отклонение выборочной средней от средней всей совокупности , а знаменатель:

– является показателем, оценивающим величину стандартной ошибки средней выборочной совокупности.

Таким образом, величина t измеряется отклонением выборочной средней от средней совокупности , выраженным в долях ошибки выборки , принятой за единицу.

Максимумы частоты нормального и t-распределения совпадают, но форма кривой t-распределения всецело зависит от числа степеней свободы. При очень малых значениях степеней свободы она принимает вид плосковершинной кривой, причем площадь, отграниченная кривой, больше, чем при нормальном распределении, а при увеличении числа наблюдений (n > 30) распределение t приближается к нормальному и переходит в него при n = ∞.

На рисунке 1.1 представлено дифференциальное и интегральное распределение t-Стьюдента при 10 степенях свободы.

Рисунок 5.1 – Дифференциальное (слева) и интегральное (справа) распределение t–Стьюдента

Распределение t–Стьюдента имеет важное значение при работе с малыми выборками: позволяет определить доверительный интервал, накрывающий среднюю совокупности , и проверить ту или иную гипотезу относительно генеральной совокупности. При этом нет необходимости знать параметры совокупности и , достаточно иметь их оценки μ и σ для определенного объема выборки n.

5.1.1 Проблема Беренса–Фишера

Проверка гипотезы о генеральных средних двух групп с нормальным распределением и неравными дисперсиями в математической статистике называется проблемой Беренса–Фишера и имеет в настоящее время только приближенные решения. Почему так важно требование равенства дисперсий в сравниваемых группах? Не вдаваясь в детали этой проблемы, отметим, что чем больше различаются между собой дисперсии и объемы выборок, тем сильнее отличается распределение "вычисляемого t-критерия" от распределения "t-критерия Стьюдента". При этом различную величину имеет как сам t-критерий, так и такой параметр этих распределений, как число степеней свободы. В свою очередь число степеней свободы сказывается на величине достигнутого (критического) уровня значимости (р < ...) определяемого для вычисленного значения t-критерия.

Пренебрежение исследователями, приведенными выше условиями допустимости использования t-критерия Стьюдента, приводит к существенному искажению результатов проверки гипотез о равенстве средних. Поэтому в работах, где проверка гипотез о равенстве двух средних производилась с помощью t-критерия Стьюдента, и нет упоминания критериев проверки нормальности распределения и равенства дисперсий, имеются основания предполагать некорректное использование авторами данного критерия, а стало быть, и сомнительность декларируемых ими выводов.

Другая частая ошибка – применение t–критерия Стьюдента для проверки гипотез о равенстве трех и более групповых средних. В этом случае необходимо применять так называемую общую линейную модель, реализованную в процедуре однофакторного дисперсионного анализа с фиксированными эффектами.

Рассмотрим подробнее особенности использования t–критерия Стьюдента. Наиболее часто t–критерий используется в двух случаях. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t–критерий). В этом случае есть контрольная группа и опытная группа, состоящая из разных объектов, количество которых в группах может быть различно. Во втором же случае используется так называемый парный t–критерий, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних. Поэтому эти выборки называют зависимыми, связанными. Например, измеряется содержание лейкоцитов у здоровых животных, а затем у тех же самых животных после облучения определенной дозой излучения. В обоих случаях должно выполняться требование нормальности распределения исследуемого признака в каждой из сравниваемых групп. Доминирование t–критерия Стьюдента в подавляющем большинстве работ отражает два важных аспекта.

Во-вторых, это говорит также и о том, что этим авторам неизвестны какие-либо альтернативы данному критерию, либо они не в состоянии ими самостоятельно воспользоваться. Можно без преувеличения сказать, что в настоящее время бездумное применение t–критерия Стьюдента в большинстве биологических работ приносит больше вреда, нежели пользы.

5.2 F-распределение Фишера–Снедекора

Если из нормально распределенной совокупности взять две независимые выборки объемом n 1 и n 2 и подсчитать дисперсии и со степенями свободы ν 1 = n –1 и ν 2 = n 2 –1, то можно определить отношение дисперсий:

Отношение дисперсий берут таким, чтобы в числителе была большая дисперсия, и поэтому F ≥ 1.

Распределение F зависит только от числа степеней свободы ν 1 и ν 2 (закон F-распределения открыл Р.А. Фи шер). Когда две сравниваемые выборки являются случайными независимыми из общей совокупности с генеральной средней , то фактическое значение F не выйдет за определенные пределы и не превысит критическое для данных ν 1 и ν 2 теоретическое значение критерия F (F факт < F теор). Если генеральные параметры сравниваемых групп различны, то F факт > F теор. Теоретические значения F для 5%-ного и 1%-ного уровня значимости даны в таблице, где табулированы только правые критические точки для F ≥ 1, так как всегда принято находить отношение большей дисперсии к меньшей.

Кривые, полученные из функции распределения для всех возможных значений F, особенно при небольшом числе наблюдений, имеют асимметричную форму – длинный «хвост» больших значений и большую концентрацию малых величин F (рисунок 5.2).

Рисунок 5.2 – Дифференциальное (слева) и интегральное (справа)
F-распределение Фишера–Снедекора

Отметим, что t–распределение Стьюдента является частным случаем F–распределения при числе степеней свободы ν 1 = 1 и ν 2 = ν, т. е. равно числу степеней свободы для распределения t. В этом случае наблюдается следующее соотношение между F и t:

5.3 χ 2 –распределение

Многие фактические распределения соответствуют моделям теоретических распределений (нормальное, биномиальное, Пуассона) Однако, на практике существуют распределения, сильно отличающиеся от нормального. Для оценки степени расхождения или степени согласия между численностями фактического и теоретического распределений вводятся статистические критерии согласия, например критерий χ 2 . Этот критерий применяется для решения задач статистического анализа, например для проверки гипотез: о независимости двух принципов, положенных в основу группировки результатов наблюдений из одной совокупности; об однородности групп в отношении некоторых определяемых характеристик; о согласии теоретической и экспериментальной кривых численностей. Критерий χ 2 может называться как критерием согласия, так и критерием независимости, критерием однородности. Закон распределения χ 2 (хи–квадрат) открыл К. Пирсон. Кривая распределения, полученная из функции хи–квадрат:

где f – фактические и F – теоретические частоты численности объектов выборки. Ее вид в сильной степени зависит от числа степеней свободы. Для малого числа степеней свободы ν кривая асимметрична (рисунок 5.3), но с увеличением ν асимметрия уменьшается и при ν = ∞ кривая становится нормальной гауссовой.

Распределение χ 2 , так же как и t–распределение, частный случай
F – распределения при ν 1 = ν и ν 2 = ∞.

Рисунок 5.3 – Дифференциальное (слева) и интегральное (справа)
χ 2 –распределение

Вопросы для самоконтроля

1 В каких случаях предпочтительнее использовать t-распределение Стьюдента, а не нормальное распределение?

2 Какие величины необходимо оценивать для использования t-распределения Стьюдента?

3 В чем суть проблемы Беренса–Фишера?

4 Чем численно выражается F-распределение для двух независимых выборок из общей совокупности переменных?

5 От каких характерных величин случайных переменных зависит F-распределение?

6 На какие вопросы может ответить значение критерия χ 2 при статистической обработке экспериментальных данных?

ТЕМА 6 Основы математической статистики

6.1 Средние величины

6.2 Средняя арифметическая

6.3 Средняя геометрическая

6.4 Средняя гармоническая

Случайная величина называется логарифмически-нормально распределенной, если ее логарифм подчинен нормальному закону распределения.

Это означает, в частности, что значения логарифмически-нормальной случайной величины формируются под воздействием очень большого числа взаимно независимых факторов, причем воздействие каждого отдельного фактора «равномерно незначительно» и равновероятно по знаку. При этом в отличие от схемы формирования механизма нормального закона последовательный характер воздействия случайных факторов таков, что случайный прирост, вызываемый действием каждого следующего фактора, пропорционален уже достигнутому к этому моменту значению исследуемой величины (в этом случае говорят о мультипликативном характере воздействия фактора). Математически сказанное может быть формализовано следующим образом. Если - неслучайная компонента исследуемого признака (т. е. как бы «истинное» значение в идеализированной схеме, когда устранено влияние всех случайных факторов), - численное выражение эффектов воздействия упомянутых выше случайных факторов, то последовательно трансформированные действием этих факторов значения исследуемого признака будут:

Отсюда легко получить

где . Но правая часть (6.11) есть результат аддитивного действия множества случайных факторов, что при сделанных выше предположениях должно приводить, как мы знаем (см. п. 6.1.5, а также § 7.3, посвященный центральной предельной теореме), к нормальному распределению этой суммы.

В то же время, учитывая достаточную многочисленность числа случайных слагаемых (т. е. полагая ) и относительную незначительность воздействия каждого из них (т. е. полагая ), можно от суммы в левой части (6.11) перейти к интегралу

Это. и означает в конечном счете, что логарифм интересующей нас величины (уменьшенный на постоянную величину подчиняется нормальному закону с нулевым средним значением, т. е.

откуда дифференцированием по x левой и правой частей этого соотношения получаем

(правомерность использованного при вычислении тождества вытекает из строгой монотонности преобразования

Описанная схема формирования значений логарифмически-нормальной случайной величины оказывается характерной для многих конкретных физических и социально-экономических ситуаций (размеры и вес частиц, образующихся при дроблении; заработная плата работника; доход семьи; размеры космических образований; долговечность изделия, работающего в режиме износа и старения и др.; см., например, , , ).

Пример 6.1. В качестве случайной величины рассматривается душевой месячный доход (в долларах) семьи некоторой совокупности семей. Обследовано n=750 семей.

Таблица 6.1

Таблица 6.2

В табл. 6.1 и 6.2 приведены результаты группировки выборочных данных и их логарифмов соответственно (ширина интервала группирования равна 25 долларам). На рис. 6.1, а, б изображены гистограммы и плотности соответственно логарифмически-нормального и нормального законов распределения.

Рис. 6 1. Гистограмма и теоретическая (модельная) плотность, характеризующие распределение семей по среднедушевому месячному доходу (а) и по логарифму среднедушевого месячного дохода (б)

Ниже приводятся результаты вычисления основных числовых характеристик логарифмически-нормального распределения (в терминах параметров закона а и ):

Из этих выражений видно, что асимметрия и эксцесс логарифмически-нормального распределения всегда положительны (и тем ближе к нулю, чем ближе к нулю ), а мода, медиана и среднее выстраиваются как раз в том порядке, который мы видим на рис. 5.8, причем они будут стремиться к слиянию (а кривая плотности - к симметрии) по мере стремления к нулю величины При этом, хотя значения логарифмически-нормальной случайной величины образуются как «случайные искажения» некоторого «истинного значения» а, последнее в конечном счете выступает не в роли среднего значения, а в роли медианы.


Логарифмически нормальная функция распределения нашла широкое применение при анализе надежности объектов техники, биологии, экономики и др. Например, функцию успешно применяют для описания наработки до отказа подшипников, электронных приборов и других изделий.

Неотрицательные случайные значения некоторого параметра распределены логарифмически нормально, если его логарифм распределен нормально. Плотность распределения для различных значений σ приведена на рис. 4.3.

Рис. 4.3.

Плотность распределения описывается зависимостью

где М х и σ – параметры, оцениваемые по результатам п испытаний до отказа:

(4.4)

Для логарифмически нормального закона распределения функция надежности

(4.5)

Вероятность безотказной работы можно определить по таблицам для нормального распределения (см. табл. П6.1 приложения 6) в зависимости от значения квантиля

Математическое ожидание наработки до отказа

Среднее квадратическое отклонение и коэффициент вариации соответственно будут равны

Если v x 0,3, то полагают, что ν x = σ, при этом ошибка составляет не более 1%.

Часто применяют запись зависимостей для логарифмически нормального закона распределения в десятичных логарифмах. В соответствии с этим законом плотность распределения

Оценки параметров lg x 0 и σ определяют по результатам испытаний:

Математическое ожидание М х, среднее квадратическое отклонение σ x и коэффициент вариации ν x наработки до отказа соответственно равны

Пример 4.6

Определить вероятность безотказной работы редуктора в течение t = 103 ч, если ресурс распределен логарифмически нормально с параметрами lg t 0 = 3,6; σ = 0,3.

Решение

Найдем значение квантиля и определим вероятность безотказной работы:

Ответ: R (t ) = 0,0228.

Распределение Вейбулла

Функция распределения Вейбулла представляет собой двухпараметрическое распределение. Описываемый ею закон является универсальным, так как при соответствующих значениях параметров превращается в нормальное, экспоненциальное и другие виды распределений. Автор данного закона распределения В. Вейбулл использовал его при описании и анализе экспериментально наблюдавшихся разбросов усталостной прочности стали, пределов ее упругости. Закон Вейбулла удовлетворительно описывает наработку до отказа подшипников, элементов электронной аппаратуры, его используют для оценки надежности деталей и узлов машин, в том числе автомобилей, а также для оценки надежности машин в процессе их приработки. Плотность распределения описывается зависимостью

где α – параметр формы кривой распределения; λ – параметр масштаба кривой распределения.

График функции плотности распределения приведен на рис. 4.4.

Рис. 4.4.

Функция распределения Вейбулла

Функция надежности для этого закона распределения

Математическое ожидание случайной величины х равно

где Г(x ) – гамма-функция.

Для непрерывных значений х

Для целочисленных значений х гамма-функцию вычисляют по формуле

также верны формулы

Дисперсия случайной величины равна

Широкое применение при анализе и расчетах надежности изделий закона распределения Вейбулла объясняется тем, что этот закон, обобщая экспоненциальное распределение, содержит дополнительный параметр α.

Подбирая нужным образом параметры а и λ, можно получить лучшее соответствие расчетных значений опытным данным по сравнению с экспоненциальным законом, который является однопараметрическим (параметр λ).

Так, для изделий, у которых имеются скрытые дефекты, но которые длительное время не используются (а значит, медленнее стареют), опасность отказа имеет наибольшее значение в начальный период, а потом быстро падает. Функция надежности для такого изделия хорошо описывается законом Вейбулла с параметром α < 1.

Наоборот, если изделие хорошо контролируется при изготовлении и почти не имеет скрытых дефектов, но подвергается быстрому старению, то функция надежности описывается законом Вейбулла с параметром α > 1. При α = 3,3 распределение Вейбулла близко к нормальному.

Функция вероятности
Функция распределения
Обозначение \mathrm{Log}(p)
Параметры 0 < p < 1
Носитель k \in \{1,2,3,\dots\}
Функция вероятности \frac{-1}{\ln(1-p)} \; \frac{\;p^k}{k}
Функция распределения 1 + \frac{\Beta_p(k+1,0)}{\ln(1-p)}
Математическое ожидание \frac{-1}{\ln(1-p)} \; \frac{p}{1-p}
Медиана
Мода 1
Дисперсия -p \;\frac{p + \ln(1-p)}{(1-p)^2\,\ln^2(1-p)}
Коэффициент асимметрии
Коэффициент эксцесса
Дифференциальная энтропия
Производящая функция моментов \frac{\ln(1 - p\,\exp(t))}{\ln(1-p)}
Характеристическая функция \frac{\ln(1 - p\,\exp(i\,t))}{\ln(1-p)}

Логарифмическое распределение в теории вероятностей - класс дискретных распределений. Логарифмическое распределение используется в различных приложениях, включая математическую генетику и физику.

Определение

Пусть распределение случайной величины Y задаётся функцией вероятности:

p_Y(k) \equiv \mathbb{P}(Y=k) = -\frac{1}{\ln(1-p)} \frac{p^k}{k},\; k=1,2,3,\ldots,

где 0

Тогда говорят, что Y имеет логарифмическое распределение с параметром p. Пишут: Y \sim \mathrm{Log}(p).

Функция распределения случайной величины Y кусочно-постоянна со скачками в натуральных точках:

F_Y(y) = \left\{

\begin{matrix} 0, & y < 1 & \\ 1 + \frac{\mathrm{B}_p(k+1,0)}{\ln (1-p)},\; & y \in ,\; 0

\sum\limits_{k=1}^{\infty}p_Y(k) = 1.

Моменты

Производящая функция моментов случайной величины Y \sim \mathrm{Log}(p) задаётся формулой

M_Y(t) = \frac{\ln\left}{\ln},

\mathbb{E}[Y] = - \frac{1}{\ln(1-p)} \frac{p}{1-p}, \mathrm{D}[Y] = -p \;\frac{p + \ln(1-p)}{(1-p)^2\,\ln^2(1-p)}.

Связь с другими распределениями

Пуассоновская сумма независимых логарифмических случайных величин имеет отрицательное биномиальное распределение. Пусть \{X_i\}_{i=1}^n последовательность независимых одинаково распределённых случайных величин, таких что X_i \sim \mathrm{Log}(p), \; i=1,2,\ldots. Пусть N \sim \mathrm{P}(\lambda) - Пуассоновская случайная величина. Тогда

Y = \sum\limits_{i=1}^N X_i \sim \mathrm{NB}.

Приложения

п Вероятностные распределения
Одномерные Многомерные
Дискретные: Бернулли | Биномиальное | Геометрическое | Гипергеометрическое | Логарифмическое | Отрицательное биномиальное | Пуассона | Дискретное равномерное Мультиномиальное
Абсолютно непрерывные: Бета | Вейбулла | Гамма | Гиперэкспоненциальное | Распределение Гомпертца | Колмогорова | Коши | Лапласа | Логнормальное | Нормальное (Гаусса) | Логистическое | Накагами | Парето | Пирсона | Полукруговое | Непрерывное равномерное | Райса | | Копула

Напишите отзыв о статье "Логарифмическое распределение"

Отрывок, характеризующий Логарифмическое распределение

– Отступать! Все отступать! – прокричал он издалека. Солдаты засмеялись. Через минуту приехал адъютант с тем же приказанием.
Это был князь Андрей. Первое, что он увидел, выезжая на то пространство, которое занимали пушки Тушина, была отпряженная лошадь с перебитою ногой, которая ржала около запряженных лошадей. Из ноги ее, как из ключа, лилась кровь. Между передками лежало несколько убитых. Одно ядро за другим пролетало над ним, в то время как он подъезжал, и он почувствовал, как нервическая дрожь пробежала по его спине. Но одна мысль о том, что он боится, снова подняла его. «Я не могу бояться», подумал он и медленно слез с лошади между орудиями. Он передал приказание и не уехал с батареи. Он решил, что при себе снимет орудия с позиции и отведет их. Вместе с Тушиным, шагая через тела и под страшным огнем французов, он занялся уборкой орудий.
– А то приезжало сейчас начальство, так скорее драло, – сказал фейерверкер князю Андрею, – не так, как ваше благородие.
Князь Андрей ничего не говорил с Тушиным. Они оба были и так заняты, что, казалось, и не видали друг друга. Когда, надев уцелевшие из четырех два орудия на передки, они двинулись под гору (одна разбитая пушка и единорог были оставлены), князь Андрей подъехал к Тушину.
– Ну, до свидания, – сказал князь Андрей, протягивая руку Тушину.
– До свидания, голубчик, – сказал Тушин, – милая душа! прощайте, голубчик, – сказал Тушин со слезами, которые неизвестно почему вдруг выступили ему на глаза.

Ветер стих, черные тучи низко нависли над местом сражения, сливаясь на горизонте с пороховым дымом. Становилось темно, и тем яснее обозначалось в двух местах зарево пожаров. Канонада стала слабее, но трескотня ружей сзади и справа слышалась еще чаще и ближе. Как только Тушин с своими орудиями, объезжая и наезжая на раненых, вышел из под огня и спустился в овраг, его встретило начальство и адъютанты, в числе которых были и штаб офицер и Жерков, два раза посланный и ни разу не доехавший до батареи Тушина. Все они, перебивая один другого, отдавали и передавали приказания, как и куда итти, и делали ему упреки и замечания. Тушин ничем не распоряжался и молча, боясь говорить, потому что при каждом слове он готов был, сам не зная отчего, заплакать, ехал сзади на своей артиллерийской кляче. Хотя раненых велено было бросать, много из них тащилось за войсками и просилось на орудия. Тот самый молодцоватый пехотный офицер, который перед сражением выскочил из шалаша Тушина, был, с пулей в животе, положен на лафет Матвевны. Под горой бледный гусарский юнкер, одною рукой поддерживая другую, подошел к Тушину и попросился сесть.


Случайная переменная Y имеет логарифмически нормальное распределение с параметрами μ и σ, если случайная переменная X = lnY имеет нормальное распределение с теми же параметрами μ и σ. Зная характер связи между переменными X и Y, можем легко построить график плотности вероятности случайной переменной с логарифмически нормальным распределением (Рисунок 4.2).

Рисунок 4.2 – Кривые плотности логарифмически нормального распределения при различных значениях параметров μ и σ

Если случайная переменная X имеет функцию плотности вероятности, определяемую формулой (4.6), и если X = lnY, то:

Откуда имеем для у > 0:

Из определения следует, что случайная переменная, подчиняющаяся логарифмически нормальному распределению, может принимать только положительные значения. Как показано на рисунке 4.2, кривые функции f(y) имеют левостороннюю асимметрию, которая тем сильнее, чем больше значения параметров μ и σ. Каждая кривая имеет один максимум и является определенной для всех положительных значений у.

Вычисление математического ожидания и дисперсии случайной переменной с логарифмически нормальным распределением не составляет особых трудностей:

Путем подстановок и ввода новых переменных в интегралах 4.15 и 4.16 получим:

Вообще, для исчисления вероятности того, что случайная переменная Y с логарифмически нормальным распределением и плотностью f(y, μ, σ), примет значение в интервале (а, b), следует взять интеграл:

Однако на практике удобнее воспользоваться тем, что логарифм случайной переменной Y имеет нормальное распределение. Вероятность того, что а ≤ Y ≤ b равнозначна вероятности того, что
lnа ≤ lnY ≤ lnb.

Вычислим вероятность того, что случайная переменная с логарифмически распределением μ = 1, σ = 0,5, примет значение в интервале (2, 5). Имеем:

Из таблиц логарифмов находим ln2 = 0,6932 и ln5 = 1,6094.

Обозначив lnY = X, можем написать:

Причем случайная переменная X подчинена нормальному распределению со средним значением μ = 1 и стандартным отклонением σ = 0,5. Теперь искомую вероятность нетрудно вычислить по таблицам интегральной функции нормального распределения:

Вопросы для самоконтроля

1 Определение прямоугольного распределения.

2 График плотности вероятности случайной переменной с прямоугольным распределением

3 Основополагающее значение прямоугольного распределения.

4 Математическое ожидание и дисперсия случайной переменной в прямоугольном распределении.

5 Роль нормального распределения в математической статистике.

6 Что такое нормальное распределение и как оно связано с биномиальным?

7 График плотности вероятности случайной переменной с нормальным распределением.

8 Какими статистическими параметрами может быть задано нормальное распределение?

9 Почему нормальное распределение является непрерывным?

10 Уравнение нормальной кривой.

11 Что такое нормированное отклонение?

12 Уравнение кривой нормального распределения в нормированной форме.

13 Какими значениями μ и σ характеризуется нормальная совокупность в нормированной форме?

14 Какая доля данных выборки укладывается в пределах ±1σ, ±2σ, ±3σ?

15 Что показывает таблица нормального интеграла вероятностей?

16 Уравнение логарифмически нормальной кривой.

17 График плотности вероятности случайной переменной с логарифмически нормальным распределением.

18 Какие необходимо выполнить преобразования, чтобы из логарифмически нормального распределения получить нормальное распределение?

19 Какими статистическими параметрами задается логарифмически нормальное распределение?

ТЕМА 5 Распределения параметров выборки

5.1 t – распределение Стьюдента

5.2 F-распределение Фишера–Снедекора

5.3 χ 2 –распределение

5.1 t – распределение Стьюдента

Закон нормального распределения проявляется при числе признаков n > 20–30. Однако экспериментатор часто проводит ограниченное число измерений, основывает свои выводы на малых выборках. При небольшом числе наблюдений результаты обычно близки и редко появляются большие отклонения. Это легко объяснить законом нормального распределения, согласно которому вероятность появления малых отклонений больше, чем отклонений значительных. Так, вероятность отклонений, превышающих по абсолютной величине ±2σ, равна 0,05, или один случай на 20 измерений, а отклонений ± 3σ – 0,01, или один случай на 100.

Если же полевой опыт проводят, например, в 4 – 6 повторностях, то естественно ожидать, что среди показаний урожаев на параллельных делянках очень больших отклонений не будет. Поэтому стандартное отклонение s, подсчитанное по малой выборке, в большинстве случаев будет меньше, чем по всей генеральной совокупности . Следовательно, в этих случаях полагаться на критерии нормального распределения в своих выводах нельзя.

С начала XX века в математической статистике стало разрабатываться новое направление, которое можно назвать статистикой малых выборок. Наибольшее практическое значение для экспериментальной работы имело открытое в 1908 г. английским статистиком и химиком В. Госсетом t–распределение, получившее название распределения Стьюдента (англ. стьюдент – студент, псевдоним В. Госсета).

Распределение t Стьюдента для выборочных средних определяется равенством:

Числитель формулы означает отклонение выборочной средней от средней всей совокупности , а знаменатель:

– является показателем, оценивающим величину стандартной ошибки средней выборочной совокупности.

Таким образом, величина t измеряется отклонением выборочной средней от средней совокупности , выраженным в долях ошибки выборки , принятой за единицу.

Максимумы частоты нормального и t-распределения совпадают, но форма кривой t-распределения всецело зависит от числа степеней свободы. При очень малых значениях степеней свободы она принимает вид плосковершинной кривой, причем площадь, отграниченная кривой, больше, чем при нормальном распределении, а при увеличении числа наблюдений (n > 30) распределение t приближается к нормальному и переходит в него при n = ∞.

На рисунке 1.1 представлено дифференциальное и интегральное распределение t-Стьюдента при 10 степенях свободы.

Рисунок 5.1 – Дифференциальное (слева) и интегральное (справа) распределение t–Стьюдента

Распределение t–Стьюдента имеет важное значение при работе с малыми выборками: позволяет определить доверительный интервал, накрывающий среднюю совокупности , и проверить ту или иную гипотезу относительно генеральной совокупности. При этом нет необходимости знать параметры совокупности и , достаточно иметь их оценки μ и σ для определенного объема выборки n.

5.1.1 Проблема Беренса–Фишера

Проверка гипотезы о генеральных средних двух групп с нормальным распределением и неравными дисперсиями в математической статистике называется проблемой Беренса–Фишера и имеет в настоящее время только приближенные решения. Почему так важно требование равенства дисперсий в сравниваемых группах? Не вдаваясь в детали этой проблемы, отметим, что чем больше различаются между собой дисперсии и объемы выборок, тем сильнее отличается распределение "вычисляемого t-критерия" от распределения "t-критерия Стьюдента". При этом различную величину имеет как сам t-критерий, так и такой параметр этих распределений, как число степеней свободы. В свою очередь число степеней свободы сказывается на величине достигнутого (критического) уровня значимости (р < ...) определяемого для вычисленного значения t-критерия.

Пренебрежение исследователями, приведенными выше условиями допустимости использования t-критерия Стьюдента, приводит к существенному искажению результатов проверки гипотез о равенстве средних. Поэтому в работах, где проверка гипотез о равенстве двух средних производилась с помощью t-критерия Стьюдента, и нет упоминания критериев проверки нормальности распределения и равенства дисперсий, имеются основания предполагать некорректное использование авторами данного критерия, а стало быть, и сомнительность декларируемых ими выводов.

Другая частая ошибка – применение t–критерия Стьюдента для проверки гипотез о равенстве трех и более групповых средних. В этом случае необходимо применять так называемую общую линейную модель, реализованную в процедуре однофакторного дисперсионного анализа с фиксированными эффектами.

Рассмотрим подробнее особенности использования t–критерия Стьюдента. Наиболее часто t–критерий используется в двух случаях. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t–критерий). В этом случае есть контрольная группа и опытная группа, состоящая из разных объектов, количество которых в группах может быть различно. Во втором же случае используется так называемый парный t–критерий, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних. Поэтому эти выборки называют зависимыми, связанными. Например, измеряется содержание лейкоцитов у здоровых животных, а затем у тех же самых животных после облучения определенной дозой излучения. В обоих случаях должно выполняться требование нормальности распределения исследуемого признака в каждой из сравниваемых групп. Доминирование t–критерия Стьюдента в подавляющем большинстве работ отражает два важных аспекта.

Во-вторых, это говорит также и о том, что этим авторам неизвестны какие-либо альтернативы данному критерию, либо они не в состоянии ими самостоятельно воспользоваться. Можно без преувеличения сказать, что в настоящее время бездумное применение t–критерия Стьюдента в большинстве биологических работ приносит больше вреда, нежели пользы.

5.2 F-распределение Фишера–Снедекора

Если из нормально распределенной совокупности взять две независимые выборки объемом n 1 и n 2 и подсчитать дисперсии и со степенями свободы ν 1 = n –1 и ν 2 = n 2 –1, то можно определить отношение дисперсий:

Отношение дисперсий берут таким, чтобы в числителе была большая дисперсия, и поэтому F ≥ 1.

Распределение F зависит только от числа степеней свободы ν 1 и ν 2 (закон F-распределения открыл Р.А. Фи шер). Когда две сравниваемые выборки являются случайными независимыми из общей совокупности с генеральной средней , то фактическое значение F не выйдет за определенные пределы и не превысит критическое для данных ν 1 и ν 2 теоретическое значение критерия F (F факт < F теор). Если генеральные параметры сравниваемых групп различны, то F факт > F теор. Теоретические значения F для 5%-ного и 1%-ного уровня значимости даны в таблице, где табулированы только правые критические точки для F ≥ 1, так как всегда принято находить отношение большей дисперсии к меньшей.

Кривые, полученные из функции распределения для всех возможных значений F, особенно при небольшом числе наблюдений, имеют асимметричную форму – длинный «хвост» больших значений и большую концентрацию малых величин F (рисунок 5.2).

Рисунок 5.2 – Дифференциальное (слева) и интегральное (справа)
F-распределение Фишера–Снедекора

Отметим, что t–распределение Стьюдента является частным случаем F–распределения при числе степеней свободы ν 1 = 1 и ν 2 = ν, т. е. равно числу степеней свободы для распределения t. В этом случае наблюдается следующее соотношение между F и t:

5.3 χ 2 –распределение

Многие фактические распределения соответствуют моделям теоретических распределений (нормальное, биномиальное, Пуассона) Однако, на практике существуют распределения, сильно отличающиеся от нормального. Для оценки степени расхождения или степени согласия между численностями фактического и теоретического распределений вводятся статистические критерии согласия, например критерий χ 2 . Этот критерий применяется для решения задач статистического анализа, например для проверки гипотез: о независимости двух принципов, положенных в основу группировки результатов наблюдений из одной совокупности; об однородности групп в отношении некоторых определяемых характеристик; о согласии теоретической и экспериментальной кривых численностей. Критерий χ 2 может называться как критерием согласия, так и критерием независимости, критерием однородности. Закон распределения χ 2 (хи–квадрат) открыл К. Пирсон. Кривая распределения, полученная из функции хи–квадрат:

где f – фактические и F – теоретические частоты численности объектов выборки. Ее вид в сильной степени зависит от числа степеней свободы. Для малого числа степеней свободы ν кривая асимметрична (рисунок 5.3), но с увеличением ν асимметрия уменьшается и при ν = ∞ кривая становится нормальной гауссовой.

Распределение χ 2 , так же как и t–распределение, частный случай
F – распределения при ν 1 = ν и ν 2 = ∞.

Рисунок 5.3 – Дифференциальное (слева) и интегральное (справа)
χ 2 –распределение

Вопросы для самоконтроля

1 В каких случаях предпочтительнее использовать t-распределение Стьюдента, а не нормальное распределение?

2 Какие величины необходимо оценивать для использования t-распределения Стьюдента?

3 В чем суть проблемы Беренса–Фишера?

4 Чем численно выражается F-распределение для двух независимых выборок из общей совокупности переменных?

5 От каких характерных величин случайных переменных зависит F-распределение?

6 На какие вопросы может ответить значение критерия χ 2 при статистической обработке экспериментальных данных?

ТЕМА 6 Основы математической статистики

6.1 Средние величины

6.2 Средняя арифметическая

6.3 Средняя геометрическая

6.4 Средняя гармоническая