Top menu

Урок 14. Распределение вероятностей в Mathcad

В этом уроке мы рассмотрим некоторые распределения вероятностей. Два основных вида распределений:

  1. Дискретное распределение — случайная величина принимает дискретные, т.е. отдельные, определенные, значения, как в случае с подбрасыванием монеты или броском игральной кости.
  2. Непрерывное распределение — случайная величина может принимать любое значение в определенном интервале.

Дискретные распределения

В предыдущем уроке мы изучали распределение нулей и единиц, обозначающих получение орла или решки при подбрасывании монеты. Рассмотрим более сложный случай: будем подбрасывать монету определенное число раз (скажем, 20) и повторять эту процедуру много раз. Мы редко будем получать ноль или, наоборот, двадцать решек — чаще всего это будет число где-то в середине. Стоит вопрос, как будет распределено это число по различным сериям бросков. Такой случай описывается уравнением, которое выглядят угрожающе, но его легко задать в Mathcad. Это так называемое биномиальное распределение:

mathcad14_01

С помощью этого уравнения можно найти вероятность P для x случаев в испытании из nпопыток; p — это вероятность элементарного процесса, например 1/2 для получения орла при броске монеты, 1/6 для получения «5» при броске игральной кости, 1/36 для вытягивания туза пик из колоды карт и т.д. Функция Mathcad:

mathcad14_02

Ее можно найти в списке Функции -> Все функции -> Плотность вероятности. Параметры этой функции должны находиться в диапазонах:

mathcad14_03

Для описания случайных величин используется плотность распределения. Наибольшее значение функции достигается для 10 «решек» (половина всего числа бросков), ее значение равно при этом примерно 0,18.

mathcad14_04

Когда p*n>5 и (1-p)*n>5 (как в этом примере), биномиальное распределение симметрично и схоже с непрерывным нормальным распределением, как мы увидим позже.

Биномиальное распределение имеет математическое ожидание и дисперсию:

mathcad14_05

95% результатов испытаний попадают в диапазон:

mathcad14_06

Для заданного числа подбрасываний дисперсия достигает наибольшего значения при p=0,5.

На практике часто используется функция распределения. Она показывает, какая доля событий приходится на значения, меньшие или равные заданного. Для биномиального распределения эта функция равна:

mathcad14_07

Функция находится в списке Распределение вероятностей.

mathcad14_08

Ниже представлены вероятности вытащить 0, 1, 2, 3… туза пик из 20 колод карт.

mathcad14_09

Этот случай описывается распределением Пуассона:

mathcad14_10

Распределение Пуассона часто используется для описания распределения вероятности редких событий.

Непрерывные распределения

Если случайная величина может принимать любое значение в заданном диапазоне, используется непрерывное распределение вероятностей. Здесь также различают плотность и функцию распределения. Для непрерывного распределения вероятность события пропорциональна площади под кривой плотности вероятностей в интервале между интересуемыми значениями.

Одно из важнейших распределений — нормальное, или гауссовское, которое мы рассмотрели в предыдущем уроке. У него два параметра: математическое ожидание X_ и дисперсия S. Стандартная форма этого распределения:

mathcad14_11

Величина z — это разница между xи математическим ожиданием, измеренное в количестве дисперсий. Попробуйте запомнить это определение — мы часто будем использовать его в последующих уроках. Встроенная функция Mathcad:

mathcad14_12

Построим график функции dnorm со следующими значениями:

mathcad14_13

Построим графики для различных значений дисперсии:

mathcad14_14

Изменение математического ожидания сдвигает график вдоль горизонтальной оси:

mathcad14_15

Встроенная функция Mathcad для функции распределения и ее график:

mathcad14_16

Резюме

В этом уроке мы изучили следующие положения, являющиеся основой статистики и теории вероятностей:

1. Суть распределения, как дискретного, так и непрерывного.

2. Дискретное биномиальное распределение:

— плотность распределения dbinom(x,n,P);

— функция распределения pbinom(x,n,P).

3. Распределение Пуассона dpois(x,X_) для редких событий.

4. Непрерывное нормальное (гауссовское) распределение:

— плотность распределения dnorm(x,X_,S);

— функция распределения pnorm(x,X_,S).

5. Распределения часто описываются через величину z=(xX_)/S.

6. Для биномиального и нормального распределения около 95% случаев лежит в диапазоне -2<z<2.