В этом уроке мы рассмотрим некоторые распределения вероятностей. Два основных вида распределений:
- Дискретное распределение — случайная величина принимает дискретные, т.е. отдельные, определенные, значения, как в случае с подбрасыванием монеты или броском игральной кости.
- Непрерывное распределение — случайная величина может принимать любое значение в определенном интервале.
Дискретные распределения
В предыдущем уроке мы изучали распределение нулей и единиц, обозначающих получение орла или решки при подбрасывании монеты. Рассмотрим более сложный случай: будем подбрасывать монету определенное число раз (скажем, 20) и повторять эту процедуру много раз. Мы редко будем получать ноль или, наоборот, двадцать решек — чаще всего это будет число где-то в середине. Стоит вопрос, как будет распределено это число по различным сериям бросков. Такой случай описывается уравнением, которое выглядят угрожающе, но его легко задать в Mathcad. Это так называемое биномиальное распределение:
С помощью этого уравнения можно найти вероятность P для x случаев в испытании из nпопыток; p — это вероятность элементарного процесса, например 1/2 для получения орла при броске монеты, 1/6 для получения «5» при броске игральной кости, 1/36 для вытягивания туза пик из колоды карт и т.д. Функция Mathcad:
Ее можно найти в списке Функции -> Все функции -> Плотность вероятности. Параметры этой функции должны находиться в диапазонах:
Для описания случайных величин используется плотность распределения. Наибольшее значение функции достигается для 10 «решек» (половина всего числа бросков), ее значение равно при этом примерно 0,18.
Когда p*n>5 и (1-p)*n>5 (как в этом примере), биномиальное распределение симметрично и схоже с непрерывным нормальным распределением, как мы увидим позже.
Биномиальное распределение имеет математическое ожидание и дисперсию:
95% результатов испытаний попадают в диапазон:
Для заданного числа подбрасываний дисперсия достигает наибольшего значения при p=0,5.
На практике часто используется функция распределения. Она показывает, какая доля событий приходится на значения, меньшие или равные заданного. Для биномиального распределения эта функция равна:
Функция находится в списке Распределение вероятностей.
Ниже представлены вероятности вытащить 0, 1, 2, 3… туза пик из 20 колод карт.
Этот случай описывается распределением Пуассона:
Распределение Пуассона часто используется для описания распределения вероятности редких событий.
Непрерывные распределения
Если случайная величина может принимать любое значение в заданном диапазоне, используется непрерывное распределение вероятностей. Здесь также различают плотность и функцию распределения. Для непрерывного распределения вероятность события пропорциональна площади под кривой плотности вероятностей в интервале между интересуемыми значениями.
Одно из важнейших распределений — нормальное, или гауссовское, которое мы рассмотрели в предыдущем уроке. У него два параметра: математическое ожидание X_ и дисперсия S. Стандартная форма этого распределения:
Величина z — это разница между xи математическим ожиданием, измеренное в количестве дисперсий. Попробуйте запомнить это определение — мы часто будем использовать его в последующих уроках. Встроенная функция Mathcad:
Построим график функции dnorm со следующими значениями:
Построим графики для различных значений дисперсии:
Изменение математического ожидания сдвигает график вдоль горизонтальной оси:
Встроенная функция Mathcad для функции распределения и ее график:
Резюме
В этом уроке мы изучили следующие положения, являющиеся основой статистики и теории вероятностей:
1. Суть распределения, как дискретного, так и непрерывного.
2. Дискретное биномиальное распределение:
— плотность распределения dbinom(x,n,P);
— функция распределения pbinom(x,n,P).
3. Распределение Пуассона dpois(x,X_) для редких событий.
4. Непрерывное нормальное (гауссовское) распределение:
— плотность распределения dnorm(x,X_,S);
— функция распределения pnorm(x,X_,S).
5. Распределения часто описываются через величину z=(x—X_)/S.
6. Для биномиального и нормального распределения около 95% случаев лежит в диапазоне -2<z<2.
No comments yet.