Есть данные о двух процедурах лечения пациентов:
Нужно использовать эти данные, чтобы определить какая из этих процедур играет большую роль. Можно ли сказать, что процедура A лучше, чем процедура B? У процедуры A выше средний показатель и лучше воспроизводимость, чем в методике B? Сложность заключается в том, что в данных присутствуют статистические флуктуации, и нельзя быть уверенным в найденных значениях. Проверки статистических данных помогут решить этот вопрос. Сначала обратим внимание на поведение выборок.
Поведение выборок
График ниже показывает распределение генеральной совокупности со средним X_ и среднеквадратическим отклонением S. Обычно мы не знаем этих значений, мы можем лишь оценить их по значениям среднего x_ и СКО s выборке. Если выборка достаточно большая и репрезентативная, можно ожидать, что:
Вопрос состоит в том, насколько большую разницу между X_ и x_ можно ожидать. Чтобы определить ее, нужно посмотреть на распределение средних значений большого числа выборок. Это нормальное распределение с математическим ожиданием и дисперсией:
Последнее равенство приблизительное. Дисперсия S’ называется ошибкой выборки. Чем больше размер выборки n, тем меньше ошибка.
Распределение выборки будет сходно с распределением генеральной совокупности, но не точно таким же. Средние значения выборок будут иметь более узкие распределения, их среднее X’_ должно быть таким же, как у генеральной совокупности.
Стандартное отклонение часто определяется экспериментально с помощью измерительного оборудования, и нужно иметь возможность включать данные из других выборок для получения более точной оценки.
Ожидается, что среднее значение генеральной совокупности должно быть расположено в интервале около среднего значения выборки:
Если z=2, среднее значение генеральной совокупности будет лежать внутри интервала в 95% случаев. Ширина этого доверительного интервала зависит от ? – доверительной вероятности.
Мы можем уменьшить этот интервал, уменьшая доверительную вероятность. Мы можем также уменьшить интервал, уменьшая ошибку выборки. Это можно сделать, увеличивая размер выборки или улучшая методику измерения для уменьшения s. Можно ожидать хороших доверительных оценок, если только данные удовлетворяют двум требованиям:
- Данные должны быть репрезентативной.
- Выборка должна быть большой.
Первое требование достаточно трудно достижимо на практике, поэтому неопределенность в результате часто высока.
Выбор размера выборки
Чтобы определить, насколько большой должна быть выборка, мы предполагаем, что мы знаем среднее значение X_ и СКО генеральной совокупности. Мы хотим ограничить ошибку выборки значением:
Если СКО генеральной совокупности уже меньше, чем желаемое значение ошибки выборки, то нужно лишь одно наблюдение:
В других случаях мы можем уменьшить ошибку выборки, проводя больше наблюдений:
Для примера возьмем:
Проведя 25 наблюдений, мы уменьшим ошибку выборки на 5. (Часто минимальное количество в выборке задается n=30.)
Заявка на патент
Каков доверительный интервал в выборках заявки на патент? Ошибки выборки равны:
Мы построили графики интервалов 95%. Они сильно перекрываются – разница не достаточно велика, чтобы одобрить патент…
Эта кривая погрешности использует в качестве легенды по осям x и y две матрицы:
Первая содержит две строковых переменных, вторая – границы интервалов.
Оценка при работе с категориями
Хотя уравнения для категорий схожи с уравнениями для чисел, два из них отличаются существенно.
Побочный эффект лекарства
Чтобы проиллюстрировать статистические расчеты при работе с категориями, мы посмотрим на побочный эффект лекарства. При испытаниях 26 из 374 пациентов (7%) чувствовали себя плохо, вместе с 4 из 410 (1%), которым давали плацебо:
Вопрос: это случайность, или необходимо заключить, что пациенты чувствуют себя плохо из-за лекарства?
Свойства выборок категорий
С данными категорий мы также обычно не знаем среднее значение вероятности и СКО генеральной совокупности, но мы можем оценить их по выборке. Параметры выборки:
СКО малой вероятности больше, чем сама вероятность. Это отличие от свойств чисел, где СКО обычно меньше в сравнении со средним. Ошибка выборки определяется также, как и для чисел:
Для уменьшения ошибки необходимо увеличивать число n. Относительная ошибка уменьшается в fраз:
Мы можем вывести уравнение для поиска необходимого числа наблюдений в выборке:
Например, если мы хотим уменьшить ошибку в 5 раз, мы находим для вероятности 0,1:
Если p близка к 0 или к 1, нужна большая выборка – часто это число достигает 1000. Мы ожидаем, что среднее значение вероятности генеральной совокупности лежит в интервале:
Для лекарства мы находим:
График погрешности показывает, что 95%-ные доверительные интервалы двух наборов данных не перекрываются – эти наборы данных совершенно различны. Значит, нужно заключить, что лекарство заставляет чувствовать себя плохо 10% больных.
Формальные проверки
Проверки можно провести более формально. Идея состоит в том, чтобы выявить, есть ли основания полагать, что есть разница между двумя наборами данных. В таблице ниже приведены уравнения для четырех тестов. Чтобы использовать уравнения для проверки, нужно заранее выбрать значение z.
Пример: заявка на патент
В примере с заявкой на патент мы приняли во внимание разницу между средними значениями двух выборок. Данные:
При z=2:
Это выражение истинно, поэтому мы не можем различить эти две выборки.
Пример: лекарство
В примере с лекарством данные:
При z=2:
Выражение ложно, поэтому:
Выбор z
При формальном испытании решающее значение имеет выбор величины z. Она определяет, в какой точке утверждение меняется от ложного до истинного.
Мы уже видели: малое z -> малая доверительная вероятность; большое z -> широкий доверительный интервал.
Доверительная вероятность 95% является хорошим компромиссом и часто используется в статистике. Однако, Вы не ограничены этим значением.
В зависимости от Вашей проблемы, Вы можете хотеть избежать различных участков распределения. Это зависит от того, какое значение z Вы выберите. Мы проиллюстрируем это на примере трех компонентов фармацевтического препарата. Красным выделены нежелаемые области.
Мы покажем расчет границ на рисунках выше, используя нормальное распределение и так называемое распределение Стьюдента. Распределение Стьюдента похоже на нормальное, но оно лучше для малых выборок. Используемые параметры:
Резюме
- Мы разделили три вида средних и СКО:
- генеральной совокупности X_, S;
- выборки x_, s;
- среднего многих выборок X’_=x_, S’=s/?n.
Последняя величина называется ошибкой выборки.
- Мы обычно оцениваем среднее и СКО генеральной совокупности по выборке. Ошибка выборки есть неопределенность в оценке среднего генеральной совокупности.
- Величина z=(x—X_)/S.
При z=2 можно ожидать, что 95% всех возможных средних значений выборок попадут в 95%-ный доверительный интервал:
- Выборки по данным категорий дают вероятность pи СКО s=?(p*(1-p)).
- Для более точной оценки параметров данных категории необходимы большие выборки, особенно если одна из вероятностей категорий мала.
- Простым путем проверки, есть ли разница между двумя наборами данных, является построение графика и сравнение их доверительных интервалов. Если они сильно перекрываются, разница не велика.
- Формальные методы проверки позволяют определить, случайна или нет разница между выборками:
Используемая ошибка выборки является комбинацией двух ошибок. Этот метод требует определения, какие значения z нужно включить, а какие исключить.
No comments yet.