При простой случайной выборке отбор единиц в выборочную совокупность производится непосредственно из всей массы единиц генеральной совокупности в форме случайного отбора, при котором каждой единице генеральной совокупности обеспечивается одинаковая вероятность (возможность) быть выбранной. Единица отбора совпадает с единицей наблюдения. Случайный отбор осуществляется путем применения жеребьевки (лотереи) или путем использования таблиц случайных чисел.
Случайный отбор может быть проведен в двух формах: в форме возвратной (повторной) выборки и в форме безвозвратной (бесповторной) выборки. При повторном отборе вероятность попадания каждой единицы генеральной совокупности остается постоянной, так как после отбора какой-то единицы она снова возвращается в генеральную совокупность и может быть выбранной. При бесповторном отборе выбранная единица не возвращается в генеральную совокупность и вероятность попадания отдельных единиц в выборку все время изменяется (для оставшихся единиц она возрастает).
Применение простой случайной повторной выборки на практике весьма ограниченно; обычно используется бесповторная выборка.
Теорема П. Л. Чебышева утверждает принципиальную возможность определения генеральной средней по данным случайной повторной выборки. Теорема Чебышева дополняется теоремой А. М. Ляпунова, которая позволяет рассчитать максимальную ошибку выборочной средней при данном достаточно большом числе независимых наблюдений. Согласно этой теореме при достаточно большом числе независимых наблюдений в генеральной совокупности с конечной средней и ограниченной дисперсией вероятность того, что расхождение между выборочной и генеральной средней (х - х) не превзойдет по абсолютной величине некоторую величину t\i, равна интегралу Лапласа. Это можно записать так:
Приведем наиболее часто употребляемые уровни доверительной вероятности и соответствующие значения t для выборок достаточно большого объема (п > 30):
Величина средней ошибки в условиях большой выборки (п > 30) рассчитывается по известным из теории вероятностей формулам: а) при случайной повторной выборке:
б) при случайной бесповоротной выборке:
При расчете ошибок возникает существенное затруднение: величины а и р по генеральной совокупности неизвестны. Эти величины в условиях большой выборки заменяют величинами S (выборочная дисперсия) и w (выборочная доля), рассчитанными по выборочным данным. В табл. 22.1 приведены формулы расчета ошибок простой случайной выборки.
Формулы предельной ошибки позволяют решать задачи трех видов:
1. Определение пределов генеральных характеристик с заданной степенью надежности (доверительной вероятностью) на основе показателей, полученных по данным выборки.
Доверительные интервалы для генеральной средней:
Доверительные интервалы для генеральной доли:
2. Определение доверительной вероятности того, что генеральная характеристика может отличаться от выборочной не более чем на определенную заданную величину.
Доверительная вероятность является функцией от t, определяемой по формуле:
По величине t определяется доверительная вероятность по удвоенной нормированной функции Лапласа.
3. Определение необходимого объема выборки, который с практической вероятностью обеспечивает заданную точность выборки.
Для расчета объема выборки необходимо иметь следующие данные:
а) размер доверительной вероятности;
б) коэффициент t, зависящий от принятой вероятности;
в) величину) в генеральной совокупности; они заменяются величинами, полученными в предшествующих обследованиях или при пробных выборках;
г) величину максимально допустимой ошибки;
д) объем генеральной совокупности
Необходимый объем выборки определяется на основе допустимой величины ошибки:
В табл. 22.2 приведены формулы для расчета численности простой случайной выборки.
Таблица 22.2. Формулы для определения численности простой случайной выборки