Пошук
загрузка...
Книги
Счетчик

ВИБІРКОВИЙ МЕТОД

МЕТОДИЧНІ ВКАЗІВКИ

Вибірковий метод — це система наукових принципів, згідно з якими обстежуються не всі елементи сукупності, а лише певним чином дібрана їх частина. Сукупність, з якої вибирають елементи для обстеження, називається генеральною, а сукупність, яку безпосередньо обстежують, — вибірковою. Статистичні характеристики вибіркової сукупності розглядаються як оцінки відповідних характеристик генеральної сукупності.

Оскільки вибіркова сукупність не зовсім точно відтворює склад генеральної сукупності, то й вибіркові оцінки не збігаються з відповідними характеристиками генеральної сукупності. Розбіжності між ними називають похибками репрезентативності. За причинами виникнення ці похибки поділяють на систематичні (тенденційні) та випадкові. Систематичні похибки виникають, коли під час фор­мування вибіркової сукупності порушується принцип випадковості добору (упереджений добір). Випадкові похибки — це наслідок випадковості добору і зумовлених цим розбіжностей між структурами вибіркової та генеральної сукупностей. Організуючи вибіркове обстеження, важливо уникнути систематичної похибки. Щодо випадкової похибки, то уникнути її неможливо. Проте згідно з теорією вибіркового методу вдається визначати розмір такої похибки і по змозі регулювати його.

У практиці вибіркових досліджень застосовують два типи оцінок характеристик генеральної сукупності — точкові та інтервальні. Точкова оцінка — це значення характеристики за даними вибірки: вибіркова середня , вибіркова частка р тощо. Інтервальною оцінкою називають інтервал значень характеристики, обчислений за даними вибірки для певної ймовірності, тобто довірчий інтервал. Чим менший довірчий інтервал, тим точніша вибіркова оцінка.

Межі довірчого інтервалу визначають на підставі точкової оцінки та граничної похибки вибірки :

для середньої ;

для частки ,

де  — стандартна (середня) похибка вибірки; t — квантиль розподілу ймовірностей (довірче число).

Стандартна похибка вибірки — це середнє квадратичне відхилення вибіркових оцінок від значення характеристики в генеральній сукупності:

для повторної вибірки ;

для безповторної вибірки .

Застосовуючи наведені формули на практиці, слід урахувати таке:

а) дисперсія частки , де р і q — частки вибіркової сукупності, яким відповідно притаманна і не притаманна ознака;

б) у великих за обсягом сукупностях (30 і більше одиниць) поправка  не вносить істотних змін у розрахунки, а тому береться до уваги лише у вибірках з невеликою кількістю елементів;

в) коригуючий множник для безповторної вибірки  при малих (менш як 5 %) значеннях  наближається до 1, а тому обчислення можна виконувати за формулою для повторної вибірки.

Гранична похибка вибірки — це максимально можлива похибка для взятої ймовірності F(x). Довірче число t вказує, як співвідносяться гранична та стандартна похибки. Так, з імовірністю 0,683 гранична похибка не вийде за межі стандартної , з імовірністю 0,954 вона не перевищить 2m, з імовірністю 0,997 — 3m.

Формули граничних похибок середньої та частки записують так.

Повторна вибірка

Безповторна вибірка

для середньої: ; .
для частки: ; .

Як випливає з наведених формул, розмір граничної похибки залежить від варіації ознаки ; обсягу вибірки n; частки вибірки в генеральній сукупності ; узятого рівня ймовірності, якому відповідає квантиль t.

Чим більша варіація ознаки в генеральній сукупності, тим більша в середньому похибка вибірки. Залежність похибки від обсягу вибіркової сукупності обернено пропорційна. Щоб зменшити похибку вибірки вдвічі, обсяг останньої має зрости в 4 рази.
У разі безповторної вибірки похибка тим менша, чим більша частка  обстеженої сукупності в генеральній. У разі малих вибірок (n < 30) стандартні похибки обчислюють за допомогою вибір­кових оцінок дисперсій . Квантилі t визначають за розподілом імовірностей Стьюдента.

У статистичному аналізі часто доводиться порівнювати похибки вибірки різних ознак або однієї і тієї самої ознаки в різних сукупностях. Такі порівняння виконують за допомогою відносної похибки, яка показує, на скільки процентів вибіркова оцінка може відхилятися від параметра генеральної сукупності. Відносна стандартна похибка середньої — це коефіцієнт варіації вибіркових середніх: . Обчислити таку похибку можна, знаючи коефіцієнт варіації ознаки :

або .

Вибіркову похибку частки μp також слід порівнювати з часткою р. Адже одна і та сама похибка μp = 2 % для р = 80 % мала, для р = 40 % — допустима, для р = 10 % — завелика. Відносну похибку частки обчислюють за формулою:

.

Отже, відносну похибку можна використати для порівняння вибіркових оцінок різних ознак. На практиці достатнім рівнем точності вважається  Іноді використовують граничну відносну похибку, яка враховує ймовірність статистичного висновку .

У практиці вибіркових обстежень застосовують різні способи формування вибіркових сукупностей, зокрема простий випадковий, механічний, розшарований (районований) і серійний добір.

Простий випадковий добір здійснюють жеребкуванням або за допомогою таблиць випадкових чисел. Це класичний спосіб формування вибіркової сукупності, і саме на ньому ґрунтується теорія вибіркового методу.

Механічний добір виконують через рівні інтервали з попередньо впорядкованої за певним принципом генеральної сукупності. Крок інтервалу залежить від обсягу сукупності N і передбаченого обсягу вибірки n. Так, для частки вибірки  кроком інтервалу є число , тобто у вибірку має потрапити кожний двадцятий елемент. Початковий елемент вибірки визначається як випадкове число всередині першого інтервалу, другий елемент залежить від початкового числа й кроку інтервалу і т. д. Похибка механічної вибірки визначається за формулою безповторного добору.

Вивчаючи безперервні в часі процеси, зокрема технологічні (структури затрат робочого часу, використання виробничого устаткування), проводять моментні спостереження.

Розшарований (районований, типовий) добір — це спосіб формування вибірки з урахуванням структури генеральної сукупності. На відміну від простого випадкового та механічного добору, які виконують у цілому по генеральній сукупності, розшарований добір передбачає її попередню структуризацію й незалежний вибір елементів у кожній складовій. Обсягом розшарованої вибірки є сума частинних вибірок , тобто , де m — число складових (груп, типових районів тощо). Похибку розшарованої вибірки обчислюють, використовуючи середню з групових дисперсій . Якщо сформовані групи однорідні, а групові середні величини помітно різні, варіація ознаки у групах буде значно меншою, ніж по сукупності. У такому разі <, а отже, похибка розшарованої вибірки порівняно з простою випадковою чи механічною буде менша.

На практиці застосовують різні способи визначення обсягу вибіркової сукупності n та її складових . Найпоширенішим є пропорційний добір, який передбачає однакове для всіх складових представництво, тобто частки вибірки  однакові, а обсяг частинної вибірки залежить від обсягу відповідної складової сукупності.

У серійній вибірці добираються не одиниці сукупності, а їх серії, пов’язані територіально (райони, селища) або організаційно (фірми, акціонерні товариства). Вибіркова сукупність серій формується за схемами механічної або простої випадкової вибірки. Дібрана серія розглядається як одне ціле, обстеженню підлягають усі без винятку елементи серії. Обчислюючи похибку вибірки, ураховують міжсерійну варіацію. Якщо серії більш чи менш однорідні й варіація серійних середніх незначна, похибка серійної вибірки буде меншою порівняно з похибкою простої випадкової чи механічної вибірки.

Той чи інший спосіб формування вибіркової сукупності застосовують залежно від мети вибіркового обстеження, можливостей його організації та проведення. Іноді поєднують різні способи добору: механічний і серійний, розшарований і механічний, випадковий і серійний. Таке поєднання можливе в рамках багатоступеневої вибірки.

Якщо обстежують сукупність за двома й більше ознаками, які різняться варіацією, ефективною є багатофазна вибірка. Вона поєднується з багатоступеневою, а також із суцільним спостереженням.

У процесі проектування вибіркових спостережень визначають мінімально достатній обсяг вибірки, при якому вибіркові оцінки репрезентують основні властивості генеральної сукупності. Занадто великий обсяг вибірки потребує зайвих витрат, а занадто малий призводить до збільшення похибки репрезентативності. Теорія вибіркового методу дає змогу науково обґрунтувати достатній обсяг вибірки.

Згідно з формулою граничної похибки вибірки обсяг вибірки подається так:

,

тобто він залежить від ступеня однорідності генеральної сукупності, ймовірності, з якою гарантується результат, і потрібної точності вибіркової оцінки. Практично застосовувати цю формулу складно через відсутність оцінки варіації.

Як правило, використовують оцінки  за аналогією, тобто оцінки, здобуті в попередніх або аналогічних обстеженнях. Якщо аналогічні обстеження не проводились або в генеральній сукупності відбулися істотні зміни, точнішу характеристику варіації дають пробні обстеження. Для альтернативної ознаки, коли немає жодної інформації про структуру сукупності, беруть максимальне значення дисперсії s2 = 0,25.

Коли розрахований обсяг вибіркової сукупності n перевищує 5 % обсягу генеральної сукупності N, його коригують на «безповторність вибірки». Скоригований обсяг вибірки .

Щодо точності вибіркового обстеження, то доцільно контролювати відносну граничну похибку . У такому разі мірою варіації ознаки є коефіцієнт варіації , і тоді .

Достатній обсяг вибірки можна обчислити також, знаючи відносну похибку вибірки для частки: .

Очевидно, чим більша частка р, тим менший обсяг вибірки забезпечить необхідну точність результатів обстеження, і навпаки: для малих значень р потрібна вибірка більшого обсягу.

[1, с. 138—152; 2, с. 88—107; 3, с. 195—230; 4, с. 129—137]

Основа вибіркице сукупність «фізичних» одиниць генеральної сукупності або їх угруповань (серій). Від основи вибірки залежить спосіб формування вибіркової сукупності.

Моментне спостереження — періодична фіксація стану процесу на певні моменти часу, які вибирають за схемою випадкової або механічної вибірки (через певні інтервали часу). Точність моментного спостереження оцінюють за формулою повторного добору.

Багатоступенева вибірка на кожному ступені добору характеризується певною (відмінною від інших) основою вибірки. Повнота охоплення основи та схема добору одиниць від ступеня до ступеня змінюються. Елементи для безпосереднього обстеження вибирають на останньому ступені формування вибіркової сукупності. Частка її щодо генеральної сукупності залежить від часток вибірки на всіх ступенях.

Багатофазна вибірка передбачає формування вибіркових сукупностей поетапно — фазами. З генеральної сукупності формується первинна вибірка, а з первинної — підвибірка і т. д. На кожній наступній фазі обсяг підвибірки зменшується, а програма обстеження розширюється. На відміну від багатоступеневої багатофазна вибірка має для всіх ознак одну й ту саму основу, проте програма обстеження змінюється.

1. У чому полягає сутність вибіркового спостереження? Які його переваги порівняно з іншими видами спостереження?

2. Що означає репрезентативність вибірки? За яких умов вибірка репрезентативна?

3. Чому принцип випадковості добору є визначальним у процесі формування вибіркової сукупності? Які способи добору забезпечують додержання цього принципу?

4. Чим випадкова похибка репрезентативності відрізняється від систематичної? Чи можна її уникнути?

5. Як визначити розмір похибки вибірки? Чим гранична похибка вибірки відрізняється від стандартної (середньої)?

6. Як зміниться похибка вибірки, якщо обсяг вибіркової сукупності збільшиться в 2,25 раза?

7. Як позначиться на похибці вибірки збільшення дисперсії в 1,6 раза?

8. Як зміниться похибка вибірки, якщо замість простого випадкового добору виконати 19 %-ний механічний?

9. Як зміниться похибка вибірки, якщо замість механічного добору виконати розшарований із міжгруповою дисперсією, що становить 36 % загальної?

10. Проектується вибіркове обстеження домогосподарств у сільській місцевості з метою визначення розміру та джерел формування їхніх доходів і структури витрат, а також оцінювання диференціації споживання продовольчих і непродовольчих товарів. Пропонується триступенева вибірка.

1) Чи доцільно застосовувати саме такий спосіб добору домогосподарств?

2) Які основи вибірки слід сформувати на кожному ступені вибірки?

3) На якому ступені буде здійснено добір домогосподарств для безпосереднього обстеження?

4) Як визначити частку багатоступеневої вибірки щодо генеральної сукупності?

  1. 11. Як визначити мінімально необхідний обсяг вибірки?

План практичного заняття

  1. З’ясувати сутність вибіркового спостереження, його переваги порівняно з іншими видами спостереження.
  2. Опанувати способи формування вибіркової сукупності, які забезпечують додержання принципу випадковості добору та репрезентативність вибірки в цілому.
  3. Обчислити похибки вибірки для середньої і частки та визначити довірчі межі.
  4. Визначити мінімально достатній обсяг вибірки для конкретних вибіркових обстежень.

Навчальні завдання

1. Хімічний аналіз 25 партій молока дав такі результати: а) середній показник кислотності (у градусах Тернера) — 20° при дисперсії 3,24; б) частка партій молока, що відповідають стандарту кислотності (не більш як 21°), становить 80 %.

Визначіть похибки вибірки для середньої та частки з імовірністю 0,954.

Скільки партій молока необхідно перевірити, щоб похибки вибірки для середньої і частки з тією самою ймовірністю зменшити вдвічі?

Відповідь. 0,72 °; 16 %.

2. Урожайність нового сорту озимої пшениці, розміщеного на 10 дослідних ділянках, становила 47 ц/га при дисперсії 1,44. Ви-
значіть довірчий інтервал для середньої врожайності з імовірністю 0,95. Чи узгоджуються вибіркові дані з припущенням, що врожайність нового сорту озимої пшениці не менша за 46 ц/га?

3. За даними 1 %-ного вибіркового обстеження 100 домогосподарств маємо: середня кількість працюючих осіб — 2,1; коефіцієнт варіації — 25 %; місячний середньодушовий дохід — 280 грн.; коефіцієнт варіації — 50 %.

З імовірністю 0,954 визначіть відносні похибки вибірки для зазначених показників. Порівняйте похибки та зробіть висновки щодо їх розміру.

4. Проектується обстеження посівів соняшника з метою визначення втрат насіння через несвоєчасне збирання врожаю. Скільки необхідно обстежити пробних ділянок, щоб з імовірністю 0,954 відносна похибка середніх втрат з 1 га не перевищила 10 %? За даними минулорічних обстежень квадратичний коефіцієнт варіації втрат насіння становив 20 %.

Відповідь. 16.

5. За даними пробного вибіркового обстеження роботи ковальсько-пресового обладнання у першу зміну без простоїв працювало 80 % машин. Яка має бути вибіркова сукупність, щоб похибка вибірки для частки обладнання, що працює без простоїв з імовірністю 0,954, не перевищила 5 %?

Відповідь. 256.

6. Скільки потрібно опитати респондентів, оцінюючи якість готельного обслуговування (задовольняє / не задовольняє), щоб гранична похибка вибірки часток з імовірністю 0,954 не перевищила 10 %?

Відповідь. 10.

7. Проектується вибіркове обстеження 100 домогосподарств, які ведуть індивідуальну забудову, з метою визначення основних джерел коштів. Пропонується сформувати вибіркову сукупність, застосовуючи жеребкування (повторний добір) або механічну вибірку (36 %-ний добір). Визначіть, на скільки процентів похибка механічної вибірки менша, ніж похибка повторної випадкової вибірки.

Задача 1. Розглянемо методику вибіркового оцінювання середньої та частки за даними обстеження 100 зареєстрованих безробітних (2 %-на вибірка), з яких 40 проходять перенавчання за новою професією. За результатами обстеження середня тривалість перерви в роботі становить 3 місяці, а дисперсія дорівнює 2,25.

Розв’язання

Визначимо межі середньої тривалості перерви в роботі з імовірністю 0,954 (t = 2).

Гранична похибка  (міс.).

Довірчий інтервал: .

Це дає підставу стверджувати з імовірністю 0,954, що середня тривалість перерви в роботі становить не менш як 2,7 і не більш як 3,3 місяця.

Перш ніж визначати граничну похибку частки безробітних, які перенавчаються, обчислимо дисперсію частки:

= 0,4 (1 – 0,4) = 0,24.

Гранична похибка , або 9,8 %.

Довірчий інтервал: .

Отже, з такою самою ймовірністю можна стверджувати, що частка безробітних, які перенавчаються, у генеральній сукупності становить не менш як 20,2 % і не більш як 39,8 %.

Відносна похибка середньої тривалості перерви в роботі . Такий самий результат дістаємо, обчислюючи відносну похибку на основі коефіцієнта варіації : , де .

Відносна похибка частки безробітних, які перенавчаються, становить 8,1 %, що перевищує похибку для середньої тривалості перерви в роботі: .

Задача 2. На лісовому масиві в 400 га визначається загальний запас деревини. Пробні ділянки мають площу по 0,1 га. За даними попередніх обстежень середнє квадратичне відхилення виходу деревини з 0,1 га становить 3 м3. Скільки пробних ділянок необхідно обстежити, щоб похибка вибірки з імовірністю 0,954 (для якої t = 2 ) не перевищувала 1 м3?

Розв’язання

Достатній обсяг вибірки пробних ділянок .

Задача 3. Проектується вибіркове обстеження підприємств малого бізнесу в галузі інформаційно-обчислювального обслуговування (N = 180) з метою визначення середньої тривалості обороту дебіторської заборгованості. За аналогічними обстеженнями в інших галузях діяльності середня тривалість обороту становить 65 днів, квадратичний коефіцієнт варіації  = 30 %.

Розв’язання

Мінімально достатній обсяг вибірки, за якого з імовірністю 0,954 гарантується відносна похибка вибірки в обсязі не більш як 10 %, становить . Скоригуємо цей обсяг на без­повторність вибірки: .

загрузка...