Пошук
загрузка...
Книги
Счетчик

МЕТОДИ АНАЛІЗУ ВЗАЄМОЗВ’ЯЗКІВ

МЕТОДИЧНІ ВКАЗІВКИ

Усі соціально-економічні явища взаємопов’язані. Зв’язок між ними має причинно-наслідковий характер. Ознаки, що характе­ризують причини та умови зв’язку, називаються факторними х, а ті, що характеризують наслідки зв’язку, — результативними у. Між ознаками х і у виникають різні за природою та характером зв’язки, зокрема функціональні та стохастичні. У разі функціо­нального зв’язку кожному значенню ознаки х відповідає одне чітко визначене значення у. Цей зв’язок виявляється однозначно в кожному окремому випадку. У разі стохастичного зв’язку кожному значенню ознаки х відповідає певна множина значень у, які утворюють так званий умовний розподіл. Як закон цей зв’язок виявляється лише у масі випадків і характеризується зміною умовних розподілів у. Якщо замінити умовний розподіл се­редньою величиною , то утвориться різновид стохастичного зв’язку — кореляційний. У разі кореляційного зв’язку кожному значенню ознаки х відповідає середнє значення результативної ознаки .

Прикладом стохастичного, зокрема кореляційного, зв’язку може бути розподіл проданих на аукціоні акцій за курсовою ціною у залежно від їх номінальної ціни х.

У кожній групі за факторною ознакою спостерігатиметься свій умовний розподіл у, який за наявності стохастичного зв’язку від­різнятиметься від розподілів в інших групах та від підсумкового безумовного розподілу. Умовні розподіли можна замінити серед­німи значеннями результативної ознаки, які обчислюються як середня арифметична зважена:

= .

Поступова зміна середніх  від групи до групи свідчитиме про наявність кореляційного зв’язку між ознаками.

Характеристикою кореляційного зв’язку є лінія регресії, яка розглядається у двох моделях: аналітичного групування та рег­ресійного аналізу. У моделі аналітичного групування — це емпірична лінія регресії, утворювана з групових середніх значень результативної ознаки  для кожного значення (інтервалу) .

Ефекти впливу х на у визначаються як відношення приростів середніх групових значень : , де =  – , =  –
– .

Оцінка щільності зв’язку ґрунтується на правилі розкладання дисперсій, згідно з яким дисперсія результативної ознаки у в моделі аналітичного групування розкладається на дисперсію в кожній групі, виділеній за ознакою х (групову), та дисперсію між групами (міжгрупову). Цей взаємозв’язок між трьома диспер­сіями дістав назву правила розкладання дисперсій, яке запи­сується так:

.

Загальна дисперсія характеризує варіацію ознаки у за рахунок впливу всіх причин (факторів), міжгрупова  — за рахунок фактора х, покладеного в основу групування, а групові  — за рахунок інших факторів, не врахованих у групуванні.

Групова дисперсія розраховується окремо для кожної j-ї групи:

= ,

де y — значення ознаки окремих елементів сукупності;
— середнє значення ознаки в j-й групі; fj — частота j-ї групи.

Для всіх груп у цілому обчислюється середня з групових дисперсій, зважених на частоти відповідної групи:

= .

Міжгрупова дисперсія обчислюється за формулою:

= .

Відношення міжгрупової дисперсії до загальної є мірою щіль­ності зв’язку в моделі аналітичного групування і називається кореляційним відношенням:

.

Кореляційне відношення коливається від 0 до 1, а якщо по­дається у процентах, то від 0 до 100 % і показує, скільки про­центів варіації результативної ознаки пов’язано з варіацією фак­торної ознаки. Чим більше  наближається до одиниці, тим щіль­ніший зв’язок. За відсутності зв’язку  = 0, а за умови функціо­нального зв’язку  = 1.

Втім, навіть щільний зв’язок може виникнути випадково, тому слід перевірити його істотність, тобто довести невипадковість зв’язку. Перевірка істотності зв’язку — це порівняння фактич­ного значення  з його критичним значенням  (k1, k2) для певного рівня істотності  та кількості ступенів свободи k1 = m – 1 і k2 = nm, де m — кількість груп; n — обсяг сукупності. Якщо  >  (k1, k2), то зв’язок визнається істотним. Критичні зна­чення кореляційного відношення для a = 0,05 наведені в додатку.

У моделі регресійного аналізу характеристикою кореляційного зв’язку є теоретична лінія регресії, що описується функцією Yf (x), яка називається рівнянням регресії. Залежно від харак­теру зв’язку використовують:

лінійні рівняння Y = a + bx, коли зі зміною х ознака у змінюється більш чи менш рівномірно;

нелінійні рівняння, коли взаємозв’язані ознаки змінюються нерівномірно (з прискоренням, уповільненням або зі змінним напрямом зв’язку), зокрема степеневе рівняння Y = axb, гіпер­болічне Y = a + b/x, параболічне Y = a + bx + cx2 тощо.

Найчастіше застосовують лінійні рівняння або рівняння, зведені до лінійного вигляду. У лінійному рівнянні параметр bкоефіцієнт регресії — вказує, на скільки одиниць в середньому зміниться у зі зміною х на одиницю. Він має ту саму одиницю, що й результативна ознака. У разі прямого зв’язку b — величина додатна, а в разі зворотного — від’ємна. Параметр а — вільний член рівняння регресії, тобто це значення Y при х = 0. Якщо х не набуває нульових значень, цей параметр має лише розрахункове призначення. Параметри визначаються методом найменших квад­ратів, згідно з яким сума квадратів відхилень емпіричних зна­чень у від теоретичних Y мінімальна å (y – Y)2 ® min. Відповідно до умови мінімізації параметри обчислюються на основі системи нормальних рівнянь:

Звідси

b = ,

a = .

Характеристикою відносної зміни у за рахунок х є коефіцієнт еластичності

Кел = b,

який показує, на скільки процентів у середньому змінюється результативна ознака зі зміною факторної на 1 %.

На підставі рівняння регресії визначаються теоретичні значення Y, тобто значення результативної ознаки за умови впливу лише фактора х, коли рівень інших факторів незмінний.

Відхилення емпіричних значень у від теоретичних Y нази­вають залишковими. Вони характеризують вплив на результа­тивну ознаку всіх інших факторів, окрім х. Середній розмір цих відхилень визначає залишкова дисперсія

2e = .

Варіацію у, зумовлену впливом тільки фактора х, вимірює факторна дисперсія:

d2y = .

Частка факторної дисперсії в загальній характеризує щільність зв’язку і називається коефіцієнтом детермінації:

2 = .

Він має такий самий зміст, інтерпретацію та цифрові межі, як і h2. Для оцінювання щільності лінійного зв’язку використовується лінійний коефіцієнт кореляції (Пірсона) r:

r = ,

який набуває значень у межах ± 1, тому характеризує не лише щільність, а й напрям зв’язку. Додатне значення свідчить про прямий зв’язок, а від’ємне — про зворотний.

Щоб інтерпретувати r, потрібно перейти до R 2 = r 2.

Істотність зв’язку перевіряють так само, як і в моделі аналітич­ного групування: порівнюють R 2 і . Відмінності стосу­ються лише визначення k1 і k2, в яких m — кількість параметрів рівняння регресії.

Аналіз та оцінювання взаємозв’язків між атрибутивними (опи­совими) ознаками виконують на підставі частот (часток) розподілу сукупності за двома взаємозалежними ознаками. Комбінаційний розподіл сукупності за факторною ознакою х та результативною у описується таблицями взаємної спряженості (співзалежності).

За наявності стохастичного зв’язку умовні розподіли зміню­ються (відрізняються) від групи до групи. Оцінка щільності зв’язку в таблицях взаємної спряженості ґрунтується на порівнянні (відхи­леннях чи зіставленнях) частот (часток) умовного та безумовного розподілів.

Найпростішим є аналіз 4-клітинкової таблиці спряженості, на підставі якої може бути обчислений показник відношення шансів

w = ,

де fij — частоти i-го рядка за факторною ознакою та j-го стовпця за результативною.

Відношення шансів характеризує міру відносного ризику фак­тора х на результат у і розраховується як відношення перехрес­них добутків частот.

Таблиці взаємної спряженості можуть використовуватись для аналізу взаємозв’язку не лише атрибутивних, а й кількісних ознак. Проте для останніх доцільно використовувати більш чутливі методи оцінювання кореляційного зв’язку та міри його щільності — коре­ляційне відношення та коефіцієнт детермінації.

[1, с. 77—96; 2, с. 108—130; 4, с. 151—181; 5, с. 221—256]

Умовний розподіл — розподіл одиниць сукупності за результативною ознакою за незмінного значення факторної ознаки.

Лінія регресії — функція, що пов’язує середні або теоретичні зна­чення результативної ознаки з окремими значеннями факторної ознаки.

Кореляційне відношення — міра щільності кореляційного зв’язку між результативною та факторною ознаками в моделі аналітичного групування.

Істотність зв’язку — невипадковість стохастичного зв’язку між взаємозв’язаними ознаками.

1. Назвіть приклади взаємопов’язаних ознак.

2. Чи можливий функціональний зв’язок в економічній сфері?

3. Що є спільного між стохастичним та кореляційним зв’язком? Чим різняться ці види зв’язку?

4. Що називають лінією регресії і як вона подається в регресійній моделі та в моделі аналітичного групування?

5. У чому сутність оцінювання щільності зв’язку?

6. Яку аналітичну роль виконує рівняння регресії?

7. З якою метою розраховується коефіцієнт еластичності?

8. За яких умов R 2 = 0; R 2 = 1?

9. Чи потрібно перевіряти істотність зв’язку за наявності щіль­ного зв’язку між ознаками?

План практичних занять

Заняття 1.

  1. Назвати види взаємозв’язків, розкрити їх сутність та особ­ливості.
  2. Побудувати модель аналітичного групування на підставі первинних незгрупованих даних, а також даних комбінаційного розподілу. Визначити оцінки лінії регресії та ефекти впливу.
  3. Визначити дисперсії результативної ознаки, скориставшись правилом розкладання дисперсії.
  4. Оцінити щільність зв’язку за даними моделі аналітичного групування та перевірити істотність зв’язку.

Заняття 2.

  1. Обґрунтувати вид регресійної моделі кореляційного зв’язку.
  2. Розрахувати та інтерпретувати параметри лінійного рівняння регресії.
  3. Оцінити щільність та перевірити істотність зв’язку за дани­ми регресійної моделі.
  4. Визначити та інтерпретувати відношення шансів за даними таблиць взаємної спряженості.

Навчальні завдання

1. Зазначте, які з наведених залежностей є функціональними, а які стохастичними:

  • добробут населення — від його зайнятості в економічній сфері;
  • прибутковість капіталу компанії — від його розміру та суми прибутку;
  • вартості земельних ділянок — від якості ґрунту;
  • банківські комісійні за грошові перекази — від суми переказів.

2. У табл. 1 наведено кредитні процентні ставки по 10 від­діленнях банків.

Таблиця 1

Вид позики Кредитні процентні ставки
Валютна 26 32 33 29
Гривнева 34 36 35 37 33 35

Визначіть групові, міжгрупову та загальну дисперсії кредитної процентної ставки. Розкрийте їх взаємозв’язок.

Відповідь. 6,0; 7,5.

3. За даними звітів сільськогосподарських підприємств (табл. 2) рівень рентабельності виробництва залежить від ступеня забезпе­ченості ресурсами.

Таблиця 2

Коефіцієнт забезпеченості ресурсами Кількість підприємств Рівень рентабельності, %
До 0,9 31 10
0,9—1,1 45 16
1,1 і більше 24 35
У цілому 100 18,7

Визначіть міжгрупову дисперсію та кореляційне відношення, якщо загальна дисперсія рентабельності виробництва становить 116. Перевірте істотність зв’язку з імовірністю 0,95.

Відповідь. 90, 51.

4. Затримка літаків в аеропорті через метеорологічні умови характеризується даними, наведеними в табл. 3.

Таблиця 3

Метеорологічні умови Кількість літаків Середній час затримки літаків, год
Несприятливі 25 8
Нестійкі 35 4
Сприятливі 40 1
У цілому 100 3,8

Визначіть міжгрупову та середню з групових дисперсій зат­римки літаків, коли відомо, що загальна дисперсія дорівнює 10.

Оцініть щільність зв’язку та перевірте його істотність з імовір­ністю 0,95.

5. За результатами перевірки якості 20 партій твердих сирів (табл. 4) виявлено залежність їх якості від строку зберігання.

Таблиця 4

Строк зберігання, міс. Кількість партій Зниження якості, балів Групова дисперсія зниження якості
До 2 7 1,3 0,08
2—4 8 2,8 0,13
4 і більше 5 4,1 0,20
У цілому 20 2,6 х

Визначіть міжгрупову, середню з групових та загальну диспер­сії зниження якості сиру і розкрийте їх зв’язок. Обчисліть кореля­ційне відношення та поясніть його зміст. Перевірте істотність зв’язку з імовірністю 0,95.

Відповідь. 0,13; 1,17.

6. Заготівля овочевої сировини консервним комбінатом прово­диться в радіусі до 200 км. Вплив відстані перевезень на якість заготовленої сировини відбиває табл. 5.

Таблиця 5

Номер перевезення 1 2 3 4 5 6 7 8 9 10
Радіус перевезення, км 110 42 157 132 126 65 102 148 174 86
Частка нестандартної сировини, % 23 14 26 22 21 17 20 25 28 18

Користуючись цими даними:

1) опишіть залежність якості овочевої сировини від дальності перевезення лінійною функцією. Визначіть параметри цієї функції та поясніть їх зміст;

2) за допомогою лінійного коефіцієнта кореляції оцініть щіль­ність зв’язку між ознаками;

3) перевірте істотність зв’язку з імовірністю 0,95.

7. Розподіл обстежених немовлят, батьки яких мешкають на радіаційно забрудненій території, характеризується даними, наве­деними в табл. 6.

Таблиця 6

Території, мешканці яких підлягають відселенню Кількість немовлят Разом
із вродженими аномаліями без вроджених аномалій
Безумовному 120 80 200
Добровільному 150 250 400
Разом 270 330 600

За допомогою відношення шансів оцініть відносний ризик народження дітей із вродженими аномаліями.

Відповідь. 2,5.

Задача 1. Маємо дані розподілу страхових полісів різних агентств за тривалістю закордонної поїздки страхувальника та вартістю медичного страхування (табл. 1).

Таблиця 1

Тривалість поїздки, днів xj Кількість страхових полісів з вартістю, центів Середньоденна вартість одного полісу, центів
55—65 65—75 75—85 85—95 Разом fj
До 8 5 30 85 120 240 83,3
8—15 65 50 25 20 160 70,0
15—30 75 20 5 100 63,0
У цілому 145 100 115 140 500 75,0

Оцініть щільність зв’язку між розглядуваними ознаками та перевірте його істотність.

Розв’язання

З табл. 1 випливає, що кожній групі за факторною ознакою х — тривалість закордонної поїздки — відповідає певний умовний розподіл страхових полісів за результативною ознакою у — денна вартість страхових полісів. Умовні розподіли істотно відрізня­ються між собою та від безумовного, що свідчить про наявність стохастичного зв’язку. Кореляційний зв’язок можна виявити за допомогою оцінок лінії регресії — групових середніх значень результативної ознаки , обчислених за формулою середньої арифметичної зваженої для кожного інтервалу за ознакою х. Так, для першої групи полісів з тривалістю поїздки до 8 днів маємо:

=

а для сукупності в цілому

=

Розраховані в такий спосіб групові середні подано в табл. 1. Їх поступова зміна (зменшення) від групи до групи свідчить про наявність кореляційного зв’язку. Ефект впливу тривалості поїзд­ки на денну вартість страхового полісу визначається як відно­шення таких приростів: ,  , ; . Отже, зі збільшенням тривалості поїздки на 1 день середньоденна вартість страхового полісу скорочується в середньому на : = –
– 13,3 : 7 = – 1,9 (цента) та на 1 цент.

Щоб оцінити щільність зв’язку за допомогою кореляційного відношення  потрібно обчислити відповідні дисперсії. Загальна дисперсія вартості страхових полісів за даними табл. 1 становить:

=  –  =
= 5764 – 5625 = 139.

Розрахунок міжгрупової дисперсії та аналітичне групування страхових полісів за їх денною вартістю залежно від тривалості поїздки подано в табл. 2.

Таблиця 2

Тривалість поїздки xj, днів Кількість полісів fj Середньоденна вартість полісу , центів
До 8 240 83,3 8,3 16533,6
8—15 160 70,0 – 5,0 4000,0
15—30 100 63,0 – 12,0 14400,0
У цілому 500 75,0 х 34933,6

=  =  = 69,9.

Звідси  = 0,503. Отже, варіація вартості страхових полісів на 50,3 % зумовлюється варіацією тривалості поїздки та на 49,7 % — варіацією інших факторів. Тож зв’язок між ознаками досить щільний.

Щоб перевірити істотність зв’язку, беруть критичні значення (k1, k2). Наприклад, істотність зв’язку перевіряється з рівнем значущості a = 0,05 за таблицею критичних значень для . За табл. 2 маємо: k1 = 3 – 1 = 2, k2 = 500 – 3 = 497. У таблиці критичних значень останнім є k2 = 400, тобто в сукупностях достатньо великого обсягу справджується закон великих чисел, згідно з яким у масі випадків дія випадкових причин врівно­важується, тому потреби перевіряти істотність зв’язку немає. Отже, за такого обсягу страхових полісів зв’язок визнається істотним.

Переконатися в цьому можна, порівнявши фактичне значення  з його критичним значенням (2, 400) = 0,015. Оскільки  =
= 0,503 > 0,015, то зв’язок визнається істотним з імовірністю 0,95.

Задача 2. Обчисліть параметри лінійного рівняння регресії на прикладі зв’язку між добовою вартістю туристичних путівок в одному з туристичних агентств та тривалістю відпочинку (табл. 3).

Таблиця 3

Номер путівки Тривалість відпочинку, днів х Добова вар­тість путівки, грн., у х у х2 Y (y – Y)2 y2
1 5 78 390 25 91,6 185,0 6084
2 14 55 770 196 52,5 6,2 3025
3 7 95 665 49 82,9 146,4 9025
4 18 30 540 324 35,1 126,0 900
5 14 53 742 196 52,5 0,2 2809
6 20 26 520 400 26,4 0,2 676
7 7 85 595 49 82,9 4,4 7225
8 15 50 750 225 48,1 3,6 2500
Разом 100 472 4972 1464 472,0 372,0 32244

Знайдемо значення величин, на підставі яких обчислюються параметри:

= 100; = 472; = 4972; = 1464; n = 8;
= 100 : 8 = 12,5; = 472 : 8 = 59.

Отже, шукані параметри такі:

= –  = – 4,34 (грн.);

(грн.).

Тоді рівняння регресії набирає вигляду: Y = 113,25 – 4,34 x, тобто зі збільшенням тривалості відпочинку на один день добова вартість туристичної путівки зменшується в середньому на 4,34 грн.

За даними табл. 3 обчислимо коефіцієнт еластичності:

Kел = b = – 4,34= – 0,9.

Отже, зі збільшенням тривалості відпочинку на 1 % добова вартість путівки зменшується в середньому на 0,9 %.

На підставі рівняння регресії визначимо теоретичні значення Y. У наведеному прикладі Y — це очікувана вартість путівок за умови впливу лише тривалості відпочинку. Так, для x = 5 днів добова вартість путівки становить Y = 113,25 –  = 91,6 (грн.). Це значення дещо відхиляється від емпіричного.

За даними табл. 3 обчислюємо:

залишкову дисперсію s2e = = 372 : 8 = 46,5, загальну s2y =  = 549,5 та факторну за правилом розкладання дисперсій: d2y = 549,5 — 46,5 = 503.

Тоді R 2 = = 503 : 549,5 = 0,915, тобто маємо, що 91,5 % варіації добової вартості путівок лінійно пов’язані з варіацією тривалості відпочинку, а 8,5 % цієї варіації припадають на решту факторів. Тож зв’язок дуже щільний.

Лінійний коефіцієнт кореляції:

r === – 0,957,

де s 2x =  – 12,52 = 26,75.

Отже, зв’язок між добовою вартістю турпутівок та терміном відпочинку є щільним і оберненим.

Перевіримо істотність зв’язку. У нашому прикладі k1 = 2 – 1 = 1, а k2 = 8 – 2 = 6, критичне значення = 0,500 значно менше від фактичного R2 = 0,915. Зв’язок між добовою вартістю путівок та тривалістю відпочинку визнається істотним з імовірністю 0,95.

Задача 3. Маємо дані маркетингового обстеження телеглядачів щодо ефективності використання рекламного часу (табл. 4).

Таблиця 4

Місце реклами
в ефірному часі
Кількість респондентів, які дивляться телерекламу

Разом

уважно неуважно
Під час фільму 45 15 60
Перед фільмом 12 28 40
Разом 57 43 100

Зробіть відповідні висновки.

Для оцінювання ефективності використання рекламного часу за даними 4-клітинкової таблиці взаємної спряженості доречно скористатись показником відношення шансів:

w =  = .

Отже, шанси зосередити увагу телеглядачів на телерекламі у 7 разів вищі в разі її показу під час фільму, ніж до нього.

загрузка...