де n кількість спостережень (обсяг вибірки); n=36;
lg n десятковий логарифм числа n.
Отримане значення К округляємо до цілого у велику сторону. Потім розраховуємо ширину групувального інтервалу h:
,
де max максимальне значення показника, що вивчається, у вибірці;Ymax=9948
min мінімальне значення показника, що вивчається, у вибірці.Ymin=994
Значення h також округляємо до цілого у велику сторону.
h= =1279
Після цього можемо встановити межі групувальних інтервалів:
- нижня межа першого групувального інтервалу
a1=Ymin;
a1=994;
- верхня межа першого групувального інтервалу
b1=a1+h;
b=969+1279=2273;
Межі наступних інтервалів встановлюємо так: нижня межа чергового інтервалу приймається рівній верхній межі попереднього інтервалу, а верхня межа дорівнює нижній плюс ширина групувального інтервалу. В результаті весь діапазон зміни значень змінної розбивається на 7 рівних по величині інтервалів.
Одночасно зі встановленням меж групувальних інтервалів задаємо умови віднесення спостережень на інтервал. Їх задаємо у вигляді подвійної нерівності:
ak Y bk, k=1,2,3, ..., K.
Відповідно до цієї умови на інтервал з номером k відносимо ті значення досліджуваної ознаки, які більше або рівні нижньої границі і менше верхньої границі.
Далі розподілимо одиниці вибіркової сукупності (підприємства) по інтервалах у залежності від величини результативної ознаки.
Таблиця 2.4 Групування підприємств по величині валового доходу, тис. грн.
Номер інтервалу,
kМежі інтерва-лівЧастота
fkКумулятивна частота,
Частка,
wk=fk/nКумулятивна
частка,
1994-2273444/36=0,1110,11122273-355234+3=73/36=0,0830,111+0,083=0,19433552-483157+5=125/36=0,1380,194+0,138=0,33244831-61101212+12=2412/36=0,3330,332+0,333=0,66556110-7389524+5=295/36=0,1380,665+0,138=0,80367389-8668429+4=334/36=0,1110,803+0,111=0,91478668-9948333+3=363/36=0,0830,914+0,083=0,997Разом-36-1-Після рознесення даних до інтервалів, у табл. 4 підраховуємо частоту попадання спостережень до інтервалу(fk),розраховуємо частки(wk), кумулятивні частоти(Sf) та частки(Sw).
2.2.2 Групування з використанням нерівновеликих інтервалів
Групування з нерівновеликими інтервалами застосовуються для опису статистичних даних розподілу, що мають явну асиметрію, частот і часток. Ширину і межі цих інтервалів встановлюють на основі логічного аналізу попередніх відомостей про якісні і кількісні характеристики досліджуваного явища.
У курсовій роботі в якості одного з можливих рішень задачі групування підприємств за розмірами валового доходу використовуємо досить просту формалізовану процедуру розділення підприємств на групи.
Ця процедура виділення груп об'єктів з нерівними інтервалами досліджуваної ознаки така. Необхідно ранжирувати значення ознаки. Потім весь інтервал її можливих значень [964; 9964] розділити на два інтервали, відокремлюваних друг від друга середнім значенням ознаки .
Ymin = 994 = 5330.08 Ymax=9948
На першому інтервалі [994; 5330.08] будуть розташовані варіанти досліджуваної ознаки менше середнього значення , на другому [5330.08;9964] більше, ніж середнє значення .
У випадку асиметричного розподілу точка, що відповідає середньому значенню ознаки =5330.08, не ділитиме інтервал [994;9948] на рівні частини, а буде зміщена до якого-небудь з кінців інтервалу.
Вибираємо з двох інтервалів, розділених значенням середньої величини, інтервал найменшої довжини, для чого порівнюємо по модулю величини =5330.08-994=4336.08 і =9948-5330.081=4617.92.
Довжину найменшого з двох порівнюваних інтервалів поділяємо навпіл і отримане значення додаємо до середнього і вичитаємо з нього.
∆Y=4336.08/2=2168.04.
=5330.08-2168.04=3162.04;
=5411+2223,5=7498.12.
Одержуємо координати двох точок (3162.04) і (7498.12), які відзначаємо на числовій осі варіаційного ряду вліво і вправо від середнього значення:
Дрібні Середні Великі
994 3162.04 5330.08 7498.12 9948
В результаті числова вісь, що відповідає ранжированому варіаційному ряду досліджуваної ознаки, розділяється на три інтервали [994;3162,04], [3162.04;7498,12] і [7498,12;9948], довжини яких можуть бути інтерпретовані як величини, що відмежовують дрібні, середні і великі одиниці сукупності.
Після встановлення меж інтервалів розробимо таблицю частот і часток та побудуємо гістограму розподілу підприємств.
Таблиця 2.5 Групування підприємств за обсягом валового доходу, тис.грн.
Номер інтерва-лу,
KМежі інтервалівЧастота
fkКумулятивна частота,
Частка,
wk=fk/nКумулятивна
частка,
1994-1122110,030,0321122-880232330,890,9238802-99483360,081Разом361
Рис. 2.1 - Гістограма розподілу значень Y
2.2.3 Розрахунок узагальнюючих характеристик і перевірка однорідності вибіркової сукупності
Наступний етап аналізу сукупності спостережень - розрахунок узагальнюючих характеристик досліджуваної статистичної сукупності. Цей розрахунок можна виконати за не згрупованими або згрупованими даними (на підставі частотної таблиці). Більш точними є результати, отримані з використанням не згрупованих даних.
У курсовій роботі розрахунок зазначених показників описової статистики виконаємо для кожної змінної за не згрупованими даними. Для розрахунку використаємо формули, що приведені в табл. 2.6.
Таблиця 2.6 Формули для розрахунку узагальнюючих показників вибіркових сукупностей
Узагальнюючі показникиРезультативна змінна YФакторні змінні XiСереднєСереднє квадратич-не відхиленняКоефіцієнт варіаціїПримітка. 1) i-номер спостереження, i =1,2...,n; 36
2) j - номер чинника, j = 1,2,3,4,5
Таблиця 2.7 Розрахунки узагальнюючих показників вибіркових сукупностей
Узагальнюючі показникиРезультативна змінна YФакторні змінні X1Факторні змінні Х2Факторні змінні Х3Факторні змінні Х4Факторні змінні Х5Середнє5330.083604.3061293.5281.4672.7233.996Середнє квадратич-не відхилення2234.1391549.276472.7490,1240,22823,449Коефіцієнт варіації,42.98436.54735,3268,4538.373586,812
Розрахунок виконується на підставі вихідних даних, приведених у табл. 2.3. Проаналізувавши дані таблиці 2.3, можна зробити такі висновки:
Сукупності показників У, Х1, Х2 та Х5 не однорідні, оскільки їх коефіцієнти варіації більші ніж 33%. А сукупності показників Х3 та Х4 являються однорідними, бо значення їх коефіцієнтів варіації значно менше 33%.Отже, чим менше значення коефіцієнта варіації, тим однорідніші об'єкти досліджуваної сукупності і надійніше рішення, прийняті з використанням описової статистики. Сукупність вважається однорідною, якщо .
Подальший аналіз проводимо по вибірці, що складається з 30 підприємств.
Формуємо нову таблицю вихідних даних.
Таблиця 2.8 Вихідні дані до статистичного дослідження (зменшена вибірка)
Порядковий номерЗначення зміннихгрупиПідприєм-ства в групіСпостере-ження, іYiXi1Хi2Xi3Xi4Xi5I4224818487531,2162,4542,9855232518677051,2452,6483,2986251419166981,3122,7453,6027265118907641,4032,4743,47II8378025029481,5112,6393,9879384025419611,5112,6443,99610387825079691,5472,5874,00211390525599991,5262,5623,90912398026329901,5122,6594,02III134835323111841,4962,7294,084144865284711591,7092,4564,198154819317610661,5172,9794,521164884337412301,4482,7433,971174911314211871,5632,6474,137184962317511981,5632,654,142IV195766380213691,5172,7774,212205837383513791,5222,7814,233215849389014071,5042,7654,157225858394614151,4852,7894,14235963404514471,4742,7954,121245999396814221,5122,794,219V256736470215681,4332,9994,296266820437215851,562,7584,303276860449815941,5252,8224,304286894460216271,4982,8294,237296940455016111,5252,8244,308VI307794510417901,5272,8514,354317784509717871,5272,8524,356327975501518281,592,7434,363338050516818141,5582,8494,438Сума значень1595221058013845444,83681,84122,363Середнє значення5317,43526,71281,81,4952,7284,079
Розраховуємо оптимальну кількість груп К з рівними інтервалами по формулі Стерджесса:
,
K=1+3,322*lg30=6.
Розрахуємо ширину групувального інтервалу h:
h==967.
Таблиця 2.9 Групування підприємств по величині валового доходу, тис. грн.
Номер інтервалу,
kМежі інтервалівЧастота,
fkКумулятив-на частота,
Частка,
wk=fk/nКумулятивна
частка,
12248-3215440,1330.13323215-4182590,1670.334182-51496150,2010.50145149-61166210,20.70156116-70835260,1670.86867083-80504300,1331Разом-30-1-
Таблиця 2.10 Розрахунки узагальнюючих показників вибіркових сукупностей
Узагальнюючі показникиРезультативна змінна YФакторні змінні X1Факторні змінні Х2Факторні змінні Х3Факторні змінні Х4Факторні змінні Х5Середнє5317,43526,71281,81,4952,7284,079Середнє квадратич-не відхилення1686.7581043.374340.5780.0950.1330.334Коефіцієнт варіації31.72129.58526.576.3554.8758.188
2.3 Поширення вибіркових результатів на генеральну сукупність. Оцінка достатності обсягу вибірки
Кінцевою метою вибіркового спостереження є характеристика генеральної сукупності. Враховуючи, що на основі вибіркового обстеження не можна точно оцінити досліджуваний параметр генеральної сукупності, знайдемо межі, у яких він знаходиться. Для цього необхідно з імовірністю 0,95 визначити граничну помилку вибіркової середньої результативного показника (середнього доходу підприємств,