За цією вибіркою побудувати інтервальний варіаційний ряд. Рішення: I

Метод угруповань дозволяє також виміряти варіацію(мінливість, коливання) ознак. При відносно малому числі одиниць сукупності варіація вимірюється з урахуванням ранжованого низки одиниць, що утворюють сукупність. Ряд називається ранжованим,якщо одиниці розташовані за зростанням (зменшенням) ознаки.

Однак ранжировані ряди досить малопоказові тоді, коли потрібна порівняльна характеристика варіації. Крім того, в багатьох випадках доводиться мати справу зі статистичними сукупностями, що складаються з великої кількості одиниць, які важко уявити у вигляді конкретного ряду. У зв'язку з цим для первинного загального ознайомлення зі статистичними даними і особливо полегшення вивчення варіації ознак досліджувані явища і процеси зазвичай об'єднують у групи, а результати угруповання оформляють як групових таблиць.

Якщо груповий таблиці є лише дві графи - групи за виділеним ознакою (варіанти) і чисельності груп (частоти чи частоти), вона називається поряд розподілу.

Ряд розподілу -найпростіший різновид структурного угруповання за однією ознакою, відображена в груповій таблиці з двома графами, в яких містяться варіанти та частоти ознаки. У багатьох випадках з такого структурного угруповання, тобто. із складання рядів розподілу, починається вивчення вихідного статистичного матеріалу.

Структурне угруповання у вигляді ряду розподілу може бути перетворено на справжнє структурне угруповання, якщо виділені групи будуть охарактеризовані не тільки частотами, а й іншими статистичними показниками. Головне призначення рядів розподілу – вивчення варіації ознак. Теорію рядів розподілу детально розробляє математична статистика.

Ряди розподілу ділять на атрибутивні(угруповання за атрибутивними ознаками, наприклад розподіл населення за статтю, національністю, сімейним станом тощо) і варіаційні(Угруповання за кількісними ознаками).

Варіаційний рядявляє собою групову таблицю, яка містить дві графи: угруповання одиниць за однією кількісною ознакою та чисельність одиниць у кожній групі. Інтервали у варіаційному ряду утворюються зазвичай рівні та закриті. Варіаційним рядомє наступне угруповання населення Росії за величиною середньодушових грошових доходів (табл. 3.10).

Таблиця 3.10

Розподіл чисельності населення Росії за величиною середньодушових доходів у 2004-2009 роках.

Групи населення за величиною середньодушових грошових доходів, руб./міс.

Чисельність населення групи, в % до результату

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Понад 25 000,0

Все населення

Варіаційні ряди у свою чергу поділяються на дискретні та інтервальні. Дискретніваріаційні ряди поєднують варіанти дискретних ознак, що змінюються у вузьких межах. Прикладом дискретного варіаційного ряду може бути розподіл російських сімей за кількістю наявних дітей.

Інтервальніваріаційні ряди поєднують варіанти або безперервних ознак або змінюються в широких межах дискретних ознак. Інтервальним є варіаційний ряд розподілу населення Росії за величиною середньодушових грошових доходів.

Дискретні варіаційні ряди практично застосовуються не надто часто. Тим часом складання їх нескладно, оскільки склад груп визначається конкретними варіантами, якими реально мають досліджувані групувальні ознаки.

Найбільш поширені інтервальні варіаційні ряди. При їх складанні виникає складне питання про кількість груп, а також величину інтервалів, які повинні бути встановлені.

Принципи вирішення цього питання викладено у розділі про методологію побудови статистичних угруповань (див. параграф 3.3).

Варіаційні ряди являють собою засіб згортання або стиснення різноманітної інформації в компактну форму, за ними можна скласти досить чітке судження про характер варіації, вивчити відмінності ознак явищ, що входять досліджувану сукупність. Але найважливіше значення варіаційних рядів у тому, що у основі обчислюються особливі узагальнюючі характеристики варіації (див. главу 7).

Варіаційниминазивають ряди розподілу, побудовані за кількісним ознакою. Значення кількісних ознак в окремих одиниць сукупності непостійні, більш-менш різняться між собою.

Варіація- коливання, змінність величини ознаки в одиниць сукупності. Окремі числові значенняознаки, що зустрічаються в досліджуваній сукупності, називають варіантамизначень. Недостатність середньої величини для повної характеристики сукупності змушує доповнювати середні величини показниками, що дозволяють оцінити типовість цих середніх шляхом вимірювання коливання (варіації) ознаки, що вивчається.

Наявність варіації обумовлено впливом значної частини чинників формування рівня ознаки. Ці чинники діють з різною силою й у різних напрямах. Для опису міри мінливості ознак використовують показники варіації.

Завдання статистичного вивчення варіації:

  • 1) вивчення характеру та ступеня варіації ознак у окремих одиниць сукупності;
  • 2) визначення ролі окремих чинників чи його груп у варіації тих чи інших ознак сукупності.

У статистиці застосовуються спеціальні методи дослідження варіації, що ґрунтуються на використанні системи показників, здопомогою яких вимірюється варіація.

Дослідження варіацій має важливе значення. Вимірювання варіацій необхідне під час проведення вибіркового спостереження, кореляційному та дисперсійному аналізі тощо. Єрмолаєв О.Ю. Математична статистика для психологів: Підручник [Текст]/О.Ю. Єрмолаєв. – М.: Вид-во Флінта Московського психолого-соціального інституту, 2012. – 335с.

За рівнем варіації можна будувати висновки про однорідності сукупності, про стійкість окремих значень ознак і типовості середньої. На основі розробляються показники тісноти зв'язку між ознаками, показники оцінки точності вибіркового спостереження.

Розрізняють варіацію у просторі та варіацію у часі.

Під варіацією у просторі розуміють коливання значень ознаки в одиниць сукупності, що представляють окремі території. Під варіацією у часі мають на увазі зміну значень ознаки у різні періоди часу.

Для вивчення варіації у лавах розподілу проводять розташування всіх варіантів значень ознаки у зростаючому чи спадному порядку. Цей процес називають ранжуванням низки.

Найпростішими ознаками варіації є мінімум та максимум- Найменше та найбільше значення ознаки в сукупності. Число повторень окремих варіантів значень ознак називають частотою повторення (fi). Частоти зручно замінювати частостями – wi. Частина - відносний показник частоти, що може бути виражений у частках одиниці чи відсотках і дозволяє зіставляти варіаційні ряди з різним числом спостережень. Виражається формулою:

де Хmax, Хmin - максимальне та мінімальне значення ознаки в сукупності; n – число груп.

Для вимірювання варіації ознаки застосовуються різні абсолютні та відносні показники. До абсолютних показників варіації відносяться розмах варіації, середнє лінійне відхилення, дисперсія, середнє відхилення квадратичне. До відносних показників коливання відносять коефіцієнт осциляції, відносне лінійне відхилення, коефіцієнт варіації.

Приклад знаходження варіаційного ряду

Завдання.За цією вибіркою:

  • а) Знайти варіаційний ряд;
  • б) побудувати функцію розподілу;

№ = 42. Елементи вибірки:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Рішення.

  • а) побудова ранжованого варіаційного ряду:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • б) побудова дискретного варіаційного ряду.

Обчислимо число груп у варіаційному ряді, користуючись формулою Стерджесса:

Приймемо число груп, рівним 7.

Знаючи число груп, розрахуємо величину інтервалу:

Для зручності побудови таблиці приймемо число груп рівним 8 інтервал складе 1.

Рис. 1 Обсяг продажу магазином товару за певний проміжок часу

Ряди, збудовані за кількісною ознакою, називаються варіаційним.

Ряди розподілів складаються з варіантів(значень ознаки) та частот(Кількості груп). Частоти, виражені як відносних величин (часток, відсотків) називаються частостями. Сума всіх частот називається обсягом низки розподілів.

На вигляд ряди розподілу поділяються на дискретні(побудовані за перервними значеннями ознаки) та інтервальні(Побудовані на безперервних значеннях ознаки).

Варіаційний рядє дві колонки (або рядки); в одній з яких наводяться окремі значення варіює ознаки, іменовані варіантами і позначаються Х; а в іншій - абсолютні числа, що показують скільки разів (як часто) зустрічається кожен варіант. Показники другої колонки називаються частотами та умовно позначають через f. Ще раз зауважимо, що у другій колонці можуть використовуватись і відносні показники, що характеризують частку частоти окремих варіантів у загальній сумі частот. Ці відносні показники називаються частостями і умовно позначають через ω Сума всіх частостей у разі дорівнює одиниці. Однак частоти можна виражати і у відсотках, і тоді сума всіх частостей дає 100%.

Якщо варіанти варіаційного ряду виражені у вигляді дискретних величин, то такий варіаційний ряд називають дискретним.

Для безперервних ознак варіаційні ряди будуються як інтервальнітобто значення ознаки в них виражаються «від ... до ...». У цьому мінімальні значення ознаки у такому інтервалі називають нижньої межею інтервалу, а максимальне – верхньою кордоном.

Інтервальні варіаційні ряди будують і для дискретних ознак, що варіюють у великому діапазоні. Інтервальні ряди можуть бути з рівнимиі нерівнимиінтервалами.

Розглянемо, як визначається величина рівних інтервалів. Введемо такі позначення:

i- Величина інтервалу;

- максимальне значення ознаки одиниць сукупності;

- Мінімальне значення ознаки у одиниць сукупності;

n –кількість груп, що виділяються.

якщо n відомо.

Якщо кількість груп, що виділяються, важко заздалегідь визначити, то для розрахунку оптимальної величини інтервалу при достатньому обсязі сукупності може бути рекомендована формула, запропонована Стерджесом в 1926 році:

n = 1+ 3.322 lg N, де N – число одиниць у сукупності.

Розмір нерівних інтервалів визначається кожному окремому разі з урахуванням особливостей об'єкта вивчення.

Статистичним розподілом вибіркиназивають перелік варіантів і відповідних їм частот (або відносних частот).

Статистичне розподіл вибірки можна задати як таблиці, у першій графі якої розташовуються варіанти, тоді як у другий - відповідні цим варіантам частоти ni, або відносні частоти Pi .

Статистичне розподілення вибірки

Інтервальними називаються варіаційні ряди, у яких значення ознак, покладених в основу їх утворення, виражені у певних межах (інтервалах). Частоти в цьому випадку відносяться не до окремих значень ознаки, а до всього інтервалу.

Інтервальні ряди розподілу будуються за безперервними кількісними ознаками, а також дискретними ознаками, що варіюють у значних межах.

Інтервальний ряд можна подати статистичним розподілом вибірки із зазначенням інтервалів та відповідних частот. При цьому як частота інтервалу приймають суму частот варіант, що потрапили в цей інтервал.

При угрупованні за кількісними безперервними ознаками важливе значення має визначення розміру інтервалу.

Крім вибіркової середньої та вибіркової дисперсії застосовуються інші характеристики варіаційного ряду.

Модоюназивають варіантом, який має найбільшу частоту.

Статистичний ряд розподілу– це впорядкований розподіл одиниць сукупності на групи за певною ознакою, що варіює.
Залежно від ознаки, покладеної в основу утворення ряду розподілу, розрізняють атрибутивні та варіаційні ряди розподілу.

Наявність загальної ознаки є основою освіти статистичної сукупності, що є результати опису чи виміру загальних ознак об'єктів дослідження.

Предметом вивчення в статистиці є ознаки, що змінюються (варіюють) або статистичні ознаками.

Види статистичних ознак.

Атрибутивними називають ряди розподілу, побудовані за якісними ознаками Атрибутивний- Це ознака, що має найменування, (наприклад професія: швачка, вчитель і т.д.).
Ряд розподілу прийнято оформляти як таблиць. У табл. 2.8 наведено атрибутивний ряд розподілу.
Таблиця 2.8 – Розподіл видів юридичної допомоги, наданої адвокатами громадянам одного з регіонів РФ.

Варіаційний ряд- Це значення ознаки (або інтервали значень) та їх частоти.
Варіаційними рядами називають ряди розподілу, побудовані за кількісною ознакою Будь-який варіаційний ряд складається з двох елементів: варіантів та частот.
Варіантами вважаються окремі значення ознаки, які він набуває в варіаційному ряду.
Частоти – це чисельності окремих варіантів чи кожної групи варіаційного низки, тобто. це числа, що показують, як часто зустрічаються ті чи інші варіанти у розподілі. Сума всіх частот визначає чисельність усієї сукупності, її обсяг.
Частинами називаються частоти, виражені у частках одиниці чи відсотках до результату. Відповідно сума частостей дорівнює 1 або 100%. Варіаційний ряд дозволяє за фактичними даними оцінити форму закону розподілу.

Залежно від характеру варіації ознаки розрізняють дискретні та інтервальні варіаційні ряди.
Приклад дискретного варіаційного ряду наведено у табл. 2.9.
Таблиця 2.9 - Розподіл сімей за кількістю кімнат в окремих квартирах в 1989 р. в РФ.

У першій колонці таблиці представлені варіанти дискретного варіаційного ряду, у другій – вміщено частоти варіаційного ряду, у третій – показники частоти.

Варіаційний ряд

У генеральній сукупності досліджується деяка кількісна ознака. З неї випадково витягується вибірка обсягу n, тобто кількість елементів вибірки дорівнює n. На першому етапі статистичної обробки виробляють ранжуваннявибірки, тобто. упорядкування чисел x 1 , x 2 , …, x nза зростанням. Кожне значення, що спостерігається x iназивається варіантом. Частота m i- Це число спостережень значення x iу вибірці. Відносна частота (частина) w i- Це відношення частоти m iдо обсягу вибірки n: .
При вивченні варіаційного ряду також використовують поняття накопиченої частоти та накопиченої частоти. Нехай xкілька. Тоді кількість варіантів , значення яких менше xназивається накопиченою частотою: для x i nназивається накопиченою частиною w i max.
Ознака називається дискретно варіюється, якщо його окремі значення (варіанти) відрізняються один від одного на деяку кінцеву величину (зазвичай ціле число). Варіаційний ряд такої ознаки називається дискретним варіаційним рядом.

Таблиця 1. Загальний вигляд дискретного варіаційного ряду частот

Значення ознакиx i x 1 x 2 x n
Частотиm i m 1 m 2 m n

Ознака називається безперервно варіюючим, якщо його значення відрізняються один від одного на скільки завгодно малу величину, тобто. ознака може набувати будь-яких значень у певному інтервалі. Безперервний варіаційний ряд для такої ознаки називається інтервальною.

Таблиця 2. Загальний вигляд інтервального варіаційного ряду частот

Таблиця 3. Графічні зображення варіаційного ряду

РядПолігон чи гістограмаЕмпірична функція розподілу
Дискретний
Інтервальний
Переглядаючи результати проведених спостережень, визначають, скільки значень варіантів потрапило до кожного конкретного інтервалу. Передбачається, що кожному інтервалу належить один із його кінців: або у всіх випадках ліві (частіше), або у всіх випадках праві, а частоти чи частоти показують кількість варіантів, укладених у зазначених межах. Різниці a i – a i +1називаються частковими інтервалами. Для полегшення наступних розрахунків інтервальний варіаційний ряд можна замінити умовно дискретним. У цьому випадку середнє значення i-го інтервалу приймають за варіант x i, а відповідну інтервальну частоту m i- За частоту цього інтервалу.
Для графічного зображення варіаційних рядів найчастіше використовуються полігон, гістограма, крива кумулятивна і емпірична функція розподілу.

У табл. 2.3 (Угруповання населення Росії за розміром середньодушового доходу у квітні 1994р.) представлений інтервальний варіаційний ряд.
Зручно ряди розподілу аналізувати за допомогою графічного зображення, що дозволяє судити і про форму розподілу. Наочне уявлення про характер зміни частот варіаційного ряду дають полігон та гістограма.
Полігон використовується при зображенні дискретних варіаційних рядів.
Зобразимо, наприклад, графічно розподіл житлового фонду за типом квартир (табл. 2.10).
Таблиця 2.10 – Розподіл житлового фонду міського району за типом квартир (цифри умовні).


Рис. Полігон розподілу житлового фонду


На осі ординат можуть наноситися як значення частот, а й частостей варіаційного ряду.
Гістограма приймається для зображення інтервального варіаційного ряду. При побудові гістограми осі абсцис відкладаються величини інтервалів, а частоти зображуються прямокутниками, побудованими на відповідних інтервалах. Висота стовпчиків у разі рівних інтервалів має бути пропорційна частотам. Гістограма - графік, на якому ряд зображений у вигляді суміжних один з одним стовпчиків.
Зобразимо графічно інтервальний ряд розподілу, наведений у таблиці. 2.11.
Таблиця 2.11 – Розподіл сімей за розміром житлової площі, що припадає на одну особу (цифри умовні).
N п/п Групи сімей за розміром житлової площі, що припадає на одну особу Число сімей з цим розміром житлової площі Накопичена кількість сімей
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ВСЬОГО 115 ----


Рис. 2.2. Гістограма розподілу сімей за розміром житлової площі, що припадає на одну особу


Використовуючи дані накопиченого ряду (табл. 2.11), збудуємо кумуляту розподілу.


Рис. 2.3. Кумулята розподілу сімей за розміром житлової площі, що припадає на одну особу


Зображення варіаційного ряду у вигляді кумуляти є особливо ефективним для варіаційних рядів, частоти яких виражені в частках або відсотках до суми частот ряду.
Якщо при графічному зображенні варіаційного ряду у вигляді кумуляти осі поміняти, ми отримаємо огиву. На рис. 2.4 наведено огива, побудована на основі даних табл. 2.11.
Гістограма може бути перетворена на полігон розподілу, якщо знайти середини сторін прямокутників і потім ці точки з'єднати прямими лініями. Отриманий полігон розподілу зображено на рис. 2.2 пунктирною лінією.
При побудові гістограми розподілу варіаційного ряду з нерівними інтервалами по осі ординат наносять частоти, а щільність розподілу ознаки у відповідних інтервалах.
Щільність розподілу – це частота, розрахована одиницю ширини інтервалу, тобто. скільки одиниць у кожній групі посідає одиницю величини інтервалу. Приклад розрахунку густини розподілу представлений у табл. 2.12.
Таблиця 2.12 – Розподіл підприємств за кількістю зайнятих (цифри умовні)
N п/п Групи підприємств за кількістю зайнятих, чол. Число підприємств Розмір інтервалу, чол. Щільність розподілу
А 1 2 3=1/2
1 До 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ВСЬОГО 147 ---- ----

Для графічного зображення варіаційних рядів може також використовуватися кумулятивна крива. За допомогою кумуляти (кривий сум) зображується ряд накопичених частот. Накопичені частоти визначаються шляхом послідовно підсумовування частот за групами і показують, скільки одиниць сукупності мають значення ознаки не більше ніж розглянуте значення.


Рис. 2.4. Огива розподілу сімей за розміром житлової площі, що припадає на одну особу

При побудові кумуляти інтервального варіаційного ряду осі абсцис відкладаються варіанти ряду, а по осі ординат накопичені частоти.

Безперервний варіаційний ряд

Безперервний варіаційний ряд - ряд, побудований на основі кількісної статистичної ознаки. Приклад. Середня тривалість захворювань засуджених (днів на одну особу) в осінньо-зимовий період у поточному році склала:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5