Variāciju sērijas risinājums. Studentiem un skolēniem - palīdzība mācībās

Stāvoklis:

Ir dati par strādājošo vecuma sastāvu (gadi): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Izveidojiet intervālu sadalījuma sēriju.
    2. Izveidojiet sērijas grafisku attēlojumu.
    3. Grafiski nosakiet režīmu un mediānu.

Risinājums:

1) Pēc Stērdžesa formulas populācija jāsadala 1 + 3,322 lg 30 = 6 grupās.

Maksimālais vecums ir 38 gadi, minimālais ir 18 gadi.

Intervāla platums Tā kā intervālu galiem ir jābūt veseliem skaitļiem, tad populāciju sadalīsim 5 grupās. Intervāla platums - 4.

Lai atvieglotu aprēķinus, sakārtosim datus augošā secībā: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29 , 29, 30, 30, 31, 32, 32, 33, 34, 35, 38, 38.

Strādnieku sadalījums pēc vecuma

Grafiski sēriju var attēlot kā histogrammu vai daudzstūri. Histogramma - joslu diagramma. Kolonnas pamatne ir intervāla platums. Stieņa augstums ir vienāds ar frekvenci.

Daudzstūris (vai sadalījuma daudzstūris) ir frekvenču grafiks. Lai to izveidotu saskaņā ar histogrammu, mēs savienojam taisnstūru augšējo malu viduspunktus. Mēs aizveram daudzstūri uz x ass attālumos, kas vienādi ar pusi no intervāla no galējām x vērtībām.

Mode (Mo) ir pētāmās pazīmes vērtība, kas visbiežāk sastopama noteiktā populācijā.

Lai noteiktu režīmu no histogrammas, jums jāizvēlas augstākais taisnstūris, jānovelk līnija no šī taisnstūra labās virsotnes uz iepriekšējā taisnstūra augšējo labo stūri un jānovelk līnija no modālā taisnstūra kreisās virsotnes uz nākamā taisnstūra kreisā virsotne. No šo līniju krustošanās punkta uzzīmējiet perpendikulāru x asij. Abscisa būs modē. Mo ≈ 27,5. Tas nozīmē, ka visizplatītākais vecums šajā populācijā ir 27-28 gadi.

Mediāna (Me) ir pētāmās pazīmes vērtība, kas atrodas sakārtotas variāciju sērijas vidū.

Mediānu atrodam pēc kumulatīvās vērtības. Cumulate - uzkrāto frekvenču grafiks. Abscises ir sērijas varianti. Ordinātas ir uzkrātās frekvences.

Lai noteiktu kumulatīvās vērtības mediānu, pa ordinātu asi atrodam punktu, kas atbilst 50% no uzkrātajām frekvencēm (mūsu gadījumā 15), caur to novelkam taisnu līniju paralēli Vērša asij un novelkam perpendikulu x ass no tās krustošanās punkta ar kumulātu. Abscisa ir mediāna. Es ≈ 25,9. Tas nozīmē, ka puse strādājošo šajā populācijā ir jaunāki par 26 gadiem.

variācijas sauc par sadales sērijām, kas veidotas uz kvantitatīvā pamata. Kvantitatīvo raksturlielumu vērtības atsevišķās populācijas vienībās nav nemainīgas, vairāk vai mazāk atšķiras viena no otras.

Variācija- atribūta vērtības svārstības, mainīgums populācijas vienībās. Atsevišķi skaitliskās vērtības tiek sauktas pazīmes, kas sastopamas pētāmajā populācijā iespējas vērtības. Vidējās vērtības nepietiekamība pilnīgai populācijas raksturošanai liek vidējās vērtības papildināt ar rādītājiem, kas ļauj novērtēt šo vidējo rādītāju tipiskumu, mērot pētāmās pazīmes svārstības (variācijas).

Variāciju klātbūtne ir saistīta ar daudzu faktoru ietekmi uz pazīmju līmeņa veidošanos. Šie faktori darbojas ar nevienlīdzīgu spēku un dažādos virzienos. Variācijas indikatori tiek izmantoti, lai aprakstītu iezīmju mainīguma mēru.

Variāciju statistiskā pētījuma uzdevumi:

  • 1) zīmju rakstura un pakāpes izpēte atsevišķās populācijas vienībās;
  • 2) atsevišķu faktoru vai to grupu lomas noteikšana atsevišķu populācijas pazīmju variācijā.

Statistikā tiek izmantotas īpašas metodes variāciju pētīšanai, pamatojoties uz rādītāju sistēmas izmantošanu, Ar ar kuru tiek mērīta variācija.

Variāciju izpēte ir būtiska. Variāciju mērīšana ir nepieciešama, veicot izlases novērošanu, korelācijas un dispersijas analīzi utt. Ermolajevs O.Ju. Matemātiskā statistika psihologiem: mācību grāmata [Teksts] / O.Yu. Ermolajevs. - M.: Maskavas Psiholoģiskā un sociālā institūta izdevniecība Flints, 2012. - 335 lpp.

Pēc variācijas pakāpes var spriest par populācijas viendabīgumu, pazīmju individuālo vērtību stabilitāti un vidējā tipiskumu. Pamatojoties uz tiem, tiek izstrādāti zīmju attiecību ciešuma rādītāji, selektīvā novērojuma precizitātes novērtēšanas rādītāji.

Pastāv atšķirības telpā un laikā.

Izmaiņas telpā tiek saprastas kā objekta vērtību svārstības iedzīvotāju vienībās, kas pārstāv atsevišķas teritorijas. Ar laika izmaiņām tiek domātas atribūta vērtību izmaiņas dažādos laika periodos.

Lai izpētītu sadalījuma sēriju variācijas, visi atribūtu vērtību varianti ir sakārtoti augošā vai dilstošā secībā. Šo procesu sauc par sēriju ranžēšanu.

Vienkāršākās variācijas pazīmes ir minimālais un maksimālais- atribūta mazākā un lielākā vērtība apkopojumā. Atsevišķu pazīmju vērtību variantu atkārtojumu skaitu sauc par atkārtošanās biežumu (fi). Frekvences ir ērti aizstāt ar frekvencēm - wi. Biežums - relatīvs biežuma rādītājs, ko var izteikt vienības daļās vai procentos un ļauj salīdzināt variāciju rindas ar dažādu novērojumu skaitu. Izteikts ar formulu:

kur Xmax, Xmin - atribūta maksimālās un minimālās vērtības apkopojumā; n ir grupu skaits.

Pazīmes variācijas mērīšanai izmanto dažādus absolūtos un relatīvos rādītājus. Absolūtie variācijas rādītāji ietver variācijas diapazonu, vidējo lineāro novirzi, dispersiju, standartnovirzi. Pie relatīvajiem svārstību rādītājiem pieder svārstību koeficients, relatīvā lineārā novirze, variācijas koeficients.

Variāciju sērijas atrašanas piemērs

Vingrinājums.Šim paraugam:

  • a) Atrodi variāciju sēriju;
  • b) Konstruē sadales funkciju;

Nr.=42. Preču paraugi:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Risinājums.

  • a) ranžētas variāciju sērijas izveide:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) diskrētu variāciju rindas konstruēšana.

Aprēķināsim grupu skaitu variāciju sērijā, izmantojot Stērdžesa formulu:

Ņemsim grupu skaitu, kas vienāds ar 7.

Zinot grupu skaitu, mēs aprēķinām intervāla vērtību:

Tabulas veidošanas ērtībai mēs ņemsim grupu skaitu, kas vienāds ar 8, intervāls būs 1.

Rīsi. viens Veikala preču pārdošanas apjoms noteiktā laika periodā

Grupēšanas metode ļauj arī izmērīt variācija zīmju (mainība, svārstības). Ja iedzīvotāju vienību skaits ir salīdzinoši neliels, variācijas mēra, pamatojoties uz ranžētu vienību sēriju, kas veido populāciju. Rinda tiek saukta ierindota ja vienības ir sakārtotas augošā (dilstošā) pazīmē.

Tomēr ranžētas sērijas ir drīzāk orientējošas, ja ir vajadzīgs salīdzinošs variācijas raksturlielums. Turklāt daudzos gadījumos nākas saskarties ar statistikas agregātiem, kas sastāv no liela skaita vienību, kurus praktiski ir grūti attēlot konkrētas sērijas veidā. Šajā sakarā sākotnējai vispārējai iepazīšanai ar statistikas datiem un it īpaši, lai atvieglotu zīmju variācijas izpēti, pētāmās parādības un procesi parasti tiek apvienoti grupās, un grupēšanas rezultāti tiek sastādīti grupu tabulu veidā. .

Ja grupu tabulā ir tikai divas kolonnas - grupas atbilstoši izvēlētajai pazīmei (opcijas) un grupu skaitam (frekvences vai frekvences), tiek izsaukts tuvu izplatīšanai.

Izplatīšanas diapazons - vienkāršākais strukturālās grupēšanas veids pēc viena atribūta, kas attēlots grupu tabulā ar divām kolonnām, kas satur atribūta variantus un biežumus. Daudzos gadījumos ar šādu strukturālu grupējumu, t.i. ar sadalījuma rindu sastādīšanu sākas sākotnējā statistiskā materiāla izpēte.

Strukturālo grupējumu sadalījuma rindas veidā var pārvērst par patiesu strukturālu grupējumu, ja atlasītās grupas raksturo ne tikai biežums, bet arī citi statistiskie rādītāji. Izplatīšanas sērijas galvenais mērķis ir izpētīt pazīmju variācijas. Sadalījuma rindu teoriju detalizēti izstrādā matemātiskā statistika.

Izplatīšanas sērijas ir sadalītas atribūtīvs(grupēšana pēc atribūtīvām pazīmēm, piemēram, iedzīvotāju sadalījums pēc dzimuma, tautības, ģimenes stāvokļa utt.) un variācijas(grupēšana pēc kvantitatīviem rādītājiem).

Variāciju sērija ir grupu tabula, kurā ir divas kolonnas: vienību grupējums pēc viena kvantitatīvā atribūta un vienību skaita katrā grupā. Intervāli variāciju sērijās parasti ir vienādi un slēgti. Variāciju rinda ir šāda Krievijas iedzīvotāju grupēšana pēc vidējiem naudas ienākumiem uz vienu iedzīvotāju (3.10. tabula).

3.10. tabula

Krievijas iedzīvotāju sadalījums pēc vidējiem ienākumiem uz vienu iedzīvotāju 2004.-2009

Iedzīvotāju grupas pēc vidējiem naudas ienākumiem uz vienu iedzīvotāju, rub./mēn

Iedzīvotāju skaits grupā, % no kopskaita

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Vairāk nekā 25 000,0

Visi iedzīvotāji

Savukārt variācijas sērijas iedala diskrētās un intervālā. Diskrēts variāciju sērija apvieno atsevišķu pazīmju variantus, kas atšķiras šaurās robežās. Diskrētu variāciju sērijas piemērs ir krievu ģimeņu sadalījums pēc bērnu skaita.

Intervāls variāciju sērijas apvieno vai nu nepārtrauktu, vai diskrētu funkciju variantus, kas mainās plašā diapazonā. Intervālu rinda ir Krievijas iedzīvotāju sadalījuma variāciju sērija vidējo naudas ienākumu uz vienu iedzīvotāju izteiksmē.

Diskrētās variāciju sērijas praksē netiek izmantotas ļoti bieži. Tikmēr to sastādīšana nav grūta, jo grupu sastāvu nosaka konkrētie varianti, kādi faktiski piemīt pētītajām grupēšanas pazīmēm.

Intervālu variāciju sērijas ir plašāk izplatītas. Sastādot tos, rodas sarežģīts jautājums par grupu skaitu, kā arī par to intervālu lielumu, kas būtu jānosaka.

Šīs problēmas risināšanas principi ir izklāstīti nodaļā par statistisko grupu veidošanas metodiku (sk. 3.3. punktu).

Variāciju sērijas ir līdzeklis daudzveidīgas informācijas sakraušanai vai saspiešanai kompaktā formā, ar tām var izdarīt diezgan skaidru spriedumu par variācijas būtību, izpētīt pētāmajā kopā iekļauto parādību pazīmju atšķirības. Taču variāciju rindu vissvarīgākā nozīme ir tāda, ka uz to pamata tiek aprēķināti variāciju īpašie vispārinošie raksturlielumi (sk. 7. nodaļu).

  • ievadstunda par brīvu;
  • Liels skaits pieredzējušu skolotāju (dzimtā un krievvalodīgo);
  • Kursi NAV uz noteiktu periodu (mēnesis, seši mēneši, gads), bet gan noteiktam nodarbību skaitam (5, 10, 20, 50);
  • Vairāk nekā 10 000 apmierinātu klientu.
  • Vienas nodarbības izmaksas ar krieviski runājošu skolotāju - no 600 rubļiem, kam dzimtā valoda - no 1500 rubļiem

Variāciju sērijas jēdziens. Pirmais solis statistisko novērojumu materiālu sistematizācijā ir to vienību skaitīšana, kurām ir viena vai otra iezīme. Sakārtojot vienības to kvantitatīvā atribūta augošā vai dilstošā secībā un saskaitot vienību skaitu ar noteiktu atribūta vērtību, iegūstam variāciju sēriju. Variāciju rinda raksturo noteiktas statistiskās populācijas vienību sadalījumu pēc kāda kvantitatīvā atribūta.

Variāciju sērija sastāv no divām kolonnām, kreisajā kolonnā ir mainīgā atribūta vērtības, ko sauc par variantiem un apzīmē ar (x), bet labajā kolonnā ir absolūtie skaitļi, kas parāda, cik reižu katrs variants parādās. Šajā kolonnā esošās vērtības sauc par frekvencēm un apzīmē ar (f).

Shematiski variāciju sērijas var attēlot 5.1. tabulas veidā:

5.1. tabula

Variāciju sērijas veids

Opcijas (x)

Frekvences (f)

Labajā kolonnā var izmantot arī relatīvos rādītājus, kas raksturo atsevišķu variantu biežuma proporciju kopējā frekvenču apjomā. Šos relatīvos rādītājus sauc par frekvencēm un nosacīti apzīmē ar , t.i. . Visu frekvenču summa ir vienāda ar vienu. Frekvences var izteikt arī procentos, un tad to summa būs vienāda ar 100%.

Mainīgās zīmes var būt dažāda rakstura. Dažu zīmju varianti tiek izteikti ar veseliem skaitļiem, piemēram, istabu skaits dzīvoklī, izdoto grāmatu skaits utt. Šīs pazīmes sauc par pārtrauktām vai diskrētām. Citu raksturlielumu varianti noteiktās robežās var iegūt jebkādas vērtības, piemēram, plānoto mērķu izpilde, alga utt. Šīs zīmes sauc par nepārtrauktām.

Diskrētās variāciju sērijas. Ja variāciju rindas variantus izsaka kā diskrētos daudzumos, tad šādu variāciju sēriju sauc par diskrētu, tās izskats ir parādīts tabulā. 5.2:

5.2. tabula

Skolēnu sadalījums pa eksāmenā iegūtajiem vērtējumiem

Vērtējumi (x)

Studentu skaits (f)

% no kopējā apjoma ()

Diskrētu sēriju sadalījuma būtība ir grafiski attēlota kā sadalījuma daudzstūris, 5.1. att.

Rīsi. 5.1. Skolēnu sadalījums pa eksāmenā iegūtajiem vērtējumiem.

Intervālu variāciju sērijas. Nepārtrauktām pazīmēm variāciju sērijas tiek konstruētas kā intervālu sērijas, t.i. pazīmju vērtības tajās tiek izteiktas kā intervāli "no un līdz". Šajā gadījumā objekta minimālo vērtību šādā intervālā sauc par intervāla apakšējo robežu, bet maksimālo vērtību - par intervāla augšējo robežu.

Intervālu variāciju sērijas ir izveidotas gan nepārtrauktām funkcijām (diskrētām), gan tām, kas atšķiras lielā diapazonā. Intervālu rindas var būt ar vienādiem un nevienādiem intervāliem. Ekonomiskajā praksē lielākoties tiek izmantoti nevienlīdzīgi intervāli, kas pakāpeniski palielinās vai samazinās. Šāda vajadzība rodas īpaši gadījumos, kad zīmes svārstības tiek veiktas nevienmērīgi un lielās robežās.

Apsveriet formu intervālu sērijas ar vienādiem intervāliem, tab. 5.3:

5.3. tabula

Strādnieku sadalījums pēc produkcijas

Izvade, tr. (X)

Darba ņēmēju skaits (f)

Kumulatīvais biežums (f´)

Intervālu sadalījuma sērija ir grafiski attēlota kā histogramma, 5.2. att.

Att.5.2. Strādnieku sadalījums pēc produkcijas

Uzkrātā (kumulatīvā) frekvence. Praksē ir nepieciešams pārveidot sadales sērijas par kumulatīvās rindas, veidota uz uzkrātajām frekvencēm. Tos var izmantot, lai definētu strukturālos vidējos rādītājus, kas atvieglo sadalījuma rindu datu analīzi.

Kumulatīvās frekvences tiek noteiktas, secīgi saskaitot šo rādītāju pirmās grupas frekvences (vai frekvences) sadalījuma rindas turpmākās grupas. Izplatīšanas sērijas ilustrēšanai tiek izmantoti kumulatīvie dati un ogi. Lai tos izveidotu, uz abscisu ass tiek atzīmētas diskrētas pazīmes (vai intervālu galu) vērtības, bet uz ordinātu ass tiek atzīmētas pieaugošās frekvenču kopsummas (kumulācijas), 5.3. att.

Rīsi. 5.3. Strādnieku kumulatīvais sadalījums pēc attīstības

Ja frekvenču un variantu skalas tiek apmainītas, t.i. atspoguļo uzkrātās frekvences uz abscisu ass un opciju vērtības uz ordinātu ass, tad līkne, kas raksturo frekvenču izmaiņas no grupas uz grupu, tiks saukta par sadalījuma avotu, 5.4. att.

Rīsi. 5.4. Ogiva strādnieku sadale ražošanai

Variāciju rindas ar vienādiem intervāliem nodrošina vienu no svarīgākajām prasībām statistiskā sadalījuma rindām, nodrošinot to salīdzināmību laikā un telpā.

Izplatības blīvums. Tomēr atsevišķu nevienādu intervālu frekvences šajās sērijās nav tieši salīdzināmas. Šādos gadījumos, lai nodrošinātu nepieciešamo salīdzināmību, tiek aprēķināts sadalījuma blīvums, t.i. noteikt, cik vienību katrā grupā ir vienai intervāla vērtības vienībai.

Veidojot variāciju sērijas sadalījuma grafiku ar nevienādiem intervāliem, taisnstūru augstumu nosaka proporcionāli nevis frekvencēm, bet gan pētāmās pazīmes vērtību sadalījuma blīvuma rādītājiem atbilstošajos intervālos.

Variāciju sērijas sastādīšana un tās grafiskais attēlojums ir pirmais solis sākotnējo datu apstrādē un pirmais solis pētāmās populācijas analīzē. Nākamais solis variāciju rindu analīzē ir galveno vispārinošo rādītāju noteikšana, ko sauc par rindas raksturlielumiem. Šiem raksturlielumiem vajadzētu sniegt priekšstatu par atribūta vidējo vērtību populācijas vienībās.

vidējā vērtība. Vidējā vērtība ir pētāmās pazīmes vispārināts raksturojums pētāmajā populācijā, kas atspoguļo tās tipisko līmeni uz populācijas vienību konkrētos vietas un laika apstākļos.

Vidējā vērtība vienmēr tiek nosaukta, tai ir tāda pati dimensija kā atsevišķu populācijas vienību atribūtam.

Pirms vidējo vērtību aprēķināšanas nepieciešams sagrupēt pētāmās populācijas vienības, izceļot kvalitatīvi viendabīgas grupas.

Iedzīvotājiem kopumā aprēķināto vidējo sauc par vispārējo vidējo, bet katrai grupai - grupas vidējiem.

Ir divu veidu vidējie lielumi: jauda (aritmētiskais vidējais, harmoniskais vidējais, ģeometriskais vidējais, vidējā kvadrātiskā vērtība); strukturāls (režīms, mediāna, kvartiles, deciles).

Vidējās vērtības izvēle aprēķinam ir atkarīga no mērķa.

Vidējo jaudu veidi un to aprēķināšanas metodes. Savāktā materiāla statistiskās apstrādes praksē rodas dažādas problēmas, kuru risināšanai nepieciešami dažādi vidējie rādītāji.

Matemātiskā statistika iegūst dažādus līdzekļus no vidējās jaudas formulas:

kur ir vidējā vērtība; x - atsevišķas opcijas (iezīmju vērtības); z - eksponents (pie z = 1 - vidējais aritmētiskais, z = 0 ģeometriskais vidējais, z = - 1 - harmoniskais vidējais, z = 2 - vidējais kvadrātiskais).

Taču jautājums par to, kāds vidējais būtu jāpiemēro katrā atsevišķā gadījumā, tiek atrisināts ar konkrēta analīze pētīta populācija.

Visizplatītākais vidējo rādītāju veids statistikā ir vidējais aritmētiskais. To aprēķina gadījumos, kad vidējā atribūta apjoms tiek veidots kā tā vērtību summa atsevišķām pētāmās statistiskās kopas vienībām.

Atkarībā no sākotnējo datu veida vidējo aritmētisko nosaka dažādos veidos:

Ja dati nav grupēti, tad aprēķinu veic pēc vienkāršas vidējās vērtības formulas

Vidējā aritmētiskā aprēķins diskrētajā rindā notiek pēc formulas 3.4.

Vidējā aritmētiskā aprēķins intervālu rindā. Intervālu variāciju sērijā, kur intervāla vidus nosacīti tiek ņemts par pazīmes vērtību katrā grupā, vidējais aritmētiskais var atšķirties no vidējā, kas aprēķināts no negrupētiem datiem. Turklāt, jo lielāks intervāls grupās, jo vairāk iespējamās novirzes vidējais, kas aprēķināts no grupētajiem datiem, no vidējā, kas aprēķināts no negrupētajiem datiem.

Aprēķinot vidējo intervālu variāciju rindai, lai veiktu nepieciešamos aprēķinus, no intervāliem pāriet uz to viduspunktiem. Un pēc tam aprēķiniet vidējo vērtību pēc vidējā aritmētiskā svērtā formulas.

Vidējā aritmētiskā vērtība. Vidējam aritmētiskajam ir dažas īpašības, kas ļauj vienkāršot aprēķinus, ņemsim vērā tos.

1. Pastāvīgo skaitļu vidējais aritmētiskais ir vienāds ar šo konstanto skaitli.

Ja x = a. Tad .

2. Ja proporcionāli tiek mainīti visu opciju svari, t.i. palielināt vai samazināt tikpat reižu, tad jaunās rindas vidējais aritmētiskais no šī nemainīsies.

Ja visus svarus f samazina par k reižu, tad .

3. Atsevišķu opciju pozitīvo un negatīvo noviržu summa no vidējā, reizināta ar svariem, ir vienāda ar nulli, t.i.

Ja tad . No šejienes.

Ja visas opcijas tiek samazinātas vai palielinātas par kādu skaitli, tad jaunās rindas vidējais aritmētiskais samazināsies vai palielināsies par tādu pašu summu.

Samaziniet visas iespējas x uz a, t.i. x´ = xa.

Tad

Sākotnējās rindas vidējo aritmētisko var iegūt, reducētajam vidējam pieskaitot no variantiem iepriekš atņemto skaitli a, t.i. .

5. Ja visas iespējas tiek samazinātas vai palielinātas k reizes, tad jaunās rindas vidējais aritmētiskais samazināsies vai palielināsies par tādu pašu summu, t.i. iekšā k vienreiz.

Lai tad .

Līdz ar to t.i. lai iegūtu sākotnējo sēriju vidējo, jauno sēriju vidējais aritmētiskais (ar samazinātām iespējām) jāpalielina par k vienreiz.

Vidēja harmonika. Vidējais harmoniskais ir vidējā aritmētiskā apgrieztais lielums. To izmanto, ja statistikas informācija nesatur atsevišķu populācijas iespēju biežumu, bet tiek parādīta kā to reizinājums (M = xf). Vidējais harmoniskais tiks aprēķināts, izmantojot formulu 3.5

Vidējā harmoniskā pielietojums ir dažu indeksu, jo īpaši cenu indeksa, aprēķināšana.

Ģeometriskais vidējais. Piemērojot ģeometrisko vidējo, atribūta individuālās vērtības parasti ir dinamikas relatīvās vērtības, kas veidotas ķēdes vērtību veidā kā attiecība pret katra līmeņa iepriekšējo līmeni dinamikas sērijā. . Tādējādi vidējais rādītājs raksturo vidējo pieauguma tempu.

Ģeometrisko vidējo izmanto arī, lai noteiktu vienādā attālumā esošo vērtību no atribūta maksimālās un minimālās vērtības. Piemēram, apdrošināšanas kompānija slēdz līgumus par auto apdrošināšanas pakalpojumu sniegšanu. Atkarībā no konkrētā apdrošināšanas gadījuma apdrošināšanas maksājums var svārstīties no 10 000 līdz 100 000 dolāru gadā. Vidējā apdrošināšanas izmaksa ir USD.

Ģeometriskais vidējais ir vērtība, ko izmanto kā attiecību vidējo vērtību vai sadalījuma rindā, kas uzrādīta kā ģeometriskā progresija, kad z = 0. Šo vidējo ir ērti izmantot, ja uzmanība tiek pievērsta nevis absolūtām atšķirībām, bet gan attiecībām. divi cipari.

Aprēķinu formulas ir šādas

kur ir vidējās pazīmes varianti; - opciju produkts; f– opciju biežums.

Ģeometrisko vidējo izmanto, lai aprēķinātu vidējos gada pieauguma tempus.

Vidējais kvadrāts. Kvadrātsaknes formulu izmanto, lai izmērītu pazīmes individuālo vērtību svārstību pakāpi ap vidējo aritmētisko sadalījuma rindā. Tātad, aprēķinot variācijas rādītājus, vidējo aprēķina no pazīmes atsevišķu vērtību noviržu kvadrātiem no vidējā aritmētiskā.

Vidējo kvadrāta vērtību aprēķina pēc formulas

Ekonomiskajos pētījumos, aprēķinot pazīmes variācijas rādītājus, piemēram, dispersiju, standartnovirzi, plaši tiek izmantota vidējā kvadrātiskā modificētā forma.

Vairākuma noteikums. Starp jaudas likuma vidējiem rādītājiem pastāv šāda sakarība - jo lielāks eksponents, jo lielāka ir vidējā vērtība, 5.4. tabula:

5.4. tabula

Attiecības starp vidējiem rādītājiem

z vērtība

Attiecība starp vidējiem rādītājiem

Šo attiecību sauc par majoritātes likumu.

Strukturālie vidējie rādītāji. Iedzīvotāju struktūras raksturošanai tiek izmantoti īpaši rādītāji, kurus var saukt par strukturālajiem vidējiem. Šie rādītāji ietver režīmu, mediānu, kvartiles un deciles.

Mode. Mode (Mo) ir visbiežāk sastopamā objekta vērtība populācijas vienībās. Mode ir atribūta vērtība, kas atbilst teorētiskās sadalījuma līknes maksimālajam punktam.

Mode tiek plaši izmantota komercpraksē patērētāju pieprasījuma izpētē (nosakot ļoti pieprasīto apģērbu un apavu izmērus), cenu reģistrāciju. Kopumā var būt vairāki modifikācijas.

Režīmu aprēķins diskrētā sērijā. Diskrētā sērijā režīms ir variants ar augstāko frekvenci. Apsveriet iespēju atrast režīmu diskrētā sērijā.

Modes aprēķins intervālu sērijās. Intervālu variāciju sērijā modālā intervāla centrālais variants aptuveni tiek uzskatīts par režīmu, t.i. intervāls, kuram ir visaugstākā frekvence (frekvence). Intervālā ir jāatrod atribūta vērtība, kas ir režīms. Intervālu sērijai režīms tiks noteikts pēc formulas

kur ir modālā intervāla apakšējā robeža; ir modālā intervāla vērtība; ir frekvence, kas atbilst modālajam intervālam; ir frekvence pirms modālā intervāla; ir intervāla biežums pēc modāla.

Mediāna. Mediāna () ir objekta vērtība ranžētās sērijas vidējā vienībā. Sarindota sērija ir sērija, kurā raksturīgās vērtības ir rakstītas augošā vai dilstošā secībā. Vai arī mediāna ir vērtība, kas sadala sakārtotas variāciju sērijas skaitu divās vienādās daļās: vienai daļai ir mainīgas pazīmes vērtība, kas ir mazāka par vidējo variantu, bet otrai ir liela.

Lai atrastu mediānu, vispirms tiek noteikts tā sērijas numurs. Lai to izdarītu, ar nepāra vienību skaitu visu frekvenču summai pievieno vienu un visu dala ar diviem. Ar pāra vienību skaitu mediāna tiek atrasta kā vienības atribūta vērtība, kuras kārtas numuru nosaka kopējā frekvenču summa, kas dalīta ar divi. Zinot mediānas kārtas numuru, ir viegli atrast tā vērtību no uzkrātajām frekvencēm.

Mediānas aprēķins diskrētā rindā. Atbilstoši izlases apsekojumam iegūti dati par ģimeņu sadalījumu pēc bērnu skaita, tabula. 5.5. Lai noteiktu mediānu, vispirms nosakiet tā kārtas numuru

=

Pēc tam mēs izveidojam uzkrāto frekvenču sēriju (, by sērijas numurs un uzkrāto biežumu mēs atrodam mediānu. Uzkrātais biežums 33 liecina, ka 33 ģimenēs bērnu skaits nepārsniedz 1 bērnu, bet, tā kā mediāna ir 50, tad mediāna būs robežās no 34 līdz 55 ģimenēm.

5.5. tabula

Ģimeņu skaita sadalījums no bērnu skaita

Bērnu skaits ģimenē

Ģimeņu skaits ir vidējā intervāla vērtība;

Visām aplūkotajām vidējā jaudas formām ir svarīga īpašība (atšķirībā no strukturālajiem līdzekļiem) - vidējā noteikšanas formula ietver visas sērijas vērtības, t.i. vidējā lielumu ietekmē katra opcijas vērtība.

No vienas puses, tas ir ļoti pozitīvs īpašums. šajā gadījumā tiek ņemta vērā visu cēloņu ietekme, kas ietekmē visas pētāmās populācijas vienības. No otras puses, pat viens novērojums, kas nejauši tika iekļauts sākotnējos datos, var būtiski izkropļot priekšstatu par pētāmās pazīmes attīstības līmeni attiecīgajā populācijā (īpaši īsās sērijās).

Kvartiles un deciles. Pēc analoģijas ar mediānas atrašanu variāciju sērijās var atrast objekta vērtību jebkurā secībā sakārtotā sērijas vienībā. Tātad jo īpaši var atrast pazīmes vērtību vienībām, kas sadala sēriju 4 vienādās daļās, 10 utt.

Kvartiles. Variantus, kas sadala sarindotās sērijas četrās vienādās daļās, sauc par kvartilēm.

Tajā pašā laikā izšķir: apakšējā (vai pirmā) kvartile (Q1) - objekta vērtība ranžētās sērijas vienībā, dalot populāciju attiecībā no ¼ līdz ¾ un augšējo (vai trešo) ) kvartile (Q3) - objekta vērtība sarindotās sērijas vienībā, dalot populāciju attiecībā no ¾ līdz ¼.

Otrā kvartile ir mediāna Q2 = Me. Apakšējo un augšējo kvartiļu intervālu sērijās aprēķina, izmantojot formulu, kas ir līdzīga mediānai.

kur ir intervāla apakšējā robeža, kas satur attiecīgi apakšējo un augšējo kvartili;

ir tā intervāla kumulatīvā frekvence, kas ir pirms intervāla, kas satur apakšējo vai augšējo kvartili;

- kvartiļu intervālu frekvences (apakšējā un augšējā)

Intervāli, kas satur Q1 un Q3, tiek noteikti no uzkrātajām frekvencēm (vai frekvencēm).

Deciles. Papildus kvartilēm tiek aprēķinātas deciles - opcijas, kas sadala sarindotās sērijas 10 vienādās daļās.

Tos apzīmē ar D, pirmā decile D1 dala virkni attiecībā 1/10 un 9/10, otrā D2 - 2/10 un 8/10 utt. Tos aprēķina tāpat kā mediānu un kvartiles.

Gan mediāna, gan kvartiles, gan deciles pieder pie tā sauktās kārtas statistikas, kas tiek saprasta kā variants, kas ieņem noteiktu kārtas vietu ranžētā sērijā.

Apstrādājot lielus informācijas apjomus, kas ir īpaši svarīgi, veicot mūsdienu zinātnes attīstību, pētnieks saskaras ar nopietnu uzdevumu pareizi sagrupēt sākotnējos datus. Ja dati ir diskrēti, tad, kā mēs redzējām, problēmu nav - jums vienkārši jāaprēķina katras funkcijas biežums. Ja pētāmajai iezīmei ir nepārtraukts raksturs (kas ir biežāk sastopams praksē), tad optimālā intervālu skaita izvēle pazīmes grupēšanai nekādā ziņā nav triviāls uzdevums.

Lai grupētu nepārtrauktus gadījuma mainīgos, viss objekta variāciju diapazons ir sadalīts noteiktā skaitā intervālu uz.

Grupēts intervāls (nepārtraukts) variācijas sērijas sauc par intervāliem, kas sakārtoti pēc objekta vērtības (), kur norādīts kopā ar atbilstošajām frekvencēm () novērojumu skaits, kas iekļuva r "intervālā, vai relatīvās frekvences ():

Raksturīgo vērtību intervāli

mi frekvence

joslu diagramma un kumulēt (ogiva), ir lielisks datu vizualizācijas rīks, kas ļauj iegūt primāro izpratni par datu struktūru. Šādi grafiki (1.15. att.) tiek veidoti nepārtrauktiem datiem tāpat kā diskrētiem datiem, tikai ņemot vērā to, ka nepārtrauktie dati pilnībā aizpilda to iespējamo vērtību laukumu, ņemot jebkuras vērtības.

Rīsi. 1.15.

Tāpēc histogrammas un kumulatīvās kolonnas ir jāsaskaras, tām nedrīkst būt apgabalu, kur atribūtu vērtības neietilpst visās iespējamās robežās.(t.i., histogrammā un kumulātā nedrīkst būt "caurumi" gar abscisu asi, kuros pētāmā mainīgā vērtības neietilpst, kā parādīts 1.16. attēlā). Joslas augstums atbilst frekvencei - novērojumu skaitam, kas ietilpst dotajā intervālā, vai relatīvajam biežumam - novērojumu īpatsvaram. Intervāli nedrīkst šķērsot un parasti ir vienāda platuma.

Rīsi. 1.16.

Histogramma un daudzstūris ir varbūtības blīvuma līknes tuvinājumi (diferenciālā funkcija) f(x) teorētiskais sadalījums, aplūkots varbūtības teorijas gaitā. Tāpēc to konstrukcijai ir tik liela nozīme kvantitatīvo nepārtraukto datu primārajā statistiskajā apstrādē - pēc to formas var spriest par hipotētisko sadalījuma likumu.

Cumulate - intervālu variāciju rindas uzkrāto frekvenču (frekvenču) līkne. Integrālā sadalījuma funkcijas grafiks tiek salīdzināts ar kumulātu F(x), kas ņemts vērā arī varbūtības teorijas gaitā.

Pamatā histogrammas un kumulātu jēdzieni ir precīzi saistīti ar nepārtrauktiem datiem un to intervālu variāciju rindām, jo ​​to grafiki ir attiecīgi varbūtības blīvuma funkcijas un sadalījuma funkcijas empīriski aprēķini.

Intervālu variāciju sērijas konstruēšana sākas ar intervālu skaita noteikšanu k. Un šis uzdevums, iespējams, ir visgrūtākais, svarīgākais un strīdīgākais pētāmajā jautājumā.

Intervālu skaits nedrīkst būt pārāk mazs, jo histogramma būs pārāk gluda ( pārgludināts), zaudē visas sākotnējo datu mainīguma pazīmes - att. 1.17 var redzēt, kā tie paši dati, uz kuriem grafiki att. 1.15 izmanto, lai izveidotu histogrammu ar mazāku intervālu skaitu (kreisais grafiks).

Tajā pašā laikā intervālu skaits nedrīkst būt pārāk liels - pretējā gadījumā mēs nevarēsim novērtēt pētāmo datu sadalījuma blīvumu pa skaitlisko asi: histogramma izrādīsies nepietiekami izlīdzināta. (apakš nogludināts) ar neaizpildītiem intervāliem, nevienmērīgi (skat. 1.17. att., grafiks pa labi).

Rīsi. 1.17.

Kā noteikt vispiemērotāko intervālu skaitu?

1926. gadā Herberts Stērgess ierosināja formulu, kā aprēķināt intervālu skaitu, kuros nepieciešams sadalīt pētāmā atribūta sākotnējo vērtību kopu. Šī formula patiešām ir kļuvusi ļoti populāra - lielākā daļa statistikas mācību grāmatu to piedāvā, un daudzas statistikas pakotnes to izmanto pēc noklusējuma. Tas, vai tas ir pamatoti un visos gadījumos, ir ļoti nopietns jautājums.

Tātad, uz ko ir balstīta Stērgesa formula?

Apsveriet binomiālais sadalījums }