Variacinės serijos sprendimas. Studentams ir moksleiviams – pagalba studijuojant

Būklė:

Yra duomenų apie darbuotojų amžiaus sudėtį (metai): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Sukurkite intervalų paskirstymo eilutę.
    2. Sukurkite grafinį serijos vaizdą.
    3. Grafiškai nustatykite režimą ir medianą.

Sprendimas:

1) Pagal Sturgesso formulę populiacija turi būti suskirstyta į 1 + 3,322 lg 30 = 6 grupes.

Maksimalus amžius – 38, minimalus – 18 metų.

Intervalo plotis Kadangi intervalų galai turi būti sveikieji skaičiai, populiaciją suskirstysime į 5 grupes. Intervalo plotis - 4.

Kad būtų lengviau atlikti skaičiavimus, išdėliokime duomenis didėjančia tvarka: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29 , 29, 30 , 30, 31, 32, 32, 33, 34, 35, 38, 38.

Darbuotojų pasiskirstymas pagal amžių

Grafiškai serija gali būti rodoma kaip histograma arba daugiakampis. Histograma – juostinė diagrama. Stulpelio pagrindas yra intervalo plotis. Juostos aukštis lygus dažniui.

Daugiakampis (arba pasiskirstymo daugiakampis) yra dažnių grafikas. Norėdami jį sukurti pagal histogramą, sujungiame stačiakampių viršutinių kraštinių vidurio taškus. Uždarome daugiakampį ant x ašies atstumais, lygiais pusei intervalo nuo kraštutinių x reikšmių.

Režimas (Mo) yra tiriamo požymio, dažniausiai pasitaikančio tam tikroje populiacijoje, reikšmė.

Norėdami nustatyti režimą iš histogramos, turite pasirinkti aukščiausią stačiakampį, nubrėžti liniją nuo dešiniosios šio stačiakampio viršūnės iki ankstesnio stačiakampio viršutinio dešiniojo kampo ir nubrėžti liniją nuo kairiosios modalinio stačiakampio viršūnės iki kito stačiakampio kairioji viršūnė. Nuo šių linijų susikirtimo taško nubrėžkite statmeną x ašiai. Abscisė bus mada. Mo ≈ 27,5. Tai reiškia, kad dažniausiai šios populiacijos amžius yra 27–28 metai.

Mediana (Me) yra tiriamo požymio vertė, kuri yra tvarkingos variacijų serijos viduryje.

Medianą randame pagal kumuliaciją. Cumulate – sukauptų dažnių grafikas. Abscisos yra serijos variantai. Ordinatės yra sukaupti dažniai.

Norėdami nustatyti kumuliacijos medianą, išilgai ordinačių ašies randame tašką, atitinkantį 50% sukauptų dažnių (mūsų atveju 15), per jį nubrėžiame tiesią liniją, lygiagrečią Ox ašiai, ir statmeną x ašis nuo jos susikirtimo su kumuliacija taško. Abscisė yra mediana. Aš ≈ 25,9. Tai reiškia, kad pusė šios populiacijos darbuotojų yra jaunesni nei 26 metų amžiaus.

variacinis vadinamos paskirstymo serijomis, sukurtomis kiekybiniu pagrindu. Kiekybinių charakteristikų reikšmės atskiruose populiacijos vienetuose nėra pastovios, daugiau ar mažiau skiriasi viena nuo kitos.

Variacija- požymio reikšmės svyravimas, kintamumas populiacijos vienetais. Atskirai skaitinės reikšmės vadinami bruožai, atsirandantys tiriamoje populiacijoje galimybės vertybes. Vidutinės vertės nepakankamumas pilnam populiacijos apibūdinimui verčia vidutines reikšmes papildyti rodikliais, leidžiančiais įvertinti šių vidurkių tipiškumą, matuojant tiriamo požymio svyravimą (variaciją).

Variacija atsiranda dėl daugelio veiksnių įtakos bruožo lygio formavimuisi. Šie veiksniai veikia nevienoda jėga ir skirtingomis kryptimis. Požymio kintamumo matui apibūdinti naudojami kitimo rodikliai.

Statistinio variacijos tyrimo uždaviniai:

  • 1) atskirų populiacijos vienetų ženklų kitimo pobūdžio ir laipsnio tyrimas;
  • 2) atskirų veiksnių ar jų grupių reikšmės tam tikrų populiacijos bruožų kaitoje nustatymas.

Statistikoje naudojami specialūs kitimo tyrimo metodai, pagrįsti rodiklių sistemos naudojimu, Su kuriuo matuojamas kitimas.

Variacijų tyrimas yra būtinas. Variacijų matavimas yra būtinas atliekant imties stebėjimą, koreliacinę ir dispersinę analizę ir kt. Ermolajevas O. Yu. Matematinė statistika psichologams: vadovėlis [Tekstas] / O.Yu. Ermolajevas. - M.: Maskvos psichologinio ir socialinio instituto leidykla "Flint", 2012. - 335p.

Pagal variacijos laipsnį galima spręsti apie populiacijos homogeniškumą, individualių požymių verčių stabilumą ir vidurkio tipiškumą. Jų pagrindu kuriami ženklų ryšio glaudumo rodikliai, atrankinio stebėjimo tikslumo vertinimo rodikliai.

Yra skirtumų erdvėje ir laike.

Erdvės kitimas suprantamas kaip ypatybės reikšmių svyravimai atskiroms teritorijoms atstovaujančių gyventojų vienetuose. Laiko pokytis reiškia atributo reikšmių pasikeitimą skirtingais laikotarpiais.

Norint ištirti pasiskirstymo serijos kitimą, visi atributų reikšmių variantai yra išdėstyti didėjančia arba mažėjančia tvarka. Šis procesas vadinamas serijų reitingavimu.

Paprasčiausi variacijos ženklai yra minimalus ir maksimalus- mažiausia ir didžiausia atributo reikšmė visumoje. Atskirų savybių reikšmių variantų pasikartojimų skaičius vadinamas pasikartojimo dažniu (fi). Patogu dažnius pakeisti dažniais – wi. Dažnis – santykinis dažnio rodiklis, kuris gali būti išreikštas vieneto dalimis arba procentais ir leidžia palyginti variacijų eilutes su skirtingu stebėjimų skaičiumi. Išreiškiama formule:

kur Xmax, Xmin - didžiausios ir minimalios atributo reikšmės suvestinėje; n yra grupių skaičius.

Požymio kitimui matuoti naudojami įvairūs absoliutūs ir santykiniai rodikliai. Absoliutūs kitimo rodikliai apima variacijos diapazoną, vidutinį tiesinį nuokrypį, dispersiją, standartinį nuokrypį. Santykiniai svyravimo rodikliai apima svyravimo koeficientą, santykinį tiesinį nuokrypį, variacijos koeficientą.

Variacijų serijos radimo pavyzdys

Pratimas.Šiam pavyzdžiui:

  • a) Raskite variacijų eilutę;
  • b) Sukonstruoti paskirstymo funkciją;

Nr.=42. Elementų pavyzdžiai:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Sprendimas.

  • a) reitinguotos variacijų serijos sudarymas:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) diskrečiųjų variacijų serijos konstravimas.

Apskaičiuokime grupių skaičių variacijų serijoje naudodami Sturgess formulę:

Paimkime grupių skaičių, lygų 7.

Žinodami grupių skaičių, apskaičiuojame intervalo reikšmę:

Lentelės sudarymo patogumui paimsime grupių skaičių, lygų 8, intervalas bus 1.

Ryžiai. vienas Parduotuvės prekių pardavimo apimtis tam tikrą laikotarpį

Grupavimo metodas taip pat leidžia išmatuoti variacijaženklų (kintamumas, svyravimas). Esant santykinai nedideliam populiacijos vienetų skaičiui, svyravimai matuojami remiantis reitinguota populiaciją sudarančių vienetų seka. Eilė vadinama reitinguojami jei vienetai išdėstyti didėjančia (mažėjančia) ypatybe.

Tačiau reitinguotos eilutės yra gana orientacinės, kai reikia lyginamosios variacijos charakteristikos. Be to, daugeliu atvejų tenka susidurti su statistiniais suvestiniais rodikliais, susidedančiais iš daugybės vienetų, kuriuos praktiškai sunku pateikti konkrečios eilutės forma. Atsižvelgiant į tai, pirminiam bendram susipažinimui su statistiniais duomenimis ir ypač palengvinti ženklų kitimo tyrimą, tiriami reiškiniai ir procesai dažniausiai sujungiami į grupes, o grupavimo rezultatai sudaromi grupinių lentelių pavidalu. .

Jei grupių lentelėje yra tik du stulpeliai - grupės pagal pasirinktą požymį (parinktys) ir grupių skaičių (dažniai arba dažniai), ji vadinama netoli platinimo.

Paskirstymo diapazonas - Paprasčiausias struktūrinio grupavimo pagal vieną požymį tipas, rodomas grupių lentelėje su dviem stulpeliais, kuriuose pateikiami atributo variantai ir dažniai. Daugeliu atvejų su tokiu struktūriniu grupavimu, t.y. su pasiskirstymo eilučių sudarymu pradedamas pradinės statistinės medžiagos tyrimas.

Struktūrinis grupavimas pasiskirstymo eilutės forma gali būti paverstas tikru struktūriniu grupavimu, jei pasirinktos grupės pasižymi ne tik dažniais, bet ir kitais statistiniais rodikliais. Pagrindinis paskirstymo serijų tikslas yra ištirti savybių kitimą. Paskirstymo eilučių teoriją detaliai išplėtoja matematinė statistika.

Paskirstymo serijos skirstomos į atributinis(grupavimas pagal atributines savybes, pavyzdžiui, gyventojų pasiskirstymas pagal lytį, tautybę, šeimyninę padėtį ir kt.) ir variacinis(grupavimas pagal kiekybines charakteristikas).

Variacijų serija yra grupinė lentelė, kurioje yra du stulpeliai: vienetų grupavimas pagal vieną kiekybinį požymį ir vienetų skaičių kiekvienoje grupėje. Variacijų eilučių intervalai dažniausiai sudaromi lygūs ir uždari. Variacijų eilutė yra tokia Rusijos gyventojų grupuotė pagal vidutines grynųjų pinigų pajamas vienam gyventojui (3.10 lentelė).

3.10 lentelė

Rusijos gyventojų pasiskirstymas pagal vidutines pajamas vienam gyventojui 2004-2009 m

Gyventojų grupės pagal vidutines grynųjų pinigų pajamas vienam gyventojui, rub./mėn

Gyventojų skaičius grupėje, % nuo bendro skaičiaus

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Daugiau nei 25 000,0

Visi gyventojai

Variacinės serijos savo ruožtu skirstomos į diskrečiąsias ir intervalines. Diskretus variacijų serija sujungia atskirų savybių variantus, kurie skiriasi siauromis ribomis. Diskrečių variacijų serijos pavyzdys yra rusų šeimų pasiskirstymas pagal jų turimų vaikų skaičių.

Intervalas variacinės serijos sujungia arba ištisinių, arba atskirų savybių variantus, kurie keičiasi plačiu diapazonu. Intervalų eilutė yra Rusijos gyventojų pasiskirstymo pagal vidutines grynųjų pinigų pajamas vienam gyventojui variacinė eilutė.

Atskiros variacijų serijos praktikoje nenaudojamos labai dažnai. Tuo tarpu juos sudaryti nėra sunku, nes grupių sudėtį lemia konkretūs variantai, kuriuos iš tikrųjų turi tiriamos grupavimo charakteristikos.

Intervalinės variacijos serijos yra labiau paplitusios. Sudarant juos, kyla sunkus klausimas dėl grupių skaičiaus, taip pat dėl ​​intervalų, kuriuos reikėtų nustatyti, dydžio.

Šio klausimo sprendimo principai išdėstyti skyriuje apie statistinių grupių sudarymo metodiką (žr. 3.3 pastraipą).

Variacijų serijos – tai priemonė įvairiai informacijai sutraukti arba suspausti į kompaktišką formą, jomis galima gana aiškiai nuspręsti apie variacijos pobūdį, tirti į tiriamą rinkinį įtrauktų reiškinių požymių skirtumus. Tačiau svarbiausia variacinių eilučių reikšmė yra ta, kad jų pagrindu apskaičiuojamos specialiosios variacijos apibendrinančios charakteristikos (žr. 7 skyrių).

  • įvadinė pamoka nemokamai;
  • Daug patyrusių mokytojų (gimtoji ir rusakalbių);
  • Kursai NE konkrečiam laikotarpiui (mėnesiui, šešiems mėnesiams, metams), o tam tikram pamokų skaičiui (5, 10, 20, 50);
  • Daugiau nei 10 000 patenkintų klientų.
  • Vienos pamokos su rusakalbiu mokytoju kaina - nuo 600 rublių, su gimtąja kalba - nuo 1500 rublių

Variacijų serijos koncepcija. Pirmas žingsnis sisteminant statistinio stebėjimo medžiagą yra vienetų, turinčių vieną ar kitą požymį, skaičiavimas. Išdėlioję vienetus jų kiekybinio požymio didėjimo arba mažėjimo tvarka ir suskaičiavę vienetų su konkrečia požymio reikšme skaičių, gauname variacijų eilutę. Variacijų eilutė apibūdina tam tikros statistinės visumos vienetų pasiskirstymą pagal kokį nors kiekybinį požymį.

Variacijų seriją sudaro du stulpeliai, kairiajame stulpelyje yra kintamojo atributo reikšmės, vadinamos variantais ir žymimos (x), o dešiniajame stulpelyje yra absoliutūs skaičiai, rodantys, kiek kartų kiekvienas variantas pasitaiko. Šio stulpelio reikšmės vadinamos dažniais ir žymimos (f).

Schematiškai variacijų seriją galima pavaizduoti 5.1 lentelės forma:

5.1 lentelė

Variacijų serijos tipas

Parinktys (x)

Dažniai (f)

Dešiniajame stulpelyje taip pat gali būti naudojami santykiniai rodikliai, apibūdinantys atskirų variantų dažnio proporciją bendrame dažnių kiekyje. Šie santykiniai rodikliai vadinami dažniais ir sutartinai žymimi , t.y. . Visų dažnių suma lygi vienetui. Dažnius galima išreikšti ir procentais, tada jų suma bus lygi 100%.

Kintamieji ženklai gali būti skirtingo pobūdžio. Kai kurių ženklų variantai išreiškiami sveikaisiais skaičiais, pavyzdžiui, kambarių skaičius bute, išleistų knygų skaičius ir kt. Šie ženklai vadinami nenutrūkstamais arba atskirais. Kitų charakteristikų variantai gali įgyti bet kokias reikšmes tam tikrose ribose, pavyzdžiui, įgyvendinant suplanuotus tikslus, darbo užmokestis tt Šie ženklai vadinami tęstiniais.

Diskretinė variacijų serija. Jeigu variacinių eilučių variantai išreiškiami kaip diskretūs kiekiai, tada tokia variacijų serija vadinama diskretine, jos išvaizda pateikta lentelėje. 5.2:

5.2 lentelė

Mokinių pasiskirstymas pagal egzamine gautus pažymius

Įvertinimai (x)

Studentų skaičius (f)

% viso ()

Diskrečiųjų serijų skirstinio pobūdis grafiškai pavaizduotas kaip skirstinio daugiakampis, 5.1 pav.

Ryžiai. 5.1. Mokinių pasiskirstymas pagal egzamine gautus pažymius.

Intervalinių variacijų serija. Ištisinėms savybėms variacijų eilutės konstruojamos kaip intervalinės eilutės, t.y. ypatybių reikšmės jose išreiškiamos intervalais „nuo ir iki“. Tokiu atveju minimali tokio intervalo požymio reikšmė vadinama apatine intervalo riba, o didžiausia – viršutine intervalo riba.

Intervalinės variacijos serijos sukurtos tiek nepertraukiamoms funkcijoms (diskretiesiems), tiek toms, kurios skiriasi dideliame diapazone. Intervalinės eilutės gali būti su vienodais ir nevienodais intervalais. Ekonominėje praktikoje dažniausiai naudojami nevienodi intervalai, palaipsniui didėjantys arba mažėjantys. Toks poreikis ypač iškyla tais atvejais, kai ženklo svyravimas atliekamas netolygiai ir didelėse ribose.

Apsvarstykite formą intervalo serija vienodais intervalais, tab. 5.3:

5.3 lentelė

Darbuotojų pasiskirstymas pagal produkciją

Išvestis, tr. (X)

Darbuotojų skaičius (f)

Kaupiamasis dažnis (f')

Intervalų pasiskirstymo serija grafiškai pavaizduota kaip histograma, 5.2 pav.

5.2 pav. Darbuotojų pasiskirstymas pagal produkciją

Kaupiamasis (kaupiamasis) dažnis. Praktiškai reikia konvertuoti paskirstymo serijas į kaupiamos eilutės, pastatytas ant sukauptų dažnių. Jie gali būti naudojami nustatant struktūrinius vidurkius, kurie palengvina pasiskirstymo eilučių duomenų analizę.

Suminiai dažniai nustatomi nuosekliai pridedant prie pirmosios šių rodiklių grupės dažnių (ar dažnių) paskesnių pasiskirstymo eilučių grupių. Paskirstymo serijoms iliustruoti naudojami kumuliacijos ir ogives. Norint juos sukurti, abscisių ašyje pažymimos diskrečiojo požymio reikšmės (arba intervalų galai), o ordinačių ašyje – augančios dažnių sumos (kumuliacija), 5.3 pav.

Ryžiai. 5.3. Kaupiamasis darbuotojų pasiskirstymas pagal raidą

Jei dažnių ir variantų skalės sukeistos, t.y. atspindi sukauptus dažnius abscisių ašyje, o parinkčių reikšmes – ordinačių ašyje, tada kreivė, apibūdinanti dažnių kitimą iš grupės į grupę, bus vadinama pasiskirstymo rodikliu, 5.4 pav.

Ryžiai. 5.4. Ogiva darbininkų paskirstymas gamybai

Variacijų eilutės vienodais intervalais pateikia vieną iš svarbiausių statistinių skirstinių eilučių reikalavimų, užtikrinančių jų palyginamumą laike ir erdvėje.

Pasiskirstymo tankis. Tačiau atskirų nevienodų intervalų dažniai šiose serijose nėra tiesiogiai palyginami. Tokiais atvejais, siekiant užtikrinti reikiamą palyginamumą, apskaičiuojamas pasiskirstymo tankis, t.y. nustatyti, kiek vienetų kiekvienoje grupėje tenka intervalo vertės vienetui.

Sudarant variacinių eilučių su nelygiais intervalais pasiskirstymo grafiką, stačiakampių aukštis nustatomas proporcingai ne dažniams, o tiriamo požymio reikšmių pasiskirstymo tankio rodikliams atitinkamuose intervaluose.

Variacijų eilučių sudarymas ir jos grafinis atvaizdavimas yra pirmasis žingsnis apdorojant pradinius duomenis ir pirmasis žingsnis tiriant populiaciją. Kitas variacinių eilučių analizės žingsnis yra pagrindinių apibendrinančių rodiklių, vadinamų eilučių charakteristikomis, nustatymas. Šios charakteristikos turėtų suteikti supratimą apie vidutinę atributo reikšmę populiacijos vienetais.

Vidutinė vertė. Vidutinė reikšmė yra apibendrinta tiriamojo požymio charakteristika tirtoje populiacijoje, atspindinti jo tipinį lygį populiacijos vienetui konkrečiomis vietos ir laiko sąlygomis.

Vidutinė reikšmė visada įvardijama, turi tą patį matmenį kaip ir atskirų populiacijos vienetų požymis.

Prieš skaičiuojant vidutines reikšmes, reikia sugrupuoti tiriamos populiacijos vienetus, išskiriant kokybiškai vienarūšes grupes.

Vidurkis, apskaičiuotas visai populiacijai, vadinamas bendruoju vidurkiu, o kiekvienai grupei - grupės vidurkiais.

Yra dviejų tipų vidurkiai: galia (aritmetinis vidurkis, harmoninis vidurkis, geometrinis vidurkis, šaknies vidurkis kvadratinis); struktūrinis (modas, mediana, kvartiliai, deciliai).

Skaičiavimo vidurkio pasirinkimas priklauso nuo tikslo.

Galios vidurkių tipai ir jų skaičiavimo metodai. Surinktos medžiagos statistinio apdorojimo praktikoje iškyla įvairių problemų, kurių sprendimui reikalingi skirtingi vidurkiai.

Matematinė statistika iš galios vidurkio formulių išveda įvairias priemones:

kur yra vidutinė vertė; x - atskiros parinktys (funkcijų reikšmės); z – eksponentas (esant z = 1 – aritmetinis vidurkis, z = 0 geometrinis vidurkis, z = – 1 – harmoninis vidurkis, z = 2 – vidutinis kvadratinis).

Tačiau klausimas, koks vidurkis turėtų būti taikomas kiekvienu konkrečiu atveju, išsprendžiamas konkreti analizė tirta populiacija.

Dažniausias statistikos vidurkio tipas yra aritmetinis vidurkis. Jis apskaičiuojamas tais atvejais, kai suvidurkinto požymio tūris sudaromas kaip atskirų tiriamos statistinės visumos vienetų jo verčių suma.

Priklausomai nuo pradinių duomenų pobūdžio, aritmetinis vidurkis nustatomas įvairiais būdais:

Jei duomenys nesugrupuoti, tada skaičiavimas atliekamas pagal paprastos vidutinės vertės formulę

Aritmetinio vidurkio apskaičiavimas diskrečioje eilutėje vyksta pagal formulę 3.4.

Aritmetinio vidurkio skaičiavimas intervalų eilutėje. Intervalo variacijų serijoje, kai intervalo vidurys sąlyginai laikomas kiekvienos grupės požymio reikšme, aritmetinis vidurkis gali skirtis nuo vidurkio, apskaičiuoto pagal nesugrupuotus duomenis. Be to, kuo didesnis intervalas grupėse, tuo daugiau galimi nukrypimai vidurkis, apskaičiuotas iš sugrupuotų duomenų, iš vidurkio, apskaičiuoto iš nesugrupuotų duomenų.

Skaičiuojant intervalų variacijų eilučių vidurkį, norint atlikti reikiamus skaičiavimus, nuo intervalų pereinama prie jų vidurio taškų. Tada apskaičiuokite vidutinę vertę pagal aritmetinio svertinio vidurkio formulę.

Aritmetinio vidurkio savybės. Aritmetinis vidurkis turi tam tikrų savybių, leidžiančių supaprastinti skaičiavimus, apsvarstykime jas.

1. Pastoviųjų skaičių aritmetinis vidurkis yra lygus šiam pastoviam skaičiui.

Jei x = a. Tada .

2. Jei proporcingai keičiami visų variantų svoriai, t.y. padidėti arba mažėti tiek pat kartų, tada naujosios eilutės aritmetinis vidurkis nuo to nepasikeis.

Jei visi svoriai f sumažinami k kartų, tada .

3. Atskirų opcionų teigiamų ir neigiamų nuokrypių nuo vidurkio suma, padauginta iš svorių, lygi nuliui, t.y.

Jei tada . Iš čia.

Jei visi variantai sumažinami arba padidinami kokiu nors skaičiumi, tai naujos serijos aritmetinis vidurkis sumažės arba padidės tiek pat.

Sumažinkite visas galimybes x ant a, t.y. x´ = xa.

Tada

Pradinės serijos aritmetinį vidurkį galima gauti prie sumažinto vidurkio pridėjus skaičių, anksčiau atimtą iš variantų a, t.y. .

5. Jei visos parinktys sumažinamos arba padidinamos k kartų, tuomet naujosios eilutės aritmetinis vidurkis sumažės arba padidės tiek pat, t.y. in k kartą.

Leisk tada .

Vadinasi, t.y. norint gauti pradinės serijos vidurkį, naujos serijos (su sumažintomis parinktimis) aritmetinis vidurkis turi būti padidintas k kartą.

Vidutinė harmonika. Harmoninis vidurkis yra aritmetinio vidurkio atvirkštinis dydis. Jis naudojamas, kai statistinėje informacijoje nėra atskirų populiacijos variantų dažnių, o pateikiama kaip jų sandauga (M = xf). Harmoninis vidurkis bus apskaičiuojamas pagal 3.5 formulę

Praktinis harmoninio vidurkio pritaikymas yra apskaičiuoti kai kuriuos indeksus, ypač kainų indeksą.

Geometrinis vidurkis. Taikant geometrinį vidurkį, individualios atributo reikšmės, kaip taisyklė, yra santykinės dinamikos vertės, sudarytos grandinės verčių pavidalu, kaip santykis su ankstesniu kiekvieno lygio dinamikos serijoje lygiu. . Taigi vidurkis apibūdina vidutinį augimo tempą.

Geometrinis vidurkis taip pat naudojamas norint nustatyti vienodo atstumo reikšmę nuo didžiausios ir mažiausios atributo reikšmių. Pavyzdžiui, draudimo bendrovė sudaro sutartis dėl automobilių draudimo paslaugų teikimo. Priklausomai nuo konkretaus draudžiamojo įvykio, draudimo įmoka gali svyruoti nuo 10 000 iki 100 000 USD per metus. Vidutinė draudimo išmoka yra USD.

Geometrinis vidurkis – tai reikšmė, naudojama kaip santykių vidurkis arba skirstinio eilutėje, pateikiama kaip geometrinė progresija, kai z = 0. Šį vidurkį patogu naudoti, kai atkreipiamas dėmesys ne į absoliučius skirtumus, o į santykį. du skaičiai.

Skaičiavimo formulės yra tokios

kur yra vidutinės savybės variantai; - opcionų produktas; f– pasirinkimų dažnumas.

Apskaičiuojant vidutinius metinius augimo tempus, naudojamas geometrinis vidurkis.

Vidutinis kvadratas. Vidutinio kvadrato formulė naudojama atskirų bruožo verčių svyravimo laipsniui aplink aritmetinį vidurkį paskirstymo eilutėje išmatuoti. Taigi, skaičiuojant variacijos rodiklius, vidurkis apskaičiuojamas iš atskirų požymio verčių nuokrypių nuo aritmetinio vidurkio kvadratų.

Vidutinė kvadrato vertė apskaičiuojama pagal formulę

Ekonominiuose tyrimuose, skaičiuojant požymio kitimo rodiklius, tokius kaip dispersija, standartinis nuokrypis, plačiai naudojama modifikuota vidutinio kvadrato forma.

Daugumos taisyklė. Tarp galios dėsnio vidurkių yra toks ryšys – kuo didesnis eksponentas, tuo didesnė vidurkio reikšmė, 5.4 lentelė:

5.4 lentelė

Ryšys tarp vidurkių

z reikšmė

Santykis tarp vidurkių

Šis santykis vadinamas didvyriškumo taisykle.

Struktūriniai vidurkiai. Gyventojų struktūrai apibūdinti naudojami specialūs rodikliai, kuriuos galima pavadinti struktūriniais vidurkiais. Šios priemonės apima režimą, medianą, kvartilius ir decilius.

Mada. Režimas (Mo) yra dažniausiai pasitaikanti ypatybės reikšmė populiacijos vienetuose. Režimas – tai atributo reikšmė, atitinkanti maksimalų teorinio pasiskirstymo kreivės tašką.

Mada plačiai naudojama komercinėje praktikoje tiriant vartotojų paklausą (nustatant itin paklausių drabužių ir avalynės dydžius), kainų registravimą. Iš viso gali būti keletas modifikacijų.

Režimo skaičiavimas diskrečioje serijoje. Atskiros serijos režimas yra didžiausio dažnio variantas. Apsvarstykite galimybę rasti režimą atskiroje serijoje.

Mados skaičiavimas intervalinėje serijoje. Intervalo variacijų serijoje centrinis modalinio intervalo variantas apytiksliai laikomas režimu, t.y. intervalas, kurio dažnis yra didžiausias (dažnis). Intervale reikia rasti atributo reikšmę, kuri yra režimas. Intervalų serijoms režimas bus nustatytas pagal formulę

kur yra apatinė modalinio intervalo riba; yra modalinio intervalo reikšmė; yra modalinį intervalą atitinkantis dažnis; yra dažnis prieš modalinį intervalą; yra intervalo po modalo dažnis.

Mediana. Vidutinė () yra ypatybės reikšmė reitinguotos serijos viduriniame vienete. Reitinguota serija yra serija, kurioje būdingos reikšmės rašomos didėjančia arba mažėjančia tvarka. Arba mediana yra reikšmė, padalijanti tvarkingų variacijų serijų skaičių į dvi lygias dalis: vienos dalies kintamojo požymio reikšmė yra mažesnė už vidutinį variantą, o kita – didelė.

Norint rasti medianą, pirmiausia nustatomas jos serijos numeris. Norėdami tai padaryti, su nelyginiu vienetų skaičiumi prie visų dažnių sumos pridedamas vienas ir viskas dalijama iš dviejų. Esant lyginiam vienetų skaičiui, mediana randama kaip vieneto požymio reikšmė, kurios eilės numeris nustatomas bendra dažnių suma, padalyta iš dviejų. Žinant medianos eilės skaičių, iš sukauptų dažnių nesunku rasti jo reikšmę.

Medianos apskaičiavimas diskrečioje eilutėje. Atrankinės apklausos duomenimis, gauti duomenys apie šeimų pasiskirstymą pagal vaikų skaičių, lentelė. 5.5. Norėdami nustatyti medianą, pirmiausia nustatykite jos eilės skaičių

=

Tada sukuriame sukauptų dažnių seriją (, by serijos numeris o sukaupto dažnio randame medianą. Sukauptas dažnis 33 rodo, kad 33 šeimose vaikų skaičius neviršija 1 vaiko, tačiau kadangi mediana yra 50, tai mediana svyruos nuo 34 iki 55 šeimų.

5.5 lentelė

Šeimų skaičiaus pasiskirstymas nuo vaikų skaičiaus

Vaikų skaičius šeimoje

Šeimų skaičius yra vidutinio intervalo reikšmė;

Visos nagrinėjamos galios vidurkio formos turi svarbią savybę (priešingai nei struktūrinės priemonės) – vidurkio nustatymo formulė apima visas eilės reikšmes, t.y. vidurkio dydį įtakoja kiekvieno pasirinkimo vertė.

Viena vertus, tai labai teigiama savybė. šiuo atveju atsižvelgiama į visų priežasčių, veikiančių visus tiriamos populiacijos vienetus, poveikį. Kita vertus, net vienas pastebėjimas, atsitiktinai įtrauktas į pradinius duomenis, gali gerokai iškreipti idėją apie tiriamo požymio išsivystymo lygį nagrinėjamoje populiacijoje (ypač trumpose serijose).

Kvartiliai ir deciliai. Analogiškai su medianos nustatymu variacinėse eilutėse galima rasti ypatybės vertę bet kuriame eilės eilės eilės eilės vienete. Taigi, visų pirma, galima rasti elemento reikšmę vienetams, padalijantiems seriją į 4 lygias dalis, į 10 ir pan.

Kvartiliai. Variantai, padalijantys reitinguotą seriją į keturias lygias dalis, vadinami kvartiliais.

Tuo pačiu metu išskiriami: apatinis (arba pirmasis) kvartilis (Q1) - požymio reikšmė reitinguotos serijos vienete, padalijant populiaciją santykiu nuo ¼ iki ¾ ir viršutinė (arba trečioji). ) kvartilis (Q3) – ypatybės reikšmė reitinguotos serijos vienete, padalijant populiaciją santykiu nuo ¾ iki ¼.

Antrasis kvartilis yra mediana Q2 = Me. Apatinis ir viršutinis kvartiliai intervalų eilutėse apskaičiuojami naudojant formulę, panašią į medianą.

kur yra apatinė intervalo riba, kurioje yra atitinkamai apatinis ir viršutinis kvartiliai;

yra kaupiamasis intervalo dažnis prieš intervalą, kuriame yra apatinis arba viršutinis kvartilis;

- kvartilių intervalų dažniai (apatiniai ir viršutiniai)

Intervalai, kuriuose yra Q1 ir Q3, nustatomi pagal sukauptus dažnius (arba dažnius).

Deciliai. Be kvartilių, skaičiuojami deciliai – variantai, kurie reitinguojamą seriją padalija į 10 lygių dalių.

Jie žymimi D, pirmasis decilis D1 padalija eilutes santykiu 1/10 ir 9/10, antrasis D2 - 2/10 ir 8/10 ir kt. Jie apskaičiuojami taip pat, kaip mediana ir kvartiliai.

Tiek mediana, tiek kvartiliai, tiek deciliai priklauso vadinamajai eilės statistikai, kuri suprantama kaip variantas, užimantis tam tikrą eilės vietą reitinguotoje eilutėje.

Apdorojant didelius informacijos kiekius, o tai ypač svarbu vykdant šiuolaikinius mokslo pokyčius, tyrėjas susiduria su rimta užduotimi teisingai sugrupuoti pradinius duomenis. Jei duomenys yra diskretiški, tada, kaip matėme, problemų nėra – tereikia paskaičiuoti kiekvienos funkcijos dažnumą. Jei tiriamas bruožas turi tęstinis simbolis (kas praktikoje yra labiau paplitęs), tada optimalaus intervalų skaičiaus pasirinkimas bruožui grupuoti jokiu būdu nėra trivialus uždavinys.

Norint sugrupuoti ištisinius atsitiktinius dydžius, visas funkcijos variacijų diapazonas yra padalintas į tam tikrą intervalų skaičių į.

Grupuotas intervalas (tęstinis) variacinė serija vadinami intervalais, surikiuotais pagal ypatybės reikšmę (), kur nurodomas kartu su atitinkamais dažniais () stebėjimų, kurie pateko į r-ąjį intervalą, skaičius arba santykiniai dažniai ():

Charakteristikos reikšmių intervalai

mi dažnis

Juostinė diagrama ir kauptis (ogiva), jau išsamiai aptarėme, yra puikus duomenų vizualizavimo įrankis, leidžiantis iš pradžių suprasti duomenų struktūrą. Tokie grafikai (1.15 pav.) nuolatiniams duomenims sudaromi taip pat, kaip ir diskretiesiems, tik atsižvelgiant į tai, kad nuolatiniai duomenys visiškai užpildo galimų reikšmių sritį, imant bet kokias reikšmes.

Ryžiai. 1.15.

Štai kodėl histogramos ir kumuliacijos stulpeliai turi liestis, neturi būti sričių, kuriose atributų reikšmės nepatenka į visas įmanomas(t. y. histogramoje ir kumuliacijoje išilgai abscisių ašies neturėtų būti „skylių“, kuriose tiriamo kintamojo reikšmės nepatenka, kaip parodyta 1.16 pav.). Juostos aukštis atitinka dažnį – stebėjimų, patenkančių į duotą intervalą, skaičių arba santykinį dažnį – stebėjimų proporciją. Intervalai neturi kirsti ir paprastai yra vienodo pločio.

Ryžiai. 1.16.

Histograma ir daugiakampis yra tikimybės tankio kreivės aproksimacijos (diferencinė funkcija) f(x) teorinis skirstinys, svarstomas tikimybių teorijos eigoje. Todėl jų konstrukcija yra tokia svarbi pirminiame statistiniame kiekybinių tęstinių duomenų apdorojime – pagal jų formą galima spręsti apie hipotetinį pasiskirstymo dėsnį.

Cumulate – intervalų variacijų eilučių sukauptų dažnių (dažnių) kreivė. Integralinio skirstinio funkcijos grafikas lyginamas su kumuliacija F(x), taip pat svarstoma tikimybių teorijos eigoje.

Iš esmės histogramos ir kumuliacijos sąvokos yra tiksliai susietos su ištisiniais duomenimis ir jų intervalų variacijų eilutėmis, nes jų grafikai yra atitinkamai tikimybių tankio funkcijos ir pasiskirstymo funkcijos empiriniai įverčiai.

Intervalų variacijų serijos konstravimas prasideda nuo intervalų skaičiaus nustatymo k. Ir ši užduotis yra bene sunkiausia, svarbiausia ir prieštaringiausia nagrinėjamu klausimu.

Intervalų skaičius neturėtų būti per mažas, nes histograma bus per lygi ( perlygintas), praranda visas pradinių duomenų kintamumo ypatybes – pav. 1.17 matote, kaip tie patys duomenys, ant kurių pateikiami grafikai pav. 1.15 naudojami histogramai su mažesniu intervalų skaičiumi sudaryti (kairysis grafikas).

Tuo pačiu metu intervalų skaičius neturėtų būti per didelis - kitaip negalėsime įvertinti tiriamų duomenų pasiskirstymo tankio pagal skaitinę ašį: histograma pasirodys nepakankamai išlyginta. (išlygintas) su neužpildytais intervalais, nelygios (žr. 1.17 pav., dešinysis grafikas).

Ryžiai. 1.17.

Kaip nustatyti labiausiai pageidaujamą intervalų skaičių?

Dar 1926 m. Herbertas Sturgesas pasiūlė formulę, kaip apskaičiuoti intervalų, į kuriuos reikia padalyti pradinį tiriamo požymio reikšmių rinkinį, skaičių. Ši formulė tikrai tapo itin populiari – dauguma statistikos vadovėlių ją siūlo, o daugelis statistikos paketų ją naudoja pagal nutylėjimą. Ar tai pagrįsta ir visais atvejais – labai rimtas klausimas.

Taigi, kuo remiasi Sturges formulė?

Apsvarstykite binominis skirstinys }