Kaip rasti matematinį dvejetainio skirstinio lūkestį. Diskretaus atsitiktinio dydžio dvinario skirstinys

Apsvarstykite binominį skirstinį, apskaičiuokite jo matematinį lūkestį, dispersiją, režimą. Naudodamiesi MS EXCEL funkcija BINOM.DIST(), pavaizduosime pasiskirstymo funkcijos ir tikimybių tankio grafikus. Įvertinkime skirstinio parametrą p, matematinį skirstinio lūkestį ir standartinį nuokrypį. Taip pat apsvarstykite Bernoulli skirstymą.

Apibrėžimas. Tegul jie būna laikomi n testai, kurių kiekviename gali įvykti tik 2 įvykiai: įvykis „sėkmė“ su tikimybe p arba įvykis „nesėkmė“ su tikimybe q =1-p (vadinamoji Bernulio schema,Bernulisišbandymai).

Tikimybė gauti tiksliai x sėkmės šiuose n testai yra lygūs:

Sėkmių skaičius imtyje x yra atsitiktinis kintamasis, kuris turi Binominis skirstinys(Anglų) Dvejetainėpaskirstymas) p Ir n yra šio skirstinio parametrai.

Prisiminkite tai, kad galėtumėte kreiptis Bernulli schemos ir atitinkamai binominis skirstinys, turi būti įvykdytos šios sąlygos:

  • kiekvienas bandymas turi turėti lygiai du rezultatus, sąlygiškai vadinamus „sėkme“ ir „nesėkmė“.
  • kiekvieno testo rezultatas neturėtų priklausyti nuo ankstesnių testų rezultatų (testo nepriklausomumas).
  • sėkmės rodiklis p turėtų būti pastovus visiems bandymams.

Dvejetainis skirstinys MS EXCEL

MS EXCEL, pradedant nuo 2010 m. versijos, skirta yra funkcija BINOM.DIST() , Angliškas pavadinimas- BINOM.DIST(), kuri leidžia apskaičiuoti tikimybę, kad imtis bus tiksliai X„sėkmės“ (t. y. tikimybės tankio funkcija p(x), žr. formulę aukščiau) ir integrali paskirstymo funkcija(tikimybė, kad mėginys turės x arba mažiau „sėkmių“, įskaitant 0).

Prieš MS EXCEL 2010, EXCEL turėjo funkciją BINOMDIST(), kuri taip pat leidžia apskaičiuoti paskirstymo funkcija Ir tikimybių tankis p(x). BINOMDIST() paliekamas MS EXCEL 2010 suderinamumui.

Pavyzdiniame faile yra grafikai tikimybių pasiskirstymo tankis Ir .

Binominis skirstinys turi pavadinimą B (n ; p) .

Pastaba: Statybai integrali paskirstymo funkcija idealiai tinka diagramos tipas Tvarkaraštis, Dėl pasiskirstymo tankisHistograma su grupavimu. Norėdami gauti daugiau informacijos apie diagramų sudarymą, skaitykite straipsnį Pagrindiniai diagramų tipai.

Pastaba: Formulių rašymo pavyzdiniame faile patogumui sukurti parametrų pavadinimai Binominis skirstinys: n ir p.

Pavyzdiniame faile rodomi įvairūs tikimybių skaičiavimai naudojant MS EXCEL funkcijas:

Kaip matyti aukščiau esančiame paveikslėlyje, daroma prielaida, kad:

  • Begalinėje populiacijoje, iš kurios sudaryta imtis, yra 10 % (arba 0,1) gerųjų elementų (parametras p, trečiosios funkcijos argumentas = BINOM.DIST() )
  • Apskaičiuoti tikimybę, kad 10 elementų imtyje (parametras n, antrasis funkcijos argumentas) bus lygiai 5 galiojantys elementai (pirmasis argumentas), reikia parašyti formulę: =BINOM.SKIRSTYMAS(5, 10, 0,1, NETEISINGA)
  • Paskutinis, ketvirtas elementas nustatytas = FALSE, t.y. grąžinama funkcijos reikšmė pasiskirstymo tankis .

Jei ketvirtojo argumento reikšmė = TRUE, tada funkcija BINOM.DIST() grąžina reikšmę integrali paskirstymo funkcija arba tiesiog paskirstymo funkcija. Tokiu atveju galite apskaičiuoti tikimybę, kad gerų prekių skaičius imtyje bus iš tam tikro diapazono, pavyzdžiui, 2 ar mažiau (įskaitant 0).

Norėdami tai padaryti, parašykite formulę: = BINOM.SKIRSTYMAS(2, 10, 0,1, TRUE)

Pastaba: Jei x reikšmė nėra sveikoji, . Pavyzdžiui, šios formulės grąžins tą pačią reikšmę: =BINOM.DIST( 2 ; 10; 0,1; TIESA)=BINOM.DIST( 2,9 ; 10; 0,1; TIESA)

Pastaba: Pavyzdiniame faile tikimybių tankis Ir paskirstymo funkcija taip pat apskaičiuojamas naudojant apibrėžimą ir COMBIN() funkciją.

Paskirstymo rodikliai

IN pavyzdinis failas lape Pavyzdys yra formulės kai kuriems pasiskirstymo rodikliams apskaičiuoti:

  • =n*p;
  • (standartinis nuokrypis kvadratu) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*ŠAKNYS(n*p*(1-p)).

Išvedame formulę matematinis lūkestisBinominis skirstinys naudojant Bernulli schema .

Pagal apibrėžimą atsitiktinis kintamasis X in Bernulli schema(Bernulio atsitiktinis kintamasis) turi paskirstymo funkcija :

Šis paskirstymas vadinamas Bernulli paskirstymas .

Pastaba : Bernulli paskirstymas- ypatinga byla Binominis skirstinys su parametru n=1.

Sugeneruokime 3 masyvus iš 100 skaičių su skirtingomis sėkmės tikimybėmis: 0,1; 0,5 ir 0,9. Norėdami tai padaryti, lange Atsitiktinių skaičių generavimas kiekvienai tikimybei p nustatykite šiuos parametrus:

Pastaba: Jei nustatote parinktį Atsitiktinis išsibarstymas (Atsitiktinė sėkla), tada galite pasirinkti tam tikrą atsitiktinį sugeneruotų skaičių rinkinį. Pavyzdžiui, nustatę šią parinktį =25, skirtinguose kompiuteriuose galite sugeneruoti tuos pačius atsitiktinių skaičių rinkinius (jei, žinoma, kiti paskirstymo parametrai yra vienodi). Parinkties reikšmė gali būti sveikųjų skaičių nuo 1 iki 32 767. Parinkties pavadinimas Atsitiktinis išsibarstymas gali supainioti. Geriau būtų išversti kaip Nustatykite skaičių atsitiktiniais skaičiais .

Dėl to turėsime 3 stulpelius po 100 skaičių, pagal kuriuos, pavyzdžiui, galime įvertinti sėkmės tikimybę p pagal formulę: Sėkmių skaičius/100(cm. pavyzdinis failo lapas Bernoulli generavimas).

Pastaba: Dėl Bernulli skirstiniai kai p=0,5, galite naudoti formulę =RANDBETWEEN(0;1) , kuri atitinka .

Atsitiktinių skaičių generavimas. Binominis skirstinys

Tarkime, kad pavyzdyje yra 7 sugedusios prekės. Tai reiškia, kad „labai tikėtina“, kad nekokybiškų gaminių dalis pasikeitė. p, kuri būdinga mūsų gamybos procesui. Nors ši situacija yra „labai tikėtina“, yra galimybė (alfa rizika, 1 tipo klaida, „klaidingas pavojaus signalas“). p išliko nepakitęs, o padidėjusį nekokybiškų gaminių skaičių lėmė atsitiktinė atranka.

Kaip matyti toliau pateiktame paveikslėlyje, 7 yra sugedusių gaminių skaičius, priimtinas procesui, kurio p = 0,21 esant tokiai pat vertei Alfa. Tai iliustruoja, kad kada slenkstinė vertė pavyzdyje esantys gaminiai su defektais, p„tikriausiai“ padidėjo. Frazė „labiausiai tikėtina“ reiškia, kad yra tik 10% tikimybė (100%-90%), kad brokuotų gaminių procento nuokrypis virš slenksčio nulemtas tik atsitiktinių priežasčių.

Taigi slenksčio sugedusių gaminių skaičiaus pavyzdyje viršijimas gali būti signalas, kad procesas sutriko ir pradėjo gaminti b. O didesnis nekokybiškų gaminių procentas.

Pastaba: Prieš MS EXCEL 2010, EXCEL turėjo funkciją CRITBINOM() , kuri yra lygiavertė BINOM.INV() . CRITBINOM() paliekamas MS EXCEL 2010 ir naujesnėje versijoje, kad būtų suderinama.

Binominio skirstinio ryšys su kitais skirstiniais

Jei parametras nBinominis skirstinys linkęs į begalybę ir p linkęs į 0, tada šiuo atveju Binominis skirstinys galima apytiksliai. Galima suformuluoti sąlygas, kai aproksimacija Puasono pasiskirstymas veikia gerai:

  • p(kuo mažiau p ir dar n, tuo tikslesnis apytikslis nustatymas);
  • p >0,9 (atsižvelgiant į tai q =1- p, skaičiavimai šiuo atveju turi būti atliekami naudojant q(A X reikia pakeisti į n - x). Todėl kuo mažiau q ir dar n, tuo tikslesnis apytikslis nustatymas).

0.110 val Binominis skirstinys galima apytiksliai.

Savo ruožtu Binominis skirstinys gali būti geras apytikslis rodiklis, kai populiacijos dydis yra N Hipergeometrinis pasiskirstymas daug didesnis nei imties dydis n (t.y. N>>n arba n/N Plačiau apie minėtų skirstinių ryšį galite pasiskaityti straipsnyje. Ten pat pateikiami aproksimacijos pavyzdžiai, paaiškinamos sąlygos, kada tai įmanoma ir kokiu tikslumu.

PATARIMAS: Apie kitus MS EXCEL platinimus galite perskaityti straipsnyje.

- (binominis skirstinys) Paskirstymas, leidžiantis apskaičiuoti bet kurio pasiskirstymo tikimybę atsitiktinis įvykis, gautas stebint daugybę nepriklausomų įvykių, jei jį sudarančio elementoriaus atsiradimo tikimybė ... ... Ekonomikos žodynas

- (Bernoulli skirstinys) tam tikro įvykio pasikartojimų nepriklausomų bandymų skaičiaus pasiskirstymas, jei šio įvykio pasireiškimo tikimybė kiekviename bandyme yra lygi p(0 p 1). Tiksliai, skaičius? yra šio įvykio atvejų ...... Didysis enciklopedinis žodynas

binominis skirstinys- - Telekomunikacijų temos, pagrindinės sąvokos EN binominis skirstymas ...

- (Bernoulli skirstinys), kurio nors įvykio pasikartojimų nepriklausomų bandymų skaičiaus pasiskirstymas, jei šio įvykio pasireiškimo tikimybė kiekviename bandyme yra p (0≤p≤1). Būtent šio įvykio atvejų skaičius μ… … enciklopedinis žodynas

binominis skirstinys– 1,49. binominis skirstinys Diskretinio tikimybinis skirstinys atsitiktinis kintamasis X, kuri paima bet kokias sveikųjų skaičių reikšmes nuo 0 iki n, kad jei x = 0, 1, 2, ..., n ir parametrai n = 1, 2, ... ir 0< p < 1, где Источник … Norminės ir techninės dokumentacijos terminų žodynas-žinynas

Bernulli skirstinys, atsitiktinio dydžio X tikimybių pasiskirstymas, kuris atitinkamai paima sveikąsias reikšmes su tikimybėmis (binominis koeficientas; p parametras B. R., vadinamas teigiamo rezultato tikimybe, kuris paima reikšmes ... Matematinė enciklopedija

Kai kurių įvykių pasikartojimų nepriklausomų bandymų tikimybių pasiskirstymas. Jei kiekvieno bandymo metu įvykio tikimybė yra lygi p ir 0 ≤ p ≤ 1, tai šio įvykio įvykių skaičius μ su n nepriklausomu ... ... Didžioji sovietinė enciklopedija

- (Bernoulli skirstinys), tam tikro įvykio pasikartojimų nepriklausomų bandymų skaičiaus tikimybių pasiskirstymas, jei šio įvykio pasireiškimo tikimybė kiekviename bandyme yra p (0<или = p < или = 1). Именно, число м появлений … Gamtos mokslai. enciklopedinis žodynas

Binominis tikimybių skirstinys- (binominis pasiskirstymas) Pasiskirstymas, stebimas tais atvejais, kai kiekvieno nepriklausomo eksperimento (statistinio stebėjimo) rezultatas yra vienas iš dviejų galimų reikšmių: pergalė arba pralaimėjimas, įtraukimas arba pašalinimas, plius arba ... Ekonomikos ir matematikos žodynas

binominis tikimybių skirstinys- Pasiskirstymas, stebimas tais atvejais, kai kiekvieno nepriklausomo eksperimento (statistinio stebėjimo) rezultatas yra vienas iš dviejų galimų reikšmių: pergalė arba pralaimėjimas, įtraukimas arba pašalinimas, pliusas arba minusas, 0 arba 1. Tai yra ... ... Techninis vertėjo vadovas

Knygos

  • Tikimybių teorija ir matematinė problemų statistika. Daugiau nei 360 užduočių ir pratimų, D. A. Borzykh. Siūlomame vadove pateikiamos įvairaus sudėtingumo užduotys. Tačiau pagrindinis dėmesys skiriamas vidutinio sudėtingumo užduotims. Tai sąmoningai daroma siekiant paskatinti mokinius…
  • Tikimybių teorija ir matematinė problemų statistika Daugiau nei 360 uždavinių ir pratimų, Borzykh D. Siūlomame vadove pateikiamos įvairaus sudėtingumo problemos. Tačiau pagrindinis dėmesys skiriamas vidutinio sudėtingumo užduotims. Tai sąmoningai daroma siekiant paskatinti mokinius…

Sveiki! Mes jau žinome, kas yra tikimybių skirstinys. Jis gali būti atskiras arba tęstinis, ir mes sužinojome, kad jis vadinamas tikimybių tankio skirstiniu. Dabar panagrinėkime keletą įprastesnių paskirstymų. Tarkime, kad turiu monetą ir teisingą monetą, ir aš ją apversiu 5 kartus. Taip pat apibrėžiu atsitiktinį dydį X, pažymėsiu didžiąja raide X, jis bus lygus "erelių" skaičiui per 5 metimus. Gal turiu 5 monetas, išmesiu visas iš karto ir suskaičiuosiu kiek gavau galvų. Arba galėčiau turėti vieną monetą, galėčiau ją apversti 5 kartus ir suskaičiuoti, kiek kartų gavau galvas. Tai nelabai svarbu. Bet tarkime, kad turiu vieną monetą ir ją išverčiau 5 kartus. Tada neturėsime netikrumo. Taigi čia yra mano atsitiktinio dydžio apibrėžimas. Kaip žinome, atsitiktinis kintamasis šiek tiek skiriasi nuo įprasto kintamojo, jis labiau panašus į funkciją. Tai eksperimentui suteikia tam tikrą vertę. Ir šis atsitiktinis dydis yra gana paprastas. Tiesiog suskaičiuojame, kiek kartų „erelis“ iškrito po 5 metimų - tai mūsų atsitiktinis dydis X. Pagalvokime, kokios gali būti skirtingų reikšmių tikimybės mūsų atveju? Taigi, kokia tikimybė, kad X (didžioji raidė X) yra 0? Tie. Kokia tikimybė, kad po 5 metimų jis niekada nepasigirs? Na, tai iš tikrųjų yra tas pats, kas tikimybė gauti tam tikrą „uodegą“ (tiesa, nedidelė tikimybių teorijos apžvalga). Turėtumėte gauti keletą "uodegų". Kokia yra kiekvienos iš šių „uodegų“ tikimybė? Tai yra 1/2. Tie. tai turėtų būti 1/2 karto 1/2, 1/2, 1/2 ir dar kartą 1/2. Tie. (1/2)⁵. 1⁵=1, padalinti iš 2⁵, t.y. ties 32. Visai logiška. Taigi... Truputį pakartosiu, ką išgyvenome tikimybių teorijoje. Tai svarbu norint suprasti, kur dabar judame ir kaip iš tikrųjų formuojamas diskretinis tikimybių skirstinys. Taigi, kokia tikimybė, kad galvose gausime tiksliai vieną kartą? Na, galvos galėjo kilti iš pirmo metimo. Tie. gali būti taip: „erelis“, „uodegos“, „uodegos“, „uodegos“, „uodegos“. Arba antruoju metimu gali iškilti galvos. Tie. galėtų būti toks derinys: "uodegos", "galvos", "uodegos", "uodegos", "uodegos" ir pan. Vienas „erelis“ gali iškristi po bet kurio iš 5 metimų. Kokia kiekvienos iš šių situacijų tikimybė? Tikimybė gauti galvas yra 1/2. Tada tikimybė gauti „uodegą“, lygi 1/2, padauginama iš 1/2, 1/2, 1/2. Tie. kiekvienos iš šių situacijų tikimybė yra 1/32. Taip pat situacijos, kai X=0, tikimybė. Tiesą sakant, bet kokios ypatingos galvų ir uodegų tvarkos tikimybė bus 1/32. Taigi to tikimybė yra 1/32. Ir to tikimybė yra 1/32. Ir tokių situacijų būna todėl, kad „erelis“ gali nukristi ant bet kurio iš 5 metimų. Todėl tikimybė, kad iškris lygiai vienas „erelis“, lygi 5 * 1/32, t.y. 5/32. Visai logiška. Dabar prasideda įdomumas. Kokia tikimybė... (kiekvieną pavyzdį parašysiu skirtinga spalva)... kokia tikimybė, kad mano atsitiktinis kintamasis yra 2? Tie. Išmesiu monetą 5 kartus, o kokia tikimybė, kad ji nukris tiksliai 2 kartus? Čia įdomiau, tiesa? Kokie deriniai galimi? Tai gali būti galvos, galvos, uodegos, uodegos, uodegos. Tai taip pat gali būti galvos, uodegos, galvos, uodegos, uodegos. Ir jei manote, kad šie du „ereliai“ gali stovėti skirtingose ​​derinio vietose, galite šiek tiek susipainioti. Nebegalite galvoti apie paskirties vietas taip, kaip tai darėme aukščiau. Nors... galite, tik rizikuojate susipainioti. Turite suprasti vieną dalyką. Kiekvienam iš šių derinių tikimybė yra 1/32. ½*½*½*½*½. Tie. kiekvienos iš šių kombinacijų tikimybė yra 1/32. Ir turėtume pagalvoti, kiek yra tokių derinių, kurie tenkina mūsų būklę (2 „ereliai“)? Tie. iš tikrųjų reikia įsivaizduoti, kad yra 5 monetų metimai, iš kurių reikia pasirinkti 2, kuriuose iškrenta „erelis“. Įsivaizduokime, kad mūsų 5 metimai yra ratu, taip pat įsivaizduokime, kad turime tik dvi kėdes. Ir mes sakome: „Gerai, kuris iš jūsų sės ant šių „Erelių“ kėdžių? Tie. kuris iš jūsų bus "erelis"? Ir mūsų nedomina, kokia tvarka jie susėda. Pateikiu tokį pavyzdį, tikėdamasis, kad tau bus aiškiau. Ir galbūt norėsite pažiūrėti keletą tikimybių teorijos vadovėlių šia tema, kai kalbu apie Niutono dvinarį. Nes ten į visa tai pasigilinsiu plačiau. Bet jei taip samprotuosite, suprasite, kas yra dvinario koeficientas. Nes jei tu galvoji taip: gerai, aš turiu 5 metimus, kuris metimas pateks į pirmąsias galvas? Na, čia yra 5 galimybės, kurių apvertimas sukels pirmąsias galvas. O kiek progų antram „ereliui“? Na, o pirmasis metimas, kurį mes jau panaudojome, atėmė vieną galimybę gauti galvos. Tie. vieną galvos padėtį kombinacijoje jau užima vienas iš metimų. Dabar liko 4 metimai, vadinasi, antrasis „erelis“ gali nukristi ant vieno iš 4 metimų. Ir tu tai matai čia pat. Pasirinkau, kad 1-am metimui būtų galvos ir maniau, kad 1 iš 4 likusių metimų galvos taip pat turėtų iškilti. Taigi čia yra tik 4 galimybės. Viskas, ką aš sakau, yra tai, kad pirmajai galvai turite 5 skirtingas pozicijas, į kurias ji gali nusileisti. O antrajai liko tik 4 pozicijos. Pagalvok apie tai. Kai skaičiuojame taip, atsižvelgiama į eilę. Bet mums dabar nesvarbu, kokia tvarka iškrenta „galvos“ ir „uodegos“. Nesakome, kad tai „erelis 1“ arba „erelis 2“. Abiem atvejais tai tik „erelis“. Galėtume manyti, kad tai yra 1 galva, o tai 2. Arba gali būti atvirkščiai: tai gali būti antrasis „erelis“, o šis – „pirmas“. Taip sakau todėl, kad svarbu suprasti, kur naudoti paskirties vietas, o kur – derinius. Mūsų nedomina seka. Taigi iš tikrųjų yra tik 2 mūsų renginio kilmės būdai. Taigi padalinkime tai iš 2. Ir kaip vėliau pamatysite, tai yra 2! mūsų renginio kilmės būdai. Jei būtų 3 galvos, tada būtų 3! ir aš jums parodysiu kodėl. Taigi tai būtų... 5*4=20 padalytas iš 2 yra 10. Taigi yra 10 skirtingų kombinacijų iš 32, kur tikrai turėsite 2 galvas. Taigi 10*(1/32) yra lygus 10/32, ką tai reiškia? 5/16. Rašysiu per binominį koeficientą. Tai vertė čia, viršuje. Jei pagalvotumėte, tai tas pats, kas 5!, padalytas iš... Ką reiškia šis 5 * 4? 5! yra 5*4*3*2*1. Tie. jei man čia reikia tik 5 * 4, tai galiu padalyti 5! už 3! Tai lygu 5*4*3*2*1, padalytam iš 3*2*1. Ir liko tik 5 * 4. Taigi jis yra toks pat kaip šis skaitiklis. Ir tada, nes mūsų nedomina seka, čia reikia 2. Tiesą sakant, 2!. Padauginkite iš 1/32. Tai būtų tikimybė, kad mes pataikytume lygiai 2 galvas. Kokia tikimybė, kad gausime galvas lygiai 3 kartus? Tie. tikimybė, kad x=3. Taigi, remiantis ta pačia logika, pirmą kartą galvos gali atsirasti 1 iš 5 apsivertimų. Antrą kartą galvos gali atsirasti 1 iš 4 likusių metimų. Ir trečią kartą galvos gali atsirasti 1 iš 3 likusių metimų. Kiek skirtingų būdų galima surengti 3 metimus? Apskritai, kiek yra būdų, kaip išdėstyti 3 objektus savo vietose? Tai 3! Ir jūs galite tai išsiaiškinti, arba galbūt norėsite dar kartą peržiūrėti vadovėlius, kuriuose aš tai paaiškinau išsamiau. Bet jei paimsite, pavyzdžiui, A, B ir C raides, yra 6 būdai, kaip jas išdėstyti. Galite galvoti apie tai kaip antraštes. Čia gali būti ACB, CAB. Gali būti BAC, BCA ir... Koks paskutinis variantas, kurio neįvardijau? CBA. Yra 6 būdai, kaip išdėstyti 3 skirtingus elementus. Dalijame iš 6, nes nenorime vėl skaičiuoti tų 6 skirtingų būdų, nes traktuojame juos kaip lygiaverčius. Čia mums neįdomu, koks metimų skaičius baigsis galvomis. 5*4*3… Tai galima perrašyti į 5!/2!. Ir padalinkite jį iš dar 3!. Toks jis yra. 3! lygus 3*2*1. Trejetai mažėja. Tai tampa 2. Tai tampa 1. Dar kartą 5*2, t.y. yra 10. Kiekvienos situacijos tikimybė yra 1/32, taigi tai vėlgi yra 5/16. Ir tai įdomu. Tikimybė, kad gausite 3 galvas, yra tokia pati kaip tikimybė, kad gausite 2 galvas. Ir to priežastis... Na, yra daug priežasčių, kodėl taip atsitiko. Bet jei gerai pagalvoji, tikimybė gauti 3 galvas yra tokia pati kaip tikimybė gauti 2 uodegas. O tikimybė gauti 3 uodegas turėtų būti tokia pati kaip tikimybė gauti 2 galvas. Ir gerai, kad vertybės taip veikia. gerai. Kokia tikimybė, kad X=4? Galime naudoti tą pačią formulę, kurią naudojome anksčiau. Tai gali būti 5*4*3*2. Taigi, čia mes rašome 5 * 4 * 3 * 2 ... Kiek skirtingų būdų yra išdėstyti 4 objektus? Jau 4!. 4! - Iš tikrųjų tai yra ši dalis, čia pat. Tai yra 4*3*2*1. Taigi, tai panaikinama, paliekant 5. Tada kiekvieno derinio tikimybė yra 1/32. Tie. tai lygu 5/32. Vėlgi, atkreipkite dėmesį, kad tikimybė gauti galvas 4 kartus yra lygi tikimybei, kad galvos atsiras 1 kartą. Ir tai prasminga, nes. 4 galvos yra tas pats, kas 1 uodega. Sakysite: na ir prie kokio mėtymo šita „uodega“ iškris? Taip, tam yra 5 skirtingi deriniai. Ir kiekvieno iš jų tikimybė yra 1/32. Ir galiausiai kokia tikimybė, kad X=5? Tie. pakelia galvą 5 kartus iš eilės. Tai turėtų būti taip: „erelis“, „erelis“, „erelis“, „erelis“, „erelis“. Kiekvienos galvos tikimybė yra 1/2. Jūs juos padauginate ir gaunate 1/32. Galite eiti kitu keliu. Jei šiuose eksperimentuose yra 32 būdai, kuriais galite gauti galvas ir uodegas, tai tik vienas iš jų. Čia tokių būdų buvo 5 iš 32. Čia - 10 iš 32. Vis dėlto atlikome skaičiavimus, o dabar esame pasiruošę braižyti tikimybių skirstinį. Bet mano laikas baigėsi. Leiskite man tęsti kitoje pamokoje. O jei nusiteikęs, tai gal piešti prieš žiūrėdamas kitą pamoką? Greitai pasimatysime!

Šioje ir kitose pastabose mes apsvarstysime atsitiktinių įvykių matematinius modelius. Matematinis modelis yra matematinė išraiška, vaizduojanti atsitiktinį kintamąjį. Diskretiesiems atsitiktiniams dydžiams ši matematinė išraiška žinoma kaip pasiskirstymo funkcija.

Jei problema leidžia aiškiai parašyti matematinę išraišką, vaizduojančią atsitiktinį kintamąjį, galite apskaičiuoti tikslią bet kurios jo reikšmės tikimybę. Tokiu atveju galite apskaičiuoti ir išvardyti visas paskirstymo funkcijos reikšmes. Verslo, sociologijos ir medicinos srityse yra įvairių atsitiktinių dydžių pasiskirstymo. Vienas iš naudingiausių paskirstymų yra dvejetainis.

Binominis skirstinys naudojamas situacijoms, kurioms būdingos šios savybės, modeliuoti.

  • Pavyzdį sudaro nustatytas elementų skaičius n vaizduojantis kokio nors testo rezultatą.
  • Kiekvienas imties elementas priklauso vienai iš dviejų vienas kitą nepaneigiančių kategorijų, apimančių visą imties erdvę. Paprastai šios dvi kategorijos vadinamos sėkme ir nesėkme.
  • Sėkmės tikimybė R yra pastovus. Todėl nesėkmės tikimybė yra 1 - p.
  • Bet kurio tyrimo rezultatas (t. y. sėkmė ar nesėkmė) nepriklauso nuo kito bandymo rezultato. Siekiant užtikrinti rezultatų nepriklausomumą, imties elementai paprastai gaunami naudojant du skirtingus metodus. Kiekvienas imties elementas yra atsitiktinai paimtas iš begalinės populiacijos be pakeitimo arba iš baigtinės populiacijos su pakeitimu.

Atsisiųskite pastabą formatu arba formatu, pavyzdžius formatu

Binominis skirstinys naudojamas siekiant įvertinti sėkmingų imties, kurią sudaro n pastebėjimai. Paimkime užsakymą kaip pavyzdį. Saxon Company klientai gali naudoti interaktyvią elektroninę formą norėdami pateikti užsakymą ir išsiųsti jį įmonei. Tada informacinė sistema patikrina, ar užsakymuose nėra klaidų, taip pat neišsami ar netiksli informacija. Bet koks užsakymas, dėl kurio kyla abejonių, yra pažymėtas ir įtraukiamas į kasdienę išimčių ataskaitą. Bendrovės surinkti duomenys rodo, kad užsakymų klaidų tikimybė yra 0,1. Įmonė norėtų sužinoti, kokia yra tikimybė rasti tam tikrą skaičių klaidingų užsakymų tam tikrame pavyzdyje. Pavyzdžiui, tarkime, kad klientai užpildė keturias elektronines formas. Kokia tikimybė, kad visi užsakymai bus be klaidų? Kaip apskaičiuoti šią tikimybę? Sakydami sėkmę turime omenyje klaidą pildant formą, o visas kitas pasekmes laikysime nesėkme. Prisiminkite, kad mus domina klaidingų užsakymų skaičius tam tikrame pavyzdyje.

Kokius rezultatus galime stebėti? Jei imtį sudaro keturi užsakymai, gali būti klaidingas vienas, du, trys arba visi keturi, be to, visi jie gali būti teisingai užpildyti. Ar atsitiktinis dydis, apibūdinantis neteisingai užpildytų formų skaičių, gali įgyti kitą reikšmę? Tai neįmanoma, nes neteisingai užpildytų formų skaičius negali viršyti imties dydžio n arba būti neigiamas. Taigi atsitiktinis dydis, paklūstantis dvinario skirstinio dėsniui, įgauna reikšmes nuo 0 iki n.

Tarkime, kad keturių užsakymų imtyje pastebimi šie rezultatai:

Kokia tikimybė keturių užsakymų imtyje ir nurodyta tvarka rasti tris klaidingus užsakymus? Kadangi preliminarūs tyrimai parodė, kad klaidos tikimybė pildant formą yra 0,10, aukščiau nurodytų rezultatų tikimybė apskaičiuojama taip:

Kadangi rezultatai nepriklauso vienas nuo kito, nurodytos baigčių sekos tikimybė yra lygi: p*p*(1–p)*p = 0,1*0,1*0,9*0,1 = 0,0009. Jei reikia apskaičiuoti pasirinkimų skaičių X n elementus, turėtumėte naudoti kombinuotą formulę (1):

kur n! \u003d n * (n -1) * (n - 2) * ... * 2 * 1 - skaičiaus koeficientas n ir 0! = 1 ir 1! = 1 pagal apibrėžimą.

Ši išraiška dažnai vadinama . Taigi, jei n = 4 ir X = 3, sekų, sudarytų iš trijų elementų, išskirtų iš 4 dydžio mėginio, skaičius apskaičiuojamas pagal šią formulę:

Todėl tikimybė rasti tris klaidingus nurodymus apskaičiuojama taip:

(galimų sekų skaičius) *
(tam tikros sekos tikimybė) = 4 * 0,0009 = 0,0036

Taip pat galime apskaičiuoti tikimybę, kad iš keturių užsakymų vienas ar du yra neteisingi, taip pat tikimybę, kad visi užsakymai yra neteisingi arba visi yra teisingi. Tačiau didėjant imties dydžiui n tampa sunkiau nustatyti tam tikros rezultatų sekos tikimybę. Šiuo atveju turėtų būti taikomas tinkamas matematinis modelis, apibūdinantis pasirinkimų skaičiaus dvinarį pasiskirstymą X objektai iš mėginio, kuriame yra n elementai.

Binominis skirstinys

Kur P(X)- tikimybė X tam tikro dydžio imties sėkmė n ir sėkmės tikimybė R, X = 0, 1, … n.

Atkreipkite dėmesį į tai, kad (2) formulė yra intuityvių išvadų formalizavimas. Atsitiktinė vertė X, paklūsta dvinariniam skirstiniui, gali gauti bet kokią sveikojo skaičiaus reikšmę diapazone nuo 0 iki n. Darbas RX(1–p)nX yra tam tikros sekos, susidedančios iš X sėkmės imtyje, kurios dydis lygus n. Vertė apibrėžia galimų derinių, sudarytų iš X sėkmė n bandymai. Todėl tam tikram bandymų skaičiui n ir sėkmės tikimybė R tikimybė, kad seka susideda iš X sėkmė yra lygi

P(X) = (galimų sekų skaičius) * (tam tikros sekos tikimybė) =

Apsvarstykite pavyzdžius, iliustruojančius (2) formulės taikymą.

1. Tarkime, kad tikimybė, kad forma bus užpildyta neteisingai, yra 0,1. Kokia tikimybė, kad trys iš keturių užpildytų formų bus neteisingos? Naudodami (2) formulę gauname, kad tikimybė rasti tris klaidingus užsakymus keturių užsakymų imtyje yra lygi

2. Tarkime, kad tikimybė, kad forma bus užpildyta neteisingai, yra 0,1. Kokia tikimybė, kad bent trys iš keturių užpildytų formų bus neteisingos? Kaip parodyta ankstesniame pavyzdyje, tikimybė, kad trys iš keturių užpildytų formų bus neteisingos, yra 0,0036. Norėdami apskaičiuoti tikimybę, kad bent trys iš keturių užpildytų formų bus užpildytos neteisingai, turite pridėti tikimybę, kad iš keturių užpildytų formų trys bus neteisingos, ir tikimybę, kad visos iš keturių užpildytų formų bus neteisingos. Antrojo įvykio tikimybė yra

Taigi tikimybė, kad iš keturių užpildytų formų bent trys bus klaidingos, lygi

P(X > 3) = P(X = 3) + P(X = 4) = 0,0036 + 0,0001 = 0,0037

3. Tarkime, kad tikimybė, kad forma bus užpildyta neteisingai, yra 0,1. Kokia tikimybė, kad mažiau nei trys iš keturių užpildytų formų bus neteisingos? Šio įvykio tikimybė

P(X< 3) = P(X = 0) + P(X = 1) + P(X = 2)

Naudodami (2) formulę apskaičiuojame kiekvieną iš šių tikimybių:

Todėl P(X< 3) = 0,6561 + 0,2916 + 0,0486 = 0,9963.

Tikimybė P(X< 3) можно вычислить иначе. Для этого воспользуемся тем, что событие X < 3 является дополнительным по отношению к событию Х>3. Tada P(X< 3) = 1 – Р(Х> 3) = 1 – 0,0037 = 0,9963.

Didėjant imties dydžiui n Skaičiavimas, panašus į atliktus 3 pavyzdyje, tampa sudėtingas. Siekiant išvengti šių komplikacijų, daugelis binominių tikimybių pateikiamos iš anksto. Kai kurios iš šių tikimybių parodytos fig. 1. Pavyzdžiui, norint gauti tikimybę, kad X= 2 val n= 4 ir p= 0,1, iš lentelės turėtumėte ištraukti skaičių, esantį linijos sankirtoje X= 2 ir stulpeliai R = 0,1.

Ryžiai. 1. Binominė tikimybė ties n = 4, X= 2 ir R = 0,1

Binominį skirstinį galima apskaičiuoti naudojant Excel funkcijos=BINOM.DIST() (2 pav.), kuris turi 4 parametrus: sėkmingų skaičių - X, bandymų skaičius (arba imties dydis) – n, sėkmės tikimybė yra R, parametras integralas, kurios reikšmės yra TRUE (šiuo atveju apskaičiuojama tikimybė bent jau Xįvykiai) arba FALSE (šiuo atveju tikimybė, kad tiksliai Xįvykiai).

Ryžiai. 2. Funkcijos parametrai =BINOM.DIST()

Pirmiau minėtų trijų pavyzdžių skaičiavimai parodyti fig. 3 (taip pat žr. Excel failą). Kiekviename stulpelyje yra viena formulė. Skaičiai rodo atsakymus į atitinkamo skaičiaus pavyzdžius).

Ryžiai. 3. Binominio skirstinio skaičiavimas programoje Excel n= 4 ir p = 0,1

Binominio skirstinio savybės

Binominis skirstinys priklauso nuo parametrų n Ir R. Binominis skirstinys gali būti simetriškas arba asimetrinis. Jei p = 0,05, binominis skirstinys yra simetriškas, nepaisant parametro reikšmės n. Tačiau jei p ≠ 0,05, pasiskirstymas tampa iškreiptas. Kuo artimesnė parametro reikšmė R iki 0,05 ir kuo didesnis imties dydis n, tuo silpnesnė yra skirstinio asimetrija. Taigi neteisingai užpildytų formų skaičiaus pasiskirstymas pasislenka į dešinę, nes p= 0,1 (4 pav.).

Ryžiai. 4. Binominio skirstinio histograma n= 4 ir p = 0,1

Matematinis binominio skirstinio lūkestis yra lygus imties dydžio sandaugai n apie sėkmės tikimybę R:

(3) M = E(X) =np

Vidutiniškai esant pakankamai ilgam testų serijai keturių užsakymų pavyzdyje, gali būti p \u003d E (X) \u003d 4 x 0,1 \u003d 0,4 neteisingai užpildytų formų.

Binominio skirstinio standartinis nuokrypis

Pavyzdžiui, apskaitoje neteisingai užpildytų formų skaičiaus standartinis nuokrypis informacinė sistema lygus:

Naudojama medžiaga iš knygos Levin ir kt.Statistika vadovams. - M.: Williams, 2004. - p. 307–313


Žinoma, skaičiuojant kaupiamojo skirstinio funkciją, reikėtų naudoti minėtą ryšį tarp dvinario ir beta skirstinių. Šis metodas tikrai yra geresnis nei tiesioginis sumavimas, kai n > 10.

Klasikiniuose statistikos vadovėliuose, norint gauti dvinario skirstinio reikšmes, dažnai rekomenduojama naudoti formules, pagrįstas ribinėmis teoremomis (pvz., Moivre-Laplace formulę). Reikėtų pažymėti, kad vien tik skaičiavimo požiūriušių teoremų vertė yra artima nuliui, ypač dabar, kai beveik ant kiekvieno stalo yra galingas kompiuteris. Pagrindinis minėtų aproksimacijų trūkumas yra jų visiškai nepakankamas tikslumas n reikšmėms, būdingoms daugeliui programų. Ne mažesnis trūkumas yra tai, kad nėra aiškių rekomendacijų dėl vieno ar kito aproksimavimo taikymo (standartiniuose tekstuose pateikiamos tik asimptotinės formuluotės, prie jų nėra pateikti tikslumo įverčiai, todėl iš jų mažai naudos). Sakyčiau, kad abi formulės galioja tik n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Kvantilių radimo problemos čia nemanau: diskretiesiems skirstiniams tai yra trivialus, o tose problemose, kur tokie skirstiniai kyla, tai, kaip taisyklė, nėra aktualu. Jei kvantiliai vis dar reikalingi, rekomenduoju performuluoti problemą taip, kad būtų galima dirbti su p reikšmėmis (stebėtomis reikšmėmis). Štai pavyzdys: įgyvendinant kai kuriuos skaičiavimo algoritmus, kiekviename žingsnyje reikia patikrinti statistinę hipotezę apie dvinarį atsitiktinį kintamąjį. Pagal klasikinį požiūrį, kiekviename žingsnyje reikia apskaičiuoti kriterijaus statistiką ir palyginti jo reikšmę su kritinės aibės riba. Tačiau kadangi algoritmas yra išvardijamas, būtina kiekvieną kartą iš naujo nustatyti kritinės aibės ribą (juk imties dydis kinta nuo žingsnio iki žingsnio), o tai neproduktyviai padidina laiko sąnaudas. Šiuolaikinis metodas rekomenduoja apskaičiuoti stebimą reikšmingumą ir palyginti jį su pasikliovimo tikimybe, taupant kvantilių paiešką.

Todėl šie kodai neskaičiuoja atvirkštinės funkcijos, vietoj to pateikiama funkcija rev_binomialDF, kuri apskaičiuoja vieno bandymo sėkmės tikimybę p, atsižvelgiant į bandymų skaičių n, sėkmingų jų skaičių m ir šių m sėkmės tikimybės reikšmę y. Tai naudoja pirmiau minėtą ryšį tarp dvinario ir beta skirstinių.

Tiesą sakant, ši funkcija leidžia gauti pasikliautinųjų intervalų ribas. Iš tiesų, tarkime, kad gausime m sėkmingų n dvinarių bandymų. Kaip žinoma, parametro p dvipusio pasikliautinojo intervalo kairioji riba yra 0, jei m = 0, o for yra lygties sprendimas . Panašiai dešinioji riba yra 1, jei m = n, o už yra lygties sprendimas . Tai reiškia, kad norėdami rasti kairiąją ribą, turime išspręsti lygtį , o norint ieškoti tinkamo – lygtis . Jie sprendžiami funkcijose binom_leftCI ir binom_rightCI , kurios atitinkamai grąžina viršutinę ir apatinę dvipusio pasikliautinojo intervalo ribas.

Noriu pastebėti, kad jei visiškai neįtikėtino tikslumo nereikia, tada esant pakankamai dideliam n, galite naudoti tokį aproksimaciją [B.L. van der Waerden, Matematinė statistika. M: IL, 1960, Ch. 2, sek. 7]: , kur g yra normaliojo skirstinio kvantilis. Šio aproksimavimo reikšmė yra ta, kad yra labai paprastų aproksimacijų, kurios leidžia apskaičiuoti normaliojo skirstinio kvantilius (žr. tekstą apie normaliojo skirstinio apskaičiavimą ir atitinkamą šios nuorodos skyrių). Mano praktikoje (daugiausia n > 100) šis apytikslis skaičiavimas davė apie 3–4 skaitmenis, kurių, kaip taisyklė, visiškai pakanka.

Skaičiavimui naudojant šiuos kodus reikia failų betaDF.h , betaDF.cpp (žr. skyrių apie beta platinimą), taip pat logGamma.h , logGamma.cpp (žr. A priedą). Taip pat galite pamatyti funkcijų naudojimo pavyzdį.

binomialDF.h failą

#ifndef __BINOMIAL_H__ #įtraukti "betaDF.h" dvigubą dvejetainįDF(dvigubi bandymai, dvigubi pasisekimai, dvigubas p); /* * Tebūnie nepriklausomų stebėjimų „bandymai“ * su kiekvieno iš jų sėkmės tikimybe „p“. * Apskaičiuokite tikimybę B (sėkmės | bandymai, p), kad sėkmingų atvejų skaičius * yra nuo 0 iki "sėkmių" (imtinai). */ double rev_binomialDF(double bandymai, dvigubos sėkmės, dvigubas y); /* * Tegul bent m sėkmės * tikimybė y yra žinoma Bernulio schemos bandymuose. Funkcija randa sėkmės tikimybę p * per vieną bandymą. * * Skaičiavimams naudojamas toks ryšys * * 1 - p = rev_Beta(bandymai-sėkmės| sėkmės+1, y). */ double binom_leftCI(dvigubi bandymai, dvigubos sėkmės, dvigubas lygis); /* Tebūna nepriklausomų stebėjimų „bandymai“ * su sėkmės tikimybe „p“ kiekviename * ir sėkmių skaičius yra „sėkmės“. * Kairioji dvipusio pasikliautinojo intervalo * riba apskaičiuojama su reikšmingumo lygio lygiu. */ double binom_rightCI(double n, dvigubos sėkmės, dvigubas lygis); /* Tebūna nepriklausomų stebėjimų „bandymai“ * su sėkmės tikimybe „p“ kiekviename * ir sėkmių skaičius yra „sėkmės“. * Dvipusio pasikliautinojo intervalo * dešinioji riba apskaičiuojama su reikšmingumo lygio lygiu. */ #endif /* Baigiasi #ifndef __BINOMIAL_H__ */

binomialDF.cpp failą

/******************************************************************** /* Binominis pasiskirstymas */ /************************************************************************/ #įtraukti #įtraukti #include "betaDF.h" ĮRAŠAS double binomialDF(double n, double m, double p) /* * Tegul yra "n" nepriklausomų stebėjimų * su sėkmės tikimybe "p". * Apskaičiuokite tikimybę B(m|n,p), kad sėkmių skaičius yra * tarp 0 ir "m" (imtinai), t.y. * dvinarių tikimybių suma nuo 0 iki m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Skaičiavimai nereiškia kvailo sumavimo - * naudojamas toks ryšys su centriniu beta skirstiniu: * * B(m|n,p) = Beta-1,-+m| * * Argumentai turi būti teigiami, su 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (p<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) grąža 1; kitu atveju grąžina BetaDF(n-m, m+1).value(1-p); )/* binomialDF */ ĮRAŠAS double rev_binomialDF(double n, double m, double y) /* * Tegul n Bernulio schemos bandymų tikimybė bus žinoma mažiausiai m *. Funkcija randa sėkmės tikimybę p * per vieną bandymą. * * Skaičiavimams naudojamas toks ryšys * * 1 - p = rev_Beta(y|n-m,m+1). */ ( assert((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0,5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/