Як знайти математичне очікування для біномного розподілу. Біноміальний розподіл дискретної випадкової величини

Розглянемо Біноміальний розподіл, обчислимо його математичне очікування, дисперсію, моду За допомогою функції MS EXCEL БІНОМ.РАСП() побудуємо графіки функції розподілу та щільності ймовірності. Зробимо оцінку параметра розподілу p, математичного очікування розподілу та стандартного відхилення. Також розглянемо розподіл Бернуллі.

Визначення. Нехай проводяться nвипробувань, у кожному з яких може відбутися лише дві події: подія «успіх» з ймовірністю p або подія «невдача» з ймовірністю q =1-p (так звана Схема Бернуллі,Bernoullitrials).

Імовірність отримання рівно x успіхів у цих n випробуваннях дорівнює:

Кількість успіхів у вибірці x є випадковою величиною, яка має Біноміальний розподіл(англ. Binomialdistribution) pі nє параметрами цього розподілу.

Нагадаємо, що для застосування схеми Бернулліі відповідно Біноміального розподілу,повинні бути виконані такі умови:

  • кожне випробування повинно мати рівно два результати, що умовно називають «успіхом» і «невдачею».
  • результат кожного випробування повинен залежати від результатів попередніх випробувань (незалежність випробувань).
  • ймовірність успіху p має бути постійною для всіх випробувань.

Біноміальний розподіл у MS EXCEL

У MS EXCEL, починаючи з версії 2010, для є функція БІНОМ.РАСП() , англійська назва- BINOM.DIST(), яка дозволяє обчислити ймовірність того, що у вибірці буде рівно х"Успіхів" (тобто. функцію щільності ймовірності p(x), див. формулу вище), і інтегральну функцію розподілу(ймовірність того, що у вибірці буде xабо менше "успіхів", включаючи 0).

До MS EXCEL 2010 EXCEL була функція БІНОМРАСП() , яка також дозволяє обчислити функцію розподілуі щільність імовірності p(x). БІНОМРАСП() залишено в MS EXCEL 2010 для сумісності.

У файлі прикладу наведено графіки густини розподілу ймовірностіі .

Біноміальний розподілмає позначення B (n ; p) .

Примітка: Для побудови інтегральної функції розподілуідеально підходить діаграма типу Графік, для густини розподілуГістограма з угрупуванням. Докладніше про побудову діаграм читайте статтю Основні типи діаграм.

Примітка: Для зручності написання формул у файлі прикладу створено Імена для параметрів Біноміального розподілу: n та p.

У прикладному файлі наведено різні розрахунки ймовірності за допомогою функцій MS EXCEL:

Як видно на картинці вище, передбачається, що:

  • У нескінченній сукупності, з якої робиться вибірка, міститься 10% (або 0,1) придатних елементів (параметр p, Третій аргумент функції = БІНОМ.РАСП() )
  • Щоб обчислити ймовірність того, що у вибірці з 10 елементів (параметр n, другий аргумент функції) буде рівно 5 придатних елементів (перший аргумент), потрібно записати формулу: =БІНОМ.РАСП(5; 10; 0,1; БРЕХНЯ)
  • Останній, четвертий елемент, встановлений = БРЕХНЯ, тобто. повертається значення функції густини розподілу .

Якщо значення четвертого аргументу = ІСТИНА, то функція БІНОМ.РАСП() повертає значення інтегральної функції розподілуабо просто Функцію розподілу. У цьому випадку можна розрахувати ймовірність того, що у вибірці кількість придатних елементів буде з певного діапазону, наприклад, 2 або менше (включаючи 0).

Для цього потрібно записати формулу: = БІНОМ.РАСП(2; 10; 0,1; ІСТИНА)

Примітка: При нецілому значенні х, . Наприклад, такі формули повернуть одне й теж значення: =БІНОМ.РАСП( 2 ; 10; 0,1; ІСТИНА)=БІНОМ.РАСП( 2,9 ; 10; 0,1; ІСТИНА)

Примітка: У файлі прикладу щільність імовірностіі функція розподілутакож обчислені з використанням визначення та функції ЧИСЛКОМБ() .

Показники розподілу

У файл прикладу на аркуші Прикладє формули для розрахунку деяких показників розподілу:

  • =n * p;
  • (квадрату стандартного відхилення) = n * p * (1-p);
  • = (n + 1) * p;
  • =(1-2*p)*КОРІНЬ(n*p*(1-p)).

Виведемо формулу математичного очікуванняБіноміального розподілу, використовуючи Схему Бернуллі .

За визначенням випадкова величина Х в схемою Бернуллі(Bernoulli random variable) має функцію розподілу :

Цей розподіл називається розподіл Бернуллі .

Примітка : розподіл Бернуллі- окремий випадок Біноміального розподілуіз параметром n=1.

Згенеруємо 3 масиви по 100 чисел з різними ймовірностями успіху: 0,1; 0,5 та 0,9. Для цього у вікні Генерація випадкових чиселвстановимо такі параметри кожної ймовірності p:

Примітка: Якщо встановити опцію Випадкове розсіювання (Random Seed), то можна вибрати певний випадковий набір згенерованих чисел. Наприклад, встановивши цю опцію =25 можна згенерувати різних комп'ютерах одні й самі набори випадкових чисел (якщо, звісно, ​​інші параметри розподілу збігаються). Значення опції може приймати цілі значення від 1 до 32767. Назва опції Випадкове розсіюванняможе заплутати. Краще було б її перекласти як Номер набору з довільними числами .

У результаті матимемо 3 стовпці по 100 чисел, на підставі яких можна, наприклад, оцінити ймовірність успіху pза формулою: Число успіхів/100(Див. файл прикладу лист ГенераціяБернуллі).

Примітка: Для розподілу Бернулліз p = 0,5 можна використовувати формулу = ВИПАД МІЖ (0; 1), яка відповідає .

Генерація випадкових чисел. Біноміальний розподіл

Припустимо, що у вибірці виявилося 7 дефектних виробів. Це означає, що «дуже ймовірна» ситуація, що змінилася частка дефектних виробів pяка є характеристикою нашого виробничого процесу. Хоча така ситуація «дуже ймовірна», але існує ймовірність (альфа-ризик, помилка 1-го роду, «хибна тривога»), що все ж таки pзалишилася без змін, а збільшена кількість дефектних виробів зумовлена ​​випадковістю вибірки.

Як видно на малюнку нижче, 7 – кількість дефектних виробів, яка припустима для процесу з p=0,21 при тому ж значенні Альфа. Це є ілюстрацією, що з перевищенні порогового значеннядефектних виробів у вибірці, p«швидше за все» збільшилося. Фраза «швидше за все» означає, що є лише 10% ймовірність (100%-90%) те, що відхилення частки дефектних виробів вище порогового викликано лише сучайними причинами.

Таким чином, перевищення порогової кількості дефектних виробів у вибірці, може бути сигналом, що процес засмутився і став випускати б ольший відсоток бракованих виробів.

Примітка: До MS EXCEL 2010 у EXCEL була функція КРИТБІНОМ(), яка еквівалентна БІНОМ.ОБР(). КРИТБІНОМ залишена в MS EXCEL 2010 і вище для сумісності.

Зв'язок Біноміального розподілу з іншими розподілами

Якщо параметр nБіноміального розподілупрагне нескінченності, а pпрагне до 0, то в цьому випадку Біноміальний розподілможе бути апроксимовано. Можна сформулювати умови, коли наближення розподілом Пуассонапрацює добре:

  • p(чим менше pі більше n, Тим наближення точніше);
  • p >0,9 (враховуючи що q =1- p, обчислення в цьому випадку необхідно проводити через qхпотрібно замінити на n - x). Отже, чим менше qі більше n, Тим наближення точніше).

При 0,110 Біноміальний розподілможна апроксимувати.

В свою чергу, Біноміальний розподілможе бути хорошим наближенням , коли розмір сукупності N Гіпергеометричного розподілунабагато більше розміру вибірки n (тобто, N>>n або n/N Детальніше про зв'язок вищевказаних розподілів, можна прочитати в статті . Там же наведені приклади апроксимації, і пояснені умови, коли вона можлива і з якою точністю.

ПОРАДА: Про інші розподіли MS EXCEL можна прочитати у статті .

- (binomial distribution) Розподіл, що дозволяє розрахувати ймовірність настання якогось випадкової події, отриманого в результаті спостережень низки незалежних подій, якщо ймовірність наступу, що становлять його елементарні… Економічний словник

- (розподіл Бернуллі) розподіл ймовірностей числа появ певної події при повторних незалежних випробуваннях, якщо ймовірність появи цієї події в кожному випробуванні дорівнює p(0 p 1). Саме число? появ цієї події є… … Великий Енциклопедичний словник

біномний розподіл- - Тематики електрозв'язок, основні поняття EN binomial distribution …

- (розподіл Бернуллі), розподіл ймовірностей числа появ певної події при повторних незалежних випробуваннях, якщо ймовірність появи цієї події в кожному випробуванні дорівнює р (0≤р≤1). Саме, кількість μ появи цієї події… … Енциклопедичний словник

біномний розподіл– 1.49. Біноміальний розподіл Розподіл ймовірностей дискретної випадкової величини X, що приймає будь-які цілі значення від 0 до n, таке, що при х = 0, 1, 2, ..., n і параметрах n = 1, 2, ... і 0< p < 1, где Источник … Словник-довідник термінів нормативно-технічної документації

Розподіл Бернуллі, розподіл ймовірностей випадкової величини X, що приймає цілі значення з ймовірностями відповідно (біноміальний коефіцієнт; р параметр Б. р., наз. ймовірністю позитивного результату, що приймає значення … Математична енциклопедія

Розподіл ймовірностей кількості появ певної події при повторних незалежних випробуваннях. Якщо при кожному випробуванні ймовірність появи події дорівнює р, причому 0 ≤ p ≤ 1, то число μ появи цієї події при n незалежних… … Велика Радянська Енциклопедія

- (розподіл Бернуллі), розподіл ймовірностей числа появ нек рого події при повторних незалежних випробуваннях, якщо ймовірність появи цієї події в кожному випробуванні дорівнює р (0<или = p < или = 1). Именно, число м появлений … Природознавство. Енциклопедичний словник

Біноміальний розподіл ймовірностей- (binomial distribution) Розподіл, який спостерігається у випадках, коли результат кожного незалежного експерименту (статистичного спостереження) приймає одне з двох можливих значень: перемога чи поразка, включення чи виняток, плюс чи … Економіко-математичний словник

біномне розподіл ймовірностей- Розподіл, який спостерігається у випадках, коли результат кожного незалежного експерименту (статистичного спостереження) набуває одного з двох можливих значень: перемога чи поразка, включення чи виняток, плюс чи мінус, 0 чи 1. Тобто… … Довідник технічного перекладача

Книги

  • Теорія ймовірностей та математична статистика у завданнях. Більше 360 завдань та вправ, Д. А. Борзих. У запропонованому посібнику містяться завдання різного рівня складності. Проте основний акцент зроблено на завдання середньої складності. Це зроблено навмисно для того, щоб спонукати студентів до…
  • Теорія ймовірностей та математична статистика в задачах Більше 360 завдань та вправ, Борзих Д.. У запропонованому посібнику містяться завдання різного рівня складності. Проте основний акцент зроблено на завдання середньої складності. Це зроблено навмисно для того, щоб спонукати студентів до…

Доброго дня! Ми вже знаємо, що такий розподіл імовірностей. Воно може бути дискретним чи безперервним, і ми дізналися, що його називають густотою розподілу ймовірностей. Тепер давайте вивчимо кілька найбільш поширених розподілів. Припустимо, у мене є монета, причому правильна монета, і я збираюся підкинути її 5 разів. Також я визначу випадкову величину Х, позначу її великою літерою X, вона дорівнюватиме кількості «орлів» при 5 підкиданнях. Може, у мене є 5 монет, я підкину їх усі одразу і порахую, скільки у мене випало «орлів». Або в мене могла бути одна монета, я могла б її підкинути 5 разів і порахувати, скільки разів у мене випав «орел». Це, власне, не має значення. Але припустимо, що в мене одна монета, і я підкину її 5 разів. Тоді ми не матимемо невизначеності. Отже, ось визначення моєї випадкової величини. Як ми знаємо, випадкова величина трохи відрізняється від звичайної змінної, вона більше схожа на функцію. Вона надає якесь значення експерименту. І ця випадкова величина досить проста. Ми просто вважаємо, скільки разів випав «орел» після 5 підкидань – це і є наша випадкова величина X. Давайте подумаємо, які можуть бути ймовірності різних значень у нашому випадку? Так, яка ймовірність того, що Х (головна Х) дорівнює 0? Тобто. яка ймовірність того, що після 5 підкидань жодного разу не випаде орел? Ну, це, по суті, те саме, що ймовірність випадання одних «решічок» (це так, невеликий огляд теорії ймовірностей). У вас мають випасти одні «решки». Яка ймовірність кожної з цих «грашок»? Це 1/2. Тобто. тут має бути 1/2 помножити на 1/2, 1/2, 1/2 і знову на 1/2. Тобто. (1/2)⁵. 1⁵=1, розділити на 2⁵, тобто. на 32. Цілком логічно. Так… Я трохи повторю те, що ми проходили з теорії ймовірностей. Це важливо для того, щоб розуміти, куди ми зараз рухаємось і як, власне, формується дискретний розподіл імовірностей. Отже, а яка ймовірність того, що в нас рівно один раз випаде орел? Ну, орел міг би випасти при першому підкиданні. Тобто. могло бути так: «орел», «решка», «решка», «решка», «решка». Або "орел" міг би випасти при другому підкиданні. Тобто. могла б бути така комбінація: «решка», «орел», «решка», «решка», «решка» тощо. Один "орел" міг би випасти після будь-якого з 5 підкидань. Якою є ймовірність кожної з цих ситуацій? Імовірність випадання "орла" дорівнює 1/2. Потім можливість випадання «решки», що дорівнює 1/2, помножити на 1/2, на 1/2, на 1/2. Тобто. ймовірність кожної з цих ситуацій дорівнює 1/32. Так само, як і можливість ситуації, де Х=0. По суті, ймовірність будь-якого особливого порядку випадень «орла» та «решки» дорівнюватиме 1/32. Отже, ймовірність цього дорівнює 1/32. І ймовірність цього дорівнює 1/32. І ось такі ситуації мають місце тому, що «орел» міг би випасти за будь-якого з 5 підкидань. Отже, ймовірність те, що точно випаде один «орел», дорівнює 5*1/32, тобто. 5/32. Цілком логічно. Тепер починається цікаве. Яка ймовірність… (писатиму кожен із прикладів іншим кольором)… яка ймовірність того, що моя випадкова величина дорівнює 2? Тобто. я підкину монету 5 разів, і якою є ймовірність того, що 2 рази точно випаде «орел»? Це вже цікавіше, правда? Які можливі комбінації? Могла б бути "орел", "орел", "решка", "решка", "решка". Також могла бути «орел», «решка», «орел», «решка», «решка». І якщо подумати, що ці два «орли» можуть стояти у різних місцях комбінації, то можна трохи заплутатися. Вже не можна думати про розміщення так, як ми це робили тут, вгорі. Хоча… можна тільки ризикуєте заплутатися. Ви маєте зрозуміти одне. Для кожної з цих комбінацій ймовірність дорівнює 1/32. ½*½*½*½*½. Тобто. ймовірність кожної з цих комбінацій дорівнює 1/32. І ми маємо подумати над тим, скільки існує таких комбінацій, що задовольняють нашу умову (2 «орли»)? Тобто. по суті, потрібно уявити, що є 5 підкидань монети, і потрібно з них вибрати 2, за яких випадає «орел». Давайте уявимо, що наші 5 підкидань зібралися в кружальце, також уявімо, що у нас є лише два стільці. І ми кажемо: «Добре, хто з вас сяде на ці стільці для орлів? Тобто. хто з вас буде орлом? І нас не цікавить те, як вони сядуть. Я наводжу такий приклад, сподіваючись, що так вам буде зрозуміліше. І може, вам захочеться подивитися деякі уроки з теорії ймовірностей на цю тему, коли я говоритиму про біном Ньютона. Тому що там я більш детально заглиблюся у все це. Але якщо ви міркуватимете таким шляхом, то зрозумієте, що таке біноміальний коефіцієнт. Бо якщо думатимете так: добре, у мене 5 підкидань, при якому підкиданні випаде перший «орел»? Ну, тут 5 можливостей того, за якого за рахунком підкидання випаде перший «орел». А скільки можливостей для другого орла? Ну, перше підкидання, яке ми вже використовували, забрало можливість випадання «орла». Тобто. одна позиція «орла» у комбінації вже зайнята одним із підкидань. Тепер залишилося 4 підкидання, отже, другий «орел» може випасти за одного з 4 підкидань. І ви це бачили, ось тут. Я вибрала так, що «орел» випав при 1-му підкиданні, і припустила, що при 1 з 4 кидків, що залишилися, також повинен випасти «орел». Отже, тут лише 4 можливості. Все, що я говорю, означає, що для першого «орла» у вас є 5 різних позицій, на які він може випасти. А для другого вже залишається лише 4 позиції. Подумайте про це. Коли ми обчислюємо так, то порядок враховується. Але для нас зараз не має значення, в якій послідовності випадають «орли» та «решки». Ми не говоримо, що це орел 1 або що це орел 2. В обох випадках це просто орел. Ми могли б припустити, що це орел 1, а це орел 2. Або могло бути навпаки: це міг би бути другий «орел», а це – «перший». І я говорю це тому, що важливо зрозуміти, де використовувати розміщення, а де – поєднання. Нас не цікавить послідовність. Тож, власне, є лише 2 способи походження нашої події. Значить, ділимо це на 2. І як ви пізніше побачите, тут 2! способів походження нашої події Якби було 3 «орла», тоді тут було б 3!, і я покажу вам чому. Отже, це буде одно… 5*4=20 і розділити на 2 – вийде 10. Тому тут 10 різних комбінацій із 32, у яких у вас точно буде 2 «орли». Отже, 10*(1/32) дорівнює 10/32, а чому це одно? 5/16. Запишу через біноміальний коефіцієнт. Це значення, ось тут, вгорі. Якщо подумати, то це – те саме, що й 5!, поділений на… Що означає ось це 5*4? 5! - Це 5 * 4 * 3 * 2 * 1. Тобто. якщо мені тут потрібно лише 5*4, то для цього я можу поділити 5! на 3! Це одно 5*4*3*2*1, поділений на 3*2*1. І залишається лише 5*4. Значить, це те саме, що і цей чисельник. І потім, т.к. нас не цікавить послідовність, нам потрібно тут 2. Власне, 2! Помножити на 1/32. Такою була б ймовірність того, що в нас випало б точно 2 «орли». Яка ймовірність того, що у нас точно 3 рази випаде орел? Тобто. ймовірність того, що Х = 3. Отже, за тією ж логікою, перший випадок випадання «орла» може мати місце за 1 з 5 підкидань. Другий випадок випадання «орла» може мати місце при 1 з 4 підкидів, що залишилися. А третій випадок випадання «орла» може мати місце при 1 з 3 підкидів, що залишилися. А скільки існує різних способів розставити 3 підкидання? Загалом, скільки є способів, щоб розставити 3 предмети на місця? Це 3! І ви можете це вирахувати або, можливо, захочете переглянути ті уроки, в яких я докладніше це пояснювала. Але якщо ви, наприклад, візьмете літери A, B і C, то є 6 способів, за допомогою яких ви їх можете розставити. Можете розглядати це як випадки випадання орлів. Тут могли бути ACB, CAB. Може бути BAC, BCA, і… Який останній варіант, який я не назвала? CBA. Є 6 способів розставити 3 різні предмети. Ми ділимо на шість, тому що не хочемо повторно зараховувати ці шість різних способів, тому що розглядаємо їх як рівнозначні. Тут нас не цікавить, за якого за рахунком підкидання випаде «орел». 5*4*3… Це можна переписати, як 5!/2! І розділити це ще на 3! Це і є. 3! дорівнює 3*2*1. Трійки скорочуються. Це стає рівним 2. Це – рівним 1. Ще раз, 5*2, тобто. одно 10. Кожна ситуація має можливість 1/32, тому це знову одно 5/16. І це цікаво. Імовірність того, що у вас випаде 3 «орли» дорівнює ймовірності того, що у вас є 2 орли. І причина цього… Ну, є багато причин, що так вийшло. Але якщо подумати, що ймовірність того, що випаде 3 «орла» – те саме, що ймовірність випадання 2 «решічок». І ймовірність випадання 3 «решічок» має бути такою самою, як і ймовірність випадання 2-х «орлів». І добре, що значення ось так спрацьовують. Добре. Яка ймовірність того, що Х = 4? Ми можемо використовувати ту саму формулу, що використовували раніше. Це могло бути 5*4*3*2. Отже, тут запишемо 5 * 4 * 3 * 2 ... Скільки є різних способів розставити 4 предмети? Це 4! 4! - Це, по суті, ось ця частина, ось тут. Це 4*3*2*1. Так, це скорочується, залишається 5. Потім кожна комбінація має ймовірність 1/32. Тобто. це одно 5/32. І ще раз зауважте, що ймовірність того, що 4 рази випаде «орел», дорівнює ймовірності того, що 1 раз випаде «орел». І це є сенс, т.к. 4 «орла» – це те саме, що випадок випадання 1 «решки». Ви скажете: ну, і за якого ж підкидання випаде ця одна «решка»? Ага, для цього тут є 5 різних комбінацій. І кожна з них має можливість 1/32. І нарешті, яка ймовірність того, що Х = 5? Тобто. випадає "орел" 5 разів поспіль. Має бути так: «орел», «орел», «орел», «орел», «орел». Кожен із «орлів» має ймовірність 1/2. Ви їх перемножуєте та отримуєте 1/32. Можна піти іншим шляхом. Якщо всього є 32 способи, за допомогою яких ви можете отримати «орли» і «решки» у цих експериментах, це лише один із цих способів. Тут таких способів було 5 із 32. Тут – 10 із 32. Проте обчислення ми провели, а тепер готові намалювати розподіл ймовірностей. Але мій час минув. Дозвольте продовжити на наступному уроці. А якщо ви в настрої, то може намалюєте перед тим, як дивитися наступний урок? До скорої зустрічі!

У цій і кількох наступних нотатках ми розглянемо математичні моделі випадкових подій. Математична модель- це математичне вираз, що становить випадкову величину. Для дискретних випадкових величин цей математичний вираз відомий під назвою функція розподілу.

Якщо завдання дозволяє явно записати математичне вираз, що становить випадкову величину, можна обчислити точну ймовірність будь-якого її значення. У цьому випадку можна обчислити та перерахувати всі значення функції розподілу. У ділових, соціологічних та медичних додатках зустрічаються різноманітні розподіли випадкових величин. Одним із найкорисніших розподілів є біномне.

Біноміальний розподілвикористовується для моделювання ситуацій, що характеризуються такими особливостями.

  • Вибірка складається з фіксованого числа елементів n, що є результатами якогось випробування.
  • Кожен елемент вибірки належить одній із двох взаємовиключних категорій, які вичерпують весь вибірковий простір. Як правило, ці дві категорії називають успіх та невдача.
  • Ймовірність успіху рє постійною. Отже, ймовірність невдачі дорівнює 1 – р.
  • Вихід (тобто удача чи невдача) будь-якого випробування залежить від результату іншого випробування. Щоб гарантувати незалежність результатів, елементи вибірки зазвичай отримують за допомогою двох різних методів. Кожен елемент вибірки випадково витягується з нескінченної генеральної сукупності без повернення або з кінцевої генеральної сукупності з поверненням.

Завантажити нотатку у форматі або , приклади у форматі

Біноміальний розподіл використовується для оцінки кількості успіхів у вибірці, що складається з nспостережень. Розглянемо як приклад оформлення замовлень. Щоб зробити замовлення, клієнти компанії Saxon Company можуть скористатися інтерактивною електронною формою і надіслати її в компанію. Потім інформаційна система перевіряє, чи немає у замовленнях помилок, а також неповної чи недостовірної інформації. Будь-яке замовлення, що викликає сумніви, позначається та включається до щоденного звіту про виняткові ситуації. Дані, зібрані компанією, свідчать, що ймовірність помилок у замовленнях дорівнює 0,1. Компанія хотіла б знати, яка ймовірність виявити певну кількість помилкових замовлень у заданій вибірці. Наприклад, припустимо, що клієнти заповнили чотири електронні форми. Яка ймовірність, що всі замовлення виявляться безпомилковими? Як визначити цю можливість? Під успіхом розумітимемо помилку при заповненні форми, а всі інші результати вважатимемо невдачею. Нагадаємо, що нас цікавить кількість помилкових замовлень у заданій вибірці.

Які результати ми можемо спостерігати? Якщо вибірка складається з чотирьох замовлень, помилковими можуть виявитися одне, два, три чи всі чотири, крім того, всі вони можуть бути правильно заповненими. Чи може випадкова величина, що описує кількість неправильно заповнених форм, набувати будь-якого іншого значення? Це неможливо, оскільки кількість неправильно заповнених форм не може перевищувати обсяг вибірки nчи бути негативним. Таким чином, випадкова величина, що підпорядковується біноміальному закону розподілу, набуває значення від 0 до n.

Припустимо, що у вибірці із чотирьох замовлень спостерігаються такі результати:

Яка ймовірність виявити три помилкові замовлення у вибірці, що складається з чотирьох замовлень, причому у зазначеній послідовності? Оскільки попередні дослідження показали, що ймовірність помилки при заповненні форми дорівнює 0,10, ймовірності зазначених вище результатів обчислюються таким чином:

Оскільки результати не залежать один від одного, ймовірність зазначеної послідовності результатів дорівнює: р * р * (1-р) * р = 0,1 * 0,1 * 0,9 * 0,1 = 0,0009. Якщо необхідно обчислити кількість варіантів вибору X nелементів, слід скористатися формулою поєднань (1):

де n! = n * (n -1) * (n - 2) * ... * 2 * 1 - факторіал числа n, причому 0! = 1 та 1! = 1 за визначенням.

Цей вираз часто позначають як . Таким чином, якщо n = 4 і X = 3, кількість послідовностей, що складаються з трьох елементів, вилучених з вибірки, обсяг якої дорівнює 4, визначається за такою формулою:

Отже, ймовірність виявити три помилкові замовлення обчислюється так:

(Кількість можливих послідовностей) *
(ймовірність конкретної послідовності) = 4*0,0009 = 0,0036

Аналогічно можна обчислити ймовірність того, що серед чотирьох замовлень виявляться одне або два помилкові, а також ймовірність того, що всі замовлення помилкові або всі вірні. Однак при збільшенні обсягу вибірки nвизначити ймовірність конкретної послідовності результатів стає складніше. У цьому випадку слід застосувати відповідну математичну модель, яка описує біномний розподіл кількості варіантів вибору Xоб'єктів з вибірки, що містить nелементів.

Біномінальний розподіл

де Р(Х)- ймовірність Xуспіхів при заданих обсягах вибірки nта ймовірності успіху р, X = 0, 1, … n.

Зверніть увагу на те, що формула (2) є формалізацією інтуїтивних висновків. Випадкова величина X, що підпорядковується біноміальному розподілу, може набувати будь-якого цілого значення в діапазоні від 0 до n. твір рX(1 – р)nXє ймовірність конкретної послідовності, що складається з Xуспіхів у вибірці, обсяг якої дорівнює n. Величина визначає кількість можливих комбінацій, що складаються з Xуспіхів у nвипробуваннях. Отже, при заданій кількості випробувань nта ймовірності успіху рймовірність послідовності, що складається з Xуспіхів, дорівнює

Р(Х) = (кількість можливих послідовностей) * (ймовірність конкретної послідовності) =

Розглянемо приклади, що ілюструють застосування формули (2).

1. Припустимо, що можливість невірно заповнити форму дорівнює 0,1. Яка ймовірність того, що серед чотирьох заповнених форм три виявляться хибними? Використовуючи формулу (2), отримуємо, що ймовірність виявити три помилкові замовлення у вибірці, що складається з чотирьох замовлень, дорівнює

2. Припустимо, що можливість невірно заповнити форму дорівнює 0,1. Яка ймовірність того, що серед чотирьох заповнених форм не менше трьох виявляться хибними? Як показано в попередньому прикладі, ймовірність того, що серед чотирьох заповнених форм три виявляться помилковими, дорівнює 0,0036. Щоб обчислити ймовірність того, що серед чотирьох заповнених форм не менше трьох будуть неправильно заповнені, необхідно скласти ймовірність того, що серед чотирьох заповнених форм три виявляться помилковими, і ймовірність того, що серед чотирьох заповнених форм виявляться помилковими. Імовірність другої події дорівнює

Таким чином, ймовірність того, що серед чотирьох заповнених форм не менше трьох виявляться помилковими, дорівнює

Р(Х> 3) = Р(Х = 3) + Р(Х = 4) = 0,0036 + 0,0001 = 0,0037

3. Припустимо, що можливість невірно заповнити форму дорівнює 0,1. Яка ймовірність того, що серед чотирьох заповнених форм менше трьох виявляться хибними? Імовірність цієї події

Р(X< 3) = P(X = 0) + P(X = 1) + P(X = 2)

Використовуючи формулу (2), обчислимо кожну з цих ймовірностей:

Отже, Р(Х< 3) = 0,6561 + 0,2916 + 0,0486 = 0,9963.

Імовірність Р(Х< 3) можно вычислить иначе. Для этого воспользуемся тем, что событие X < 3 является дополнительным по отношению к событию Х>3. Тоді Р(Х< 3) = 1 – Р(Х> 3) = 1 – 0,0037 = 0,9963.

У міру збільшення обсягу вибірки nобчислення, аналогічні проведеним у прикладі 3, стають скрутними. Щоб уникати цих складнощів, багато біномних ймовірностей табулюють заздалегідь. Деякі з цих ймовірностей наведені на рис. 1. Наприклад, щоб отримати ймовірність, що Х= 2 при n= 4 та p= 0,1, слід витягти з таблиці число, яке стоїть на перетині рядка Х= 2 і стовпця р = 0,1.

Рис. 1. Біноміальна ймовірність при n = 4, Х= 2 і р = 0,1

Біноміальний розподіл можна обчислити за допомогою функції Excel=БІНОМ.РАСП() (рис. 2), що має 4 параметри: число успіхів - Х, Число випробувань (або обсяг вибірки) - n, ймовірність успіху – р, параметр інтегральна, Що приймає значення ІСТИНА (у цьому випадку обчислюється ймовірність не менше Хподій) або БРЕХНЯ (у цьому випадку обчислюється ймовірність точно Хподій).

Рис. 2. Параметри функції =БІНОМ.РАСП()

Для наведених вище трьох прикладів розрахунки наведені на рис. 3 (див. також файл Excel). У кожному стовпці наведено за однією формулою. Цифрами показано відповіді приклади відповідного номера).

Рис. 3. Розрахунок біномінального розподілу в Excel для n= 4 та p = 0,1

Властивості біномного розподілу

Біноміальний розподіл залежить від параметрів nі р. Біноміальний розподіл може бути як симетричним, так і асиметричним. Якщо р = 0,05, біномний розподіл є симетричним незалежно від величини параметра n. Однак, якщо р ≠ 0,05, розподіл стає асиметричним. Чим ближче значення параметра рдо 0,05 і чим більший обсяг вибірки n, Тим слабше виражена асиметрія розподілу. Таким чином, розподіл кількості неправильно заповнених форм зміщено вправо, оскільки p= 0,1 (рис. 4).

Рис. 4. Гістограма біномного розподілу при n= 4 та p = 0,1

Математичне очікування біномного розподілудорівнює добутку обсягу вибірки nна ймовірність успіху р:

(3) Μ = Е(Х) =np

У середньому, при досить довгій серії випробувань у вибірці, що складається з чотирьох замовлень, може бути р = Е(Х) = 4 х 0,1 = 0,4 неправильно заповнених форм.

Стандартне відхилення біномного розподілу

Наприклад, стандартне відхилення кількості невірно заповнених форм у бухгалтерській інформаційної системиодно:

Використовуються матеріали книги Левін та ін. Статистика менеджерів. - М.: Вільямс, 2004. - с. 307–313


Звичайно, при обчисленні кумулятивної функції розподілу слід скористатися згаданим зв'язком біномного та бета-розподілу. Цей спосіб наперед краще безпосереднього підсумовування, коли n > 10.

У класичних підручниках зі статистики для отримання значень біномного розподілу часто рекомендують використовувати формули, що ґрунтуються на граничних теоремах (типу формули Муавра-Лапласа). Необхідно відмітити, що з суто обчислювальної точки зоруЦінність цих теорем близька до нуля, особливо зараз, коли практично на кожному столі стоїть потужний комп'ютер. Основний недолік наведених апроксимацій – їх зовсім недостатня точність при значеннях n, характерних більшості додатків. Не меншим недоліком є ​​і відсутність скільки-небудь чітких рекомендацій щодо застосування тієї чи іншої апроксимації (у стандартних текстах наводяться лише асимптотичні формулювання, вони не супроводжуються оцінками точності і, отже, мало корисні). Я б сказав, що обидві формули придатні лише за n< 200 и для совсем грубых, ориентировочных расчетов, причем делаемых “вручную” с помощью статистических таблиц. А вот связь между биномиальным распределением и бета-распределением позволяет вычислять биномиальное распределение достаточно экономно.

Не розглядаю тут завдання пошуку квантилей: для дискретних розподілів вона тривіальна, а тих завданнях, де такі розподіли виникають, вона, зазвичай, і актуальна. Якщо ж кванти все-таки знадобляться, рекомендую так переформулювати завдання, щоб працювати з p-значеннями (спостереженими значущістю). Ось приклад: при реалізації деяких перебірних алгоритмів на кожному кроці потрібно перевіряти статистичну гіпотезу про біномну випадкову величину. Згідно з класичним підходом на кожному кроці потрібно обчислити статистику критерію та порівняти її значення з межею критичної множини. Оскільки, однак, алгоритм перебірний, доводиться визначати межу критичної множини щоразу заново (адже від кроку до кроку обсяг вибірки змінюється), що непродуктивно збільшує тимчасові витрати. Сучасний підхід рекомендує обчислювати спостережене значення і порівнювати її з довірчою ймовірністю, заощаджуючи на пошуку квантилей.

Тому в наведених нижче кодах відсутнє обчислення зворотної функції, натомість наведена функція rev_binomialDF , яка обчислює ймовірність p успіху в окремому випробуванні за заданою кількістю n випробувань, числу m успіхів у них і значення y ймовірності отримати ці m успіхів. При цьому використовується вищезгаданий зв'язок між біноміальним та бета-розподілом.

Фактично ця функція дозволяє отримувати межі довірчих інтервалів. Справді, припустимо, що у n біноміальних випробуваннях ми здобули m успіхів. Як відомо, ліва межа двостороннього довірчого інтервалу для параметра p з довірчим рівнем дорівнює 0, якщо m = 0, а є рішенням рівняння . Аналогічно, права межа дорівнює 1, якщо m = n, а є рішенням рівняння . Звідси випливає, що для пошуку лівого кордону ми маємо вирішувати щодо рівняння , а для пошуку правої – рівняння . Вони і вирішуються у функціях binom_leftCI та binom_rightCI , що повертають верхню та нижню межі двостороннього довірчого інтервалу відповідно.

Хочу зауважити, що якщо не потрібна зовсім неймовірна точність, то при досить великих n можна скористатися наступною апроксимацією [Б.Л. ван дер Варден, математична статистика. М: ІЛ, 1960, гол. 2, розд. 7]: , де g - квантиль нормального розподілу Цінність цієї апроксимації в тому, що є дуже прості наближення, що дозволяють обчислювати квантил нормального розподілу (див. текст про обчислення нормального розподілу та відповідний розділ даного довідника). У моїй практиці (в основному, при n > 100) ця апроксимація давала приблизно 3-4 знаки, чого, як правило, цілком достатньо.

Для обчислень за допомогою нижченаведених кодів будуть потрібні файли betaDF.h , betaDF.cpp (див. розділ про бета-розподіл), а також logGamma.h , logGamma.cpp (див. додаток А). Ви також можете подивитися приклад використання функцій.

Файл binomialDF.h

#ifndef __BINOMIAL_H__ #include "betaDF.h" double binomialDF(double trials, double successes, double p); /* * Нехай є "trials" незалежних спостережень * з ймовірністю "p" успіху в кожному. * Обчислюється ймовірність B(successes|trials,p) те, що число * успіхів укладено між 0 і "successes" (включно). */ double rev_binomialDF(double trials, double successes, double y); /* * Нехай відома ймовірність y настання не менше m успіхів * у trials випробуваннях схеми Бернуллі. Функція знаходить можливість p * успіху в окремому випробуванні. * * У обчисленнях використовується наступне співвідношення * * 1 - p = rev_Beta(trials-successes| successes+1, y). */ double binom_leftCI(double trials, double successes, double level); /* Нехай є "trials" незалежних спостережень * з ймовірністю "p" успіху в кожному * і кількість успіхів дорівнює "successes". * Обчислюється ліва межа двостороннього довірчого інтервалу * з рівнем значущості level. */ double binom_rightCI(double n, double successes, double level); /* Нехай є "trials" незалежних спостережень * з ймовірністю "p" успіху в кожному * і кількість успіхів дорівнює "successes". * Обчислюється правий кордон двостороннього довірчого інтервалу * з рівнем значущості level. */ #endif /* Ends #ifndef __BINOMIAL_H__ */

Файл binomialDF.cpp

/************************************************* **********/ /* Біноміальний розподіл */ /************************************* ***************************/ #include #include #include "betaDF.h" ENTRY double binomialDF(double n, double m, double p) /* * Нехай є "n" незалежних спостережень * з ймовірністю "p" успіху в кожному. * Обчислюється ймовірність B(m|n,p) те, що кількість успіхів укладено * між 0 і "m" (включно), тобто. * суму біномних ймовірностей від 0 до m: * * m * -- (n) j n-j * > () p (1-p) * -- (j) * j=0 * * Обчислення не мають на увазі тупе сумування - використовується * наступний зв'язок із центральним бета-розподілом: * * B(m|n,p) = Beta(1-p|n-m,m+1). * * Аргументи повинні бути позитивними, причому 0<= p <= 1. */ { assert((n >0) && (p >= 0) && (p<= 1)); if (m < 0) return 0; else if (m == 0) return pow(1-p, n); else if (m >= n) return 1; else return BetaDF(n-m, m+1).value(1-p); )/* binomialDF */ ENTRY double rev_binomialDF(double n, double m, double y) /* * Нехай відома ймовірність y настання не менше m успіхів * у n випробуваннях схеми Бернуллі. Функція знаходить можливість p * успіху в окремому випробуванні. * * У обчисленнях використовується наступне співвідношення * * 1 - p = rev_Beta(y|n-m, m+1). */ ( assert((n > 0) && (m >= 0) && (m<= n) && (y >= 0) && (y<= 1)); return 1-BetaDF(n-m, m+1).inv(y); }/*rev_binomialDF*/ ENTRY double binom_leftCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется левая граница двухстороннего доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0.5) && (y< 1)); return BetaDF(m, n-m+1).inv((1-y)/2); }/*binom_leftCI*/ ENTRY double binom_rightCI(double n, double m, double y) /* Пусть имеется "n" независимых наблюдений * с вероятностью "p" успеха в каждом * и количество успехов равно "m". * Вычисляется правая граница доверительного интервала * с уровнем значимости y. */ { assert((n >0) && (m >= 0) && (m<= n) && (y >= 0.5) && (y< 1)); return BetaDF(m+1, n-m).inv((1+y)/2); }/*binom_rightCI*/