Довірча можливість. Довірчий інтервал. Що це таке і як його можна використати? Що дає довірчий інтервал

Одним із методів вирішення статистичних завдань є обчислення довірчого інтервалу. Він використовується, як краща альтернатива точковій оцінці при невеликому обсязі вибірки. Слід зазначити, що процес обчислення довірчого інтервалу досить складний. Але інструменти програми Ексель дозволяють дещо спростити його. Давайте дізнаємось, як це виконується на практиці.

Цей метод використовується для інтервальної оцінки різних статистичних величин. Головне завдання даного розрахунку – позбавиться невизначеностей точкової оцінки.

У Екселі існують два основні варіанти зробити обчислення за допомогою даного методу: коли дисперсія відома і коли вона невідома. У першому випадку для обчислень застосовується функція ДОВЕРИТ.НОРМ, а в другому - ДОВЕРИТ.СТЮДЕНТ.

Спосіб 1: функція ДОВЕРИТ.НОРМ

Оператор ДОВЕРИТ.НОРМ, що відноситься до статистичної групи функцій, вперше з'явився в Excel 2010. У попередніх версіях цієї програми використовується його аналог ДОВЕРИТЬ. Завданням цього оператора є розрахунок довірчого інтервалу із нормальним розподілом для середньої генеральної сукупності.

Його синтаксис виглядає так:

ДОВЕРИТ.НОРМ (альфа; стандартне_відкл; розмір)

"Альфа"- аргумент, що вказує на рівень значущості, що застосовується для розрахунку довірчого рівня. Довірчий рівень дорівнює наступному виразу:

(1-«Альфа») * 100

"Стандартне відхилення"- Це аргумент, суть якого зрозуміла з найменування. Це стандартне відхилення запропонованої вибірки.

«Розмір»- Аргумент, що визначає величину вибірки.

Усі аргументи цього оператора є обов'язковими.

Функція ДОВЕРИТЬмає такі самі аргументи і можливості, що й попередня. Її синтаксис такий:

ДОВЕРИТ(альфа;стандартное_откл;размер)

Як бачимо, відмінності лише у найменуванні оператора. Зазначена функція з метою сумісності залишена в Excel 2010 та новіших версіях у спеціальній категорії "Сумісність". У версіях Excel 2007 і раніше вона присутня в основній групі статистичних операторів.

Кордон довірчого інтервалу визначається за допомогою формули наступного виду:

X+(-)ДОВЕРИТ.НОРМ

Де X– це середнє вибіркове значення, розташоване посередині обраного діапазону.

Тепер розглянемо, як розрахувати довірчий інтервал на конкретному прикладі. Було проведено 12 випробувань, внаслідок яких було отримано різні результати, занесені до таблиці. Це і є наша сукупність. Стандартне відхилення дорівнює 8. Нам потрібно розрахувати інтервал довіри при рівні довіри 97%.

  1. Виділяємо комірку, куди буде виводитися результат обробки даних. Клацаємо по кнопці "Вставити функцію".
  2. З'являється Майстер функцій. Переходимо до категорії «Статистичні»і виділяємо найменування «ДОВЕРИТ.НОРМ». Після цього клацаємо по кнопці "OK".
  3. Відкривається віконце аргументів. Його поля закономірно відповідають найменуванням аргументів.
    Встановлюємо курсор у перше поле – "Альфа". Тут слід вказати рівень значимості. Як ми пам'ятаємо, рівень довіри в нас дорівнює 97%. Водночас ми говорили, що він розраховується таким шляхом:

    (1-рівень довіри)/100

    Тобто, підставивши значення, отримуємо:

    Шляхом нехитрих розрахунків дізнаємось, що аргумент "Альфа"дорівнює 0,03 . Вводимо це значення у полі.

    Як відомо, за умовою стандартне відхилення одно 8 . Тому в полі "Стандартне відхилення"просто записуємо це число.

    В полі «Розмір»Необхідно запровадити кількість елементів проведених випробувань. Як ми пам'ятаємо, їх 12 . Але щоб автоматизувати формулу і не редагувати її щоразу під час проведення нового випробування, давайте задамо це значення не звичайним числом, а за допомогою оператора РАХУНОК. Отже, встановлюємо курсор у полі «Розмір», а потім клацаємо трикутник, який розміщений ліворуч від рядка формул.

    З'являється список функцій, що недавно застосовуються. Якщо оператор РАХУНОКзастосовувався вами недавно, то він має бути у цьому списку. У такому разі, потрібно просто натиснути на його найменування. В іншому випадку, якщо ви його не виявите, то переходьте по пункту «Інші функції…».

  4. З'являється вже знайомий нам Майстер функцій. Знову переміщуємося до групи «Статистичні». Виділяємо там найменування «РАХУНОК». Клацаємо по кнопці "OK".
  5. З'являється вікно аргументів вищезазначеного оператора. Ця функція призначена для того, щоб обчислювати кількість осередків у вказаному діапазоні, що містять числові значення. Синтаксис її наступний:

    РАХУНОК (значення1; значення2; ...)

    Група аргументів «Значення»є посилання на діапазон, в якому потрібно розрахувати кількість заповнених числовими даними осередків. Усього може налічуватися до 255 подібних аргументів, але у нашому випадку знадобиться лише один.

    Встановлюємо курсор у полі «Значення1»і, затиснувши ліву кнопку миші, виділяємо на аркуші діапазон, який містить нашу сукупність. Потім його адреса буде відображено у полі. Клацаємо по кнопці "OK".

  6. Після цього додаток здійснить обчислення і виведе результат у той осередок, де він знаходиться сам. У нашому конкретному випадку формула вийшла такою:

    ДОВЕРИТ.НОРМ (0,03; 8; РАХУНОК (B2: B13))

    Загальний результат обчислень склав 5,011609 .

  7. Але це ще не все. Як ми пам'ятаємо, межа довірчого інтервалу обчислюється шляхом складання та віднімання від середнього вибіркового значення результату обчислення ДОВЕРИТ.НОРМ. У такий спосіб розраховується відповідно права та ліва межа довірчого інтервалу. Саме середнє вибіркове значення можна розрахувати за допомогою оператора СРЗНАЧ.

    Цей оператор призначений для розрахунку середнього арифметичного значення вибраного діапазону чисел. Він має наступний досить простий синтаксис:

    СРЗНАЧ(число1; число2; ...)

    Аргумент «Число»може бути як окремим числовим значенням, так і посиланням на осередки або навіть цілі діапазони, що їх містять.

    Отже, виділяємо комірку, в яку виводитиметься розрахунок середнього значення, і клацаємо по кнопці "Вставити функцію".

  8. Відкривається Майстер функцій. Знову переходимо до категорії «Статистичні»та вибираємо зі списку найменування «СРЗНАЧ». Як завжди, клацаємо по кнопці "OK".
  9. Запускається вікно аргументів. Встановлюємо курсор у полі «Число1»і із затиснутою лівою кнопкою миші виділяємо весь діапазон значень. Після того, як координати відобразилися в полі, клацаємо по кнопці "OK".
  10. Після цього СРЗНАЧвиводить результат розрахунку елемент листа.
  11. Проводимо розрахунок правої межі довірчого інтервалу. Для цього виділяємо окремий осередок, ставимо знак «=» і складаємо вміст елементів аркуша, у яких розташовані результати обчислень функцій СРЗНАЧі ДОВЕРИТ.НОРМ. Для того, щоб виконати розрахунок, тиснемо на клавішу Enter. У нашому випадку вийшла така формула:

    Результат обчислення: 6,953276

  12. Таким же чином робимо обчислення лівої межі довірчого інтервалу, тільки цього разу від результату обчислення СРЗНАЧвіднімаємо результат обчислення оператора ДОВЕРИТ.НОРМ. Виходить формула для прикладу наступного типу:

    Результат обчислення: -3,06994

  13. Ми спробували докладно описати всі дії щодо обчислення довірчого інтервалу, тому детально розписали кожну формулу. Але можна всі події з'єднати в одній формулі. Обчислення правого кордону довірчого інтервалу можна записати так:

    СРЗНАЧ(B2:B13)+ДОВЕРИТ.НОРМ(0,03;8;РАХУНОК(B2:B13))

  14. Аналогічне обчислення лівої межі виглядатиме так:

    СРЗНАЧ(B2:B13)-ДОВЕРИТ.НОРМ(0,03;8;РАХУНОК(B2:B13))

Спосіб 2: функція ДОВЕРИТ.СТЮДЕНТ

Крім того, в Екселі є ще одна функція, пов'язана з обчисленням довірчого інтервалу. ДОВЕРИТ.СТЮДЕНТ. Вона з'явилася тільки з Excel 2010. Цей оператор виконує обчислення довірчого інтервалу генеральної сукупності з використанням розподілу Стьюдента. Його дуже зручно використовувати у тому випадку, коли дисперсія та, відповідно, стандартне відхилення невідомі. Синтаксис оператора такий:

ДОВЕРИТ.СТЬЮДЕНТ(альфа;стандартное_откл;размер)

Як бачимо, назви операторів і в цьому випадку залишилися незмінними.

Подивимося, як розрахувати межі довірчого інтервалу з невідомим стандартним відхиленням на прикладі тієї самої сукупності, що ми розглядали в попередньому способі. Рівень довіри, як і минулого разу, візьмемо 97%.

  1. Виділяємо осередок, в який проводитиметься розрахунок. Клацаємо по кнопці "Вставити функцію".
  2. У відкритому Майстри функційпереходимо до категорії «Статистичні». Вибираємо найменування «ДОВЕРИТ.СТЮДЕНТ». Клацаємо по кнопці "OK".
  3. Запуск вікна аргументів зазначеного оператора.

    В полі "Альфа", враховуючи, що рівень довіри становить 97%, записуємо число 0,03 . Вдруге на принципах розрахунку даного параметра зупинятись не будемо.

    Після цього встановлюємо курсор у полі "Стандартне відхилення". На цей раз цей показник нам невідомий і його потрібно розрахувати. Робиться це за допомогою спеціальної функції – СТАНДОТКЛОН.. Щоб викликати вікно даного оператора, клацаємо трикутник ліворуч від рядка формул. Якщо у списку не знаходимо потрібного найменування, то переходимо по пункту «Інші функції…».

  4. Запускається Майстер функцій. Переміщуємось у категорію «Статистичні»і відзначаємо у ній найменування «СТАНДОТКЛОН.В». Потім клацаємо по кнопці "OK".
  5. Відкриється вікно аргументів. Завданням оператора СТАНДОТКЛОН.є визначення стандартного відхилення під час вибірки. Його синтаксис виглядає так:

    СТАНДОТКЛОН.В(число1; число2; ...)

    Неважко здогадатися, що аргумент «Число»- Це адреса елемента вибірки. Якщо вибірка розміщена єдиним масивом, можна, використавши лише один аргумент, дати посилання даний діапазон.

    Встановлюємо курсор у полі «Число1»і, як завжди, затиснувши ліву кнопку миші, виділяємо сукупність. Після того, як координати потрапили в поле, не поспішаємо натискати на кнопку "OK", Оскільки результат вийде некоректним. Насамперед нам потрібно повернутися до вікна аргументів оператора ДОВЕРИТ.СТЮДЕНТ, щоб зробити останній аргумент. Для цього клацаємо за відповідним найменуванням у рядку формул.

  6. Знову відкривається вікно аргументів вже знайомої функції. Встановлюємо курсор у полі «Розмір». Знову тиснемо на вже знайомий нам трикутник для переходу до вибору операторів. Як ви зрозуміли, нам потрібне найменування «РАХУНОК». Оскільки ми використовували цю функцію при обчисленнях у попередньому способі, у цьому списку вона є, так що просто клацаємо по ній. Якщо ж ви її не виявите, то дійте за алгоритмом, описаним у першому способі.
  7. Потрапивши у вікно аргументів РАХУНОК, ставимо курсор у полі «Число1»і із затиснутою кнопкою миші виділяємо сукупність. Потім клацаємо по кнопці "OK".
  8. Після цього програма розраховує і виводить значення довірчого інтервалу.
  9. Для визначення меж нам потрібно буде розрахувати середнє значення вибірки. Але, враховуючи те, що алгоритм розрахунку за допомогою формули СРЗНАЧтой самий, що й у попередньому способі, і навіть результат не змінився, не будемо на цьому докладно зупинятись вдруге.
  10. Склавши результати обчислення СРЗНАЧі ДОВЕРИТ.СТЮДЕНТ, отримуємо правий кордон довірчого інтервалу
  11. Відібравши від результатів розрахунку оператора СРЗНАЧрезультат розрахунку ДОВЕРИТ.СТЮДЕНТ, маємо ліву межу довірчого інтервалу
  12. Якщо розрахунок записати однією формулою, то обчислення правого кордону в нашому випадку виглядатиме так:

    СРЗНАЧ(B2:B13)+ДОВЕРИТ.СТЬЮДЕНТ(0,03;СТАНДОТКЛОН.В(B2:B13);РАХУНОК(B2:B13))

  13. Відповідно, формула розрахунку лівої межі виглядатиме так:

    СРЗНАЧ(B2:B13)-ДОВЕРИТ.СТЬЮДЕНТ(0,03;СТАНДОТКЛОН.В(B2:B13);РАХУНОК(B2:B13))

Як бачимо, інструменти програми Excel дозволяють суттєво полегшити обчислення довірчого інтервалу та його меж. З цією метою використовуються окремі оператори для вибірок, які дисперсія відома і невідома.

Костянтин Кравчик дохідливо пояснює, що таке довірчий інтервал у медичних дослідженнях та як його використовувати

"Катрен-Стиль" продовжує публікацію циклу Костянтина Кравчика про медичну статистику. У попередніх статтях автор стосувався пояснення таких понять, як і .

Костянтин Кравчик

Математик-аналітик. Спеціаліст у галузі статистичних досліджень у медицині та гуманітарних науках

Місто Москва

Дуже часто в статтях з клінічних досліджень можна зустріти загадкове словосполучення: «довірчий інтервал» (95% ДІ або 95% CI - confidence interval). Наприклад, у статті може бути написано: «Для оцінки значущості відмінностей використовували t-критерій Стьюдента з розрахунком 95% довірчого інтервалу».

Якого ж значення «95% довірчого інтервалу» і навіщо його розраховувати?

Що таке інтервал довіри? - Це діапазон, у якому знаходяться справжні середні значення у генеральній сукупності. А що, бувають несправжні середні значення? У певному сенсі так, бувають. Ми пояснювали, що неможливо виміряти цікавий параметр у всій генеральній сукупності, тому дослідники задовольняються обмеженою вибіркою. У цій вибірці (наприклад, за масою тіла) є одне середнє значення (певна вага), яким ми й судимо про середнє значення у всій генеральній сукупності. Однак навряд чи середня вага у вибірці (особливо невелика) збігається із середньою вагою в генеральній сукупності. Тому більш правильно розраховувати та користуватися діапазоном середніх значень генеральної сукупності.

Наприклад, уявимо, що 95% довірчий інтервал (95% ДІ) по гемоглобіну становить від 110 до 122 г/л. Це означає, що з ймовірністю 95% справжнє середнє значення по гемоглобіну в генеральній сукупності перебуватиме в межах від 110 до 122 г/л. Іншими словами, ми не знаємо середній показник гемоглобіну в генеральній сукупності, але можемо з 95% ймовірністю вказати діапазон значень для цієї ознаки.

Довірчий інтервал особливо доречний для різниці середніх значеннях між групами або, як це називають, у розмірі ефекту.

Допустимо, ми порівнювали ефективність двох препаратів заліза: давно присутнього на ринку і щойно зареєстрованого. Після курсу терапії оцінили концентрацію гемоглобіну в досліджуваних групах пацієнтів, і статистична програма нам порахувала, що різниця між середніми значеннями двох груп з ймовірністю 95% знаходиться в діапазоні від 1,72 до 14,36 г/л (табл. 1).

Табл. 1. Критерій для незалежних вибірок
(порівнюються групи за рівнем гемоглобіну)

Трактувати це слід так: у частини пацієнтів генеральної сукупності, яка приймає новий препарат, гемоглобін буде вищим у середньому на 1,72–14,36 г/л, ніж у тих, хто приймав уже відомий препарат.

Іншими словами, в генеральній сукупності різниця в середніх значеннях по гемоглобіну у груп з 95% ймовірністю знаходиться в цих межах. Судити, чи багато це чи мало, буде вже дослідник. Сенс цього в тому, що ми працюємо не з одним середнім значенням, а з діапазоном значень, отже, ми більш достовірно оцінюємо різницю за параметром між групами.

У статистичних пакетах, на розсуд дослідника, можна самостійно звужувати чи розширювати межі довірчого інтервалу. Знижуючи ймовірність довірчого інтервалу, ми звужуємо діапазон середніх. Наприклад, при 90% ДІ діапазон середніх (або різниці середніх) буде вже, ніж при 95%.

І навпаки, збільшення ймовірності до 99% розширює діапазон значень. При порівнянні груп нижня межа ДІ може перетнути нульову позначку. Наприклад, якщо ми розширили межі довірчого інтервалу до 99%, то межі інтервалу розташувалися від –1 до 16 г/л. Це означає, що у генеральної сукупності є групи, відмінність середніх між якими за досліджуваним ознакою дорівнює 0 (М=0).

З допомогою довірчого інтервалу можна перевіряти статистичні гіпотези. Якщо довірчий інтервал перетинає нульове значення, то нульова гіпотеза, яка передбачає, що групи не відрізняються за параметром, що вивчається, правильна. Приклад описаний вище, коли ми розширили межі до 99%. Десь у генеральній сукупності у нас знайшлися групи, які не відрізнялися.

95% довірчий інтервал різниці по гемоглобіну, (г/л)


На малюнку у вигляді лінії зображено 95% довірчий інтервал різниці середніх значень по гемоглобіну між двома групами. Лінія проходить нульову позначку, отже, має місце різниця між середніми значеннями, що дорівнює нулю, що підтверджує нульову гіпотезу про те, що групи не відрізняються. Діапазон різниці між групами лежить від -2 до 5 г/л, Це означає, що гемоглобін може знизитися на 2 г/л, так і підвищитися на 5 г/л.

Довірчий інтервал – дуже важливий показник. Завдяки йому можна подивитися, чи були відмінності в групах дійсно за рахунок різниці середніх або за рахунок великої вибірки, тому що при великій вибірці шанси знайти відмінності більше, ніж за малої.

Насправді це може виглядати так. Ми взяли вибірку в 1000 чоловік, виміряли рівень гемоглобіну та виявили, що довірчий інтервал різниці середніх лежить від 1,2 до 1,5 г/л. Рівень статистичної значущості у своїй p

Ми, що концентрація гемоглобіну підвищилася, але майже непомітно, отже, статистична значимість з'явилася саме рахунок обсягу вибірки.

Довірчий інтервал може бути вирахований як для середніх значень, але й пропорцій (і відносин ризиків). Наприклад, нас цікавить довірчий інтервал пропорцій пацієнтів, які досягли ремісії, приймаючи розроблені ліки. Припустимо, що 95% ДІ для пропорцій, тобто для частки таких пацієнтів, лежить в межах 0,60-0,80. Таким чином, ми можемо сказати, що наші ліки надають терапевтичний ефект від 60 до 80% випадків.

Довірчий інтервал прийшов до нас із галузі статистики. Це певний діапазон, який слугує для оцінки невідомого параметра з високим ступенем надійності. Найпростіше це пояснити на прикладі.

Припустимо, слід досліджувати якусь випадкову величину, наприклад, швидкість відгуку сервера на запит клієнта. Щоразу, коли користувач набирає адресу конкретного сайту, сервер реагує на це з різною швидкістю. Таким чином, час відгуку, що досліджується, має випадковий характер. Так ось, довірчий інтервал дозволяє визначити межі цього параметра, і потім можна буде стверджувати, що з ймовірністю 95% сервера буде знаходитися в розрахованому нами діапазоні.

Або потрібно дізнатися, якій кількості людей відомо про торгову марку фірми. Коли буде підрахований довірчий інтервал, можна буде, наприклад, сказати що з 95% часткою ймовірності частка споживачів, знають про цю перебуває у діапазоні від 27% до 34%.

З цим терміном тісно пов'язана така величина як довірча ймовірність. Вона є ймовірністю того, що шуканий параметр входить у довірчий інтервал. Від цієї величини залежить те, наскільки більшим виявиться наш діапазон. Чим більше значення вона набуває, тим стає довірчий інтервал, і навпаки. Зазвичай її встановлюють рівним 90%, 95% або 99%. Величина 95% найпопулярніша.

На цей показник також впливає дисперсія спостережень і Його визначення ґрунтується на тому припущенні, що досліджувана ознака підкоряється. Це твердження відоме також як Закон Гауса. Відповідно до нього, нормальним називається такий розподіл всіх ймовірностей безперервної випадкової величини, який можна описати густиною ймовірностей. Якщо припущення про нормальний розподіл виявилося помилковим, то оцінка може бути неправильною.

Спочатку розберемося з тим, як обчислити довірчий інтервал. Тут можливі два випадки. Дисперсія (ступінь розкиду випадкової величини) може бути відома чи ні. Якщо вона відома, то наш довірчий інтервал обчислюється за допомогою наступної формули:

хср - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - ознака,

t - параметр таблиці розподілу Лапласа,

σ – квадратний корінь дисперсії.

Якщо дисперсія невідома, її можна розрахувати, якщо нам відомі всі значення шуканої ознаки. Для цього використовується така формула:

σ2 = х2ср - (хср)2 де

х2ср - середнє значення квадратів досліджуваного ознаки,

(ХСР)2 - квадрат даної ознаки.

Формула, за якою в цьому випадку розраховується довірчий інтервал, трохи змінюється:

хср - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

хср - вибіркове середнє,

α - ознака,

t - параметр, який знаходять за допомогою таблиці розподілу Стьюдента t = t(?;n-1),

sqrt(n) - квадратний корінь загального обсягу вибірки,

s – квадратний корінь дисперсії.

Розглянь такий приклад. Припустимо, що за результатами 7 вимірів була визначена досліджуваного ознаки, що дорівнює 30 і дисперсія вибірки, що дорівнює 36. Потрібно знайти з ймовірністю 99% довірчий інтервал, який містить справжнє значення параметра, що вимірюється.

Спочатку визначимо чому t: t = t (0,99; 7-1) = 3.71. Використовуємо наведену вище формулу, отримуємо:

хср - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3.71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Довірчий інтервал дисперсії розраховується як у випадку з відомим середнім, так і тоді, коли немає жодних даних про математичне очікування, а відомо лише значення точкової незміщеної оцінки дисперсії. Ми не будемо наводити тут формули його розрахунку, тому що вони досить складні і за бажання їх завжди можна знайти в мережі.

Відзначимо лише, що довірчий інтервал зручно визначати за допомогою програми Excel або мережевого сервісу, який так і називається.

Імовірність того, що справжнє значення вимірюваної величини лежить усередині деякого інтервалу, називається довірчою ймовірністю , або коефіцієнтом надійності, а сам інтервал - довірчим інтервалом.

Кожній вірогідності відповідає свій довірчий інтервал. Зокрема, вірогідності 0,67 відповідає довірчий інтервал від до . Однак це твердження справедливе тільки при досить великій кількості вимірювань (більше 10), та й ймовірність 0,67 не є достатньо надійною - приблизно в кожній із трьох серій вимірювань yможе бути поза довірчого інтервалу. Для отримання більшої впевненості в тому, що значення вимірюваної величини лежать усередині довірчого інтервалу, зазвичай задаються вірогідністю 0,95 - 0,99. Довірчий інтервал для заданої довірчої ймовірності з урахуванням впливу кількості вимірювань nможна знайти, помноживши стандартне відхилення середнього арифметичного

.

так званий коефіцієнт Стьюдента. Коефіцієнти Стьюдента для низки значень та nнаведено у таблиці.

Таблиця - Коефіцієнти Стьюдента

Число вимірів n Довірча ймовірність y
0,67 0,90 0,95 0,99
2,0 6,3 12,7 63,7
1,3 2,4 3,2 5,8
1,2 2,1 2,8 4,6
1,2 2,0 2,6 4,0
1,1 1,8 2,3 3,3
1,0 1,7 2,0 2,6

Остаточно, для вимірюваної величини yпри заданій довірчій ймовірності y та числі вимірювань nвиходить умова

Величину ми називатимемо випадковою похибкою величини y.

Приклад: див. лекцію №5 – ряд чисел.

Визначимо

При числі вимірів – 45 і довірчої ймовірності – 0,95 отримаємо, що коефіцієнт Стьюдента приблизно дорівнює 2,15. Тоді довірчий інтервал для цього ряду вимірювань дорівнює 62,6.

Промахи (груба похибка) -грубі похибки, пов'язані з помилками оператора або неврахованими зовнішніми впливами. Їх зазвичай виключають із результатів вимірювань. Промахи, зазвичай, викликаються неуважністю. Вони можуть також виникати внаслідок несправності приладу.

Довірчий інтервал– граничні значення статистичної величини, яка із заданою довірчою ймовірністю γ буде в цьому інтервалі при вибірці більшого обсягу. Позначається як P(θ - ε. На практиці вибирають довірчу ймовірність γ з досить близьких до одиниці значень γ = 0.9, γ = 0.95, γ = 0.99.

Призначення сервісу. За допомогою цього сервісу визначаються:

  • довірчий інтервал для генерального середнього; довірчий інтервал для дисперсії;
  • довірчий інтервал для середнього квадратичного відхилення; довірчий інтервал для генеральної частки;
Отримане рішення зберігається у файлі Word. Нижче наведено відеоінструкцію, як заповнювати вихідні дані.

Приклад №1. У колгоспі із загального стада у 1000 голів овець вибірковій контрольній стрижці зазнали 100 овець. В результаті було встановлено середній настриг вовни 4,2 кг на одну вівцю. Визначити з ймовірністю 0,99 середню квадратичну помилку вибірки щодо середнього настригу шерсті однією вівцю і межі, у яких укладено величина настрига, якщо дисперсія дорівнює 2,5 . Вибірка неповторна.
Приклад №2. З партії імпортованої продукції посаді Московської Північної митниці було взято як випадкової повторної вибірки 20 проб продукту «А». В результаті перевірки встановлена ​​середня вологість продукту «А» у вибірці, яка дорівнювала 6 % при середньому квадратичному відхиленні 1 %.
Визначте із ймовірністю 0,683 межі середньої вологості продукту у всій партії імпортованої продукції.
Приклад №3. Опитування 36 студентів показало, що середня кількість підручників, прочитаних ними за навчальний рік, дорівнювала 6. Вважаючи, що кількість підручників, прочитаних студентом за семестр, має нормальний закон розподілу із середнім квадратичним відхиленням, рівним 6, знайти: А) з надійністю 0 ,99 інтервальну оцінку для математичного очікування цієї випадкової величини; Б) з якою ймовірністю можна стверджувати, що середня кількість підручників, прочитаних студентом за семестр, обчислене за даною вибіркою, відхилиться від математичного очікування за абсолютною величиною не більше ніж на 2.

Класифікація довірчих інтервалів

На вигляд оцінюваного параметра:

За типом вибірки:

  1. Довірчий інтервал для безкінечної вибірки;
  2. Довірчий інтервал для кінцевої вибірки;
Вибірка називається повторноюякщо відібраний об'єкт перед вибором наступного повертається в генеральну сукупність. Вибірка називається безповторноюякщо відібраний об'єкт у генеральну сукупність не повертається. Насправді зазвичай мають справу з безповторними вибірками.

Розрахунок середньої помилки вибірки при випадковому доборі

Розбіжність між значеннями показників, отриманих за вибіркою, та відповідними параметрами генеральної сукупності називається помилкою репрезентативності.
Позначення основних параметрів генеральної та вибіркової сукупності.
Формули середньої помилки вибірки
повторний відбірбезповторний відбір
для середньоїдля часткидля середньоїдля частки
Співвідношення між межею помилки вибірки (Δ), що гарантується з деякою ймовірністю Р(t),та середньою помилкою вибірки має вигляд: або Δ = t·μ, де t- Коефіцієнт довіри, що визначається залежно від рівня ймовірності Р(t) по таблиці інтегральної функції Лапласа.

Формули розрахунку чисельності вибірки при власне-випадковому способі відбору

Спосіб відборуФормули визначення чисельності вибірки
для середньоїдля частки
Повторний
Безповторний
Знайти чисельність вибірки можна за допомогою калькулятора.

Метод довірчих інтервалів

Алгоритм знаходження довірчого інтервалу включає такі кроки:
  1. задається довірча ймовірність γ (надійність).
  2. за вибіркою визначається оцінка параметра a.
  3. із співвідношення P(α 1 розраховується довірчий інтервал (a - ε ; a + ε).

Приклад №1. При перевірці придатності партії таблеток (250 шт.) виявилося, що середня вага таблетки 0,3 г, а СКО ваги 0,01 г. Знайти довірчий інтервал, у який із ймовірністю 90% потрапляє норма ваги таблетки.
Рішення.

Приклад. За результатами вибіркового спостереження (вибірка Додаток) обчисліть незміщені оцінки середнього значення, дисперсії та середнього квадратичного відхилення генеральної сукупності.
Завантажити рішення

Приклад. Знайдіть довірчі інтервали для оцінки середнього значення та середнього квадратичного відхилення генеральних сукупностей за довірчої ймовірності y, якщо з генеральних сукупностей зроблена вибірка В та y.
Завантажити рішення

Приклад.

1. Використовуючи результати розрахунків, виконаних у завданні № 2 та вважаючи, що ці дані отримані за допомогою власне-випадкового 10-ти процентного безповторного відбору, визначити:
а) межі, за які з довірчою ймовірністю 0,954 не вийде середнє значення ознаки, розраховане за генеральною сукупністю;
б) як слід змінити обсяг вибірки, щоб знизити граничну помилку середньої величини на 50%.
2. Використовуючи результати розрахунків, виконаних у завданні № 2 та вважаючи, що ці дані отримані за допомогою повторного відбору, визначити:
а) межі, за які у генеральній сукупності не вийде значення частки підприємств, у яких індивідуальні значення ознаки перевищують моду з довірчою ймовірністю 0,954;
б) як змінити обсяг вибірки, щоб знизити граничну помилку частки на 20%.
Методичні вказівки

Завдання. Поточна лінія з виробництва однотипних деталей піддавалася реконструкції Задано дві вибірки, що відображають відсоток шлюбу в партіях деталей, що випускаються на даній лінії, до і після реконструкції Чи можна достовірно стверджувати, що після реконструкції відсоток шлюбу в партіях деталей знизився?

Приклад. Нижче наведено дані щодо витрат на буріння (у.о.) для 49 свердловин Західно-Сибірської нафтової бази Росії:

129 142 132 61 96 96 142 17 135 32
77 58 37 132 79 15 145 64 83 120
11 54 48 100 43 25 67 25 140 130
48 124 29 107 135 101 93 147 112 121
89 97 60 84 46 139 43 145 29
З метою оцінки витрат на буріння нової свердловини:
  1. провести вибірку власне випадковим способом обсягом n = 5;
  2. визначити інтервальні значення середньої генеральної сукупності (X) за розрахованими вибірковими показниками (X, s 2) за допомогою функції t-розподілу Стьюдента при рівні значущості α=0.05;
  3. визначити точкове значення середньої генеральної сукупності (X) за вихідними даними;
  4. оцінити правильність інтервальних розрахунків, порівнюючи точкове значення (X) з інтервальним значенням, розрахованим на вибірку;
Рішенняпроводимо за допомогою цього калькулятора:

1. Вибираємо 5 значень із таблиці. Нехай це буде 3 стовпець: 132, 37, 48, 29, 60.
В розділі "Вигляд статистичного ряду"обираємо Дискретний ряд. У полі Кількість рядків указуємо 5.

2. Вводимо вихідні дані.

У полі Кількість груп вибираємо пункт « не робити угруповання».

Поле «Довірчий інтервал генерального середнього, дисперсія та середньоквадратичне відхилення» вказуємо значення γ = 0.95 (що відповідає α=0.05).

У полі «Вибірка» вказуємо значення 10 (оскільки 49 значень вибрали 5, що відповідає 10,2% (5/49x100%)).

В розділі «Виводить у звіт»відзначаємо перший пункт "Довірчий інтервал для генерального середнього".

3. Отримане рішення зберігається у форматі Word (завантажити).
Перед розрахунками створюється попередня таблиця, у якій підраховується кількість повторень значень Х.

x(x - x ср) 2
29 1036.84
37 585.64
48 174.24
60 1.44
132 5012.64
306 6810.8
У разі всі значення X зустрічаються рівно один раз. Інтервальні значення середньої генеральної сукупності розраховуються у розділі « Інтервальне оцінювання центру генеральної сукупності».
Примітка: у даному випадку у розрахунках використовується Оцінка середньоквадратичного відхилення.

Завдання №2: З метою вивчення витрат часу на виготовлення однієї деталі робітниками заводу проведено 10%-ву випадкову безповторну вибірку, в результаті якої отримано розподіл деталей за витратами часу, представлене в дод. Б.
На підставі цих даних обчисліть:
а) середні витрати часу виготовлення однієї деталі;
б) середній квадрат відхилень (дисперсію) та середнє квадратичне відхилення;
в) коефіцієнт варіації;
г) з ймовірністю 0,954 граничну помилку вибіркової середньої та можливі межі, в яких очікуються середні витрати часу на виготовлення однієї деталі на заводі;
д) з ймовірністю 0,954 граничну помилку вибіркової частки та межі частки кількості деталей з мінімальними витратами часу на їх виготовлення. Перед тим як проводити розрахунки, необхідно записати умови завдання та заповнити табл. 2.1

Рішення.
Для отримання рішення вказуємо такі параметри:

  • Вид статистичного ряду: Задано дискретний ряд;
  • Кількість груп: не робити угруповання;
  • Для побудови довірчого інтервалу генерального середнього, дисперсії та середньоквадратичного відхилення: y = 0.954;
  • Для побудови довірчого інтервалу генеральної частки: y = 0.954;
  • Вибірка: 10;
  • Виводити на звіт: Довірчий інтервал для генерального середнього, Довірчий інтервал для генеральної частки;

Завдання №3: Використовуючи результати розрахунків, виконаних у завданні №2 та вважаючи, що ці дані отримані за допомогою повторного відбору, визначити:

б) як змінити обсяг вибірки, щоб знизити граничну помилку частки на 20%.

Рішення.
Використовуючи результати розрахунків, виконаних у завданні № 2 та вважаючи, що ці дані отримані за допомогою повторного відбору, визначити:
а) межі, за які у генеральній сукупності не вийде значення частки підприємств, у яких індивідуальні значення ознаки перевищують моду з довірчою ймовірністю 0.954;
б) як змінити обсяг вибірки, щоб зменшити граничну помилку частки на 20%.

Завдання №4: З партії електроламп взята 20% випадкова безповторна вибірка для визначення середньої ваги спіралі. Результати вибірки такі. Вага, мг: 38-40; 40-42; 42-44; 44-46. Число спіралей:15;30;45;10. Визначити з ймовірністю 0.95 довірчі межі, в яких лежить середня вага спіралі, для всієї партії електроламп.

Рішення.
Вводимо такі параметри:

  • Вигляд статистичного ряду: Задано інтервальний ряд;
  • Для побудови довірчого інтервалу генерального середнього, дисперсії та середньоквадратичного відхилення: y = 0.95;
  • Вибірка: 20;
  • Виводити на звіт: Довірчий інтервал для генерального середнього.

Завдання №5: На заводі електроламп із партії продукції в кількості 16000 шт. ламп взято на вибірку 1600 прим. (Випадковий, безповторний відбір), з яких 40 шт. виявилися бракованими. Визначити з ймовірністю 0.997 межі, у яких перебуватиме відсоток шлюбу всієї партії продукції.

Рішення.
Тут N = 16000, n = 1600, w = d/n = 40/1600 = 0.025.

Поділитися