|
Ниже дано решение задачи на нахождение дисперсии альтернативного признака. Если же хотите сразу посмотреть нужную формулу - сразу перейдите к формуле дисперсии альтернативного признака.
Задача. За даними інституту досліджень організованого ринку у середньому в 30% форвардних біржових угод порушувались зобов’язання. Визначити дисперсію частки біржових угод, зобов’язання яких порушувались. Відповідь обґрунтуйте. | Задача. По данным института исследований организованного рынка, в среднем в 30% форвардных биржевых соглашений нарушались обязательства. Определить дисперсию части биржевых соглашений, обязательства которых нарушались. Ответ обоснуйте. |
Решение.
Поскольку данные представляют собой простой ряд, то для вычисления значения дисперсии нужно применить формулу простой дисперсии.
Поскольку размер выборки нам неизвестен, то используем процентные (долевые) вычисления.
Тогда:
Размер выборки будет равен единице (100%) n = 1
Если условия контракта нарушались, то значение конкретного элемента ряда принимаем равным единице.
Тогда, если условия контракта не нарушались, значение элемента принимаем равным нулю.
Откуда среднее значение ряда равно:
( 0,3 х 1 + 0,7 х 0 ) / 1 = 0, 3
Пояснение. 30% значений ряда равно единице, 70% нулю. Разумеется, среднее значение и будет равно 0,3.
| Оскільки розмір вибірки нам невідомий, то використовуємо процентні (пайові) обчислення.
Тоді:
Розмір вибірки дорівнюватиме одиниці (100%) n = 1
Якщо умови контракту порушувалися, то значення конкретного елементу ряду набуваємо рівним одиниці.
Тоді, якщо умови контракту не порушувалися, значення елементу набуваємо рівним нулю.
Звідки середнє значення ряду рівне:
( 0,3 х 1 + 0,7 х 0 ) / 1 = 0, 3
Пояснення. 30% значень ряду дорівнює одиниці, 70% нулю. Зрозуміло, середнє значення і буде рівне 0,3.
|
Теперь нам нужно найти сумму квадратов разностей для всех значений ряда. Поскольку, элементы статистического ряда принимают только значения 0 и 1, то случаев у нас будет два:
( 0 - 0,3 ), если условия контракта не нарушались
( 1 - 0,3 ), если условия контракта нарушались
Зная удельное количество элементов из условия задачи, вычислим дисперсию:
( 0,7 х ( 0 - 0,3 )2 + 0,3 x ( 1 - 0,3 )2 ) / 1 = 0,21
в более привычном виде:
| Тепер нам потрібно знайти суму квадратів різниць для всіх значень ряду. Оскільки, елементи статистичного ряду набувають лише значень 0 і 1, то випадків у нас буде два:
( 0 - 0,3 ), якщо умови контракту не порушувалися
( 1 - 0,3 ), якщо умови контракту порушувалися
Знаючи питому кількість елементів з умови завдання, обчислимо дисперсію:
( 0,7 х ( 0 - 0,3 ) 2 + 0,3 x ( 1 - 0,3 ) 2 ) / 1 = 0,21
в звичнішому вигляді: |
Ответ: 0,21
Формула дисперсии альтернативного признака
Исходя из изложенного выше, можно вывести формулу нахождения дисперсии альтернативного признака, если нам известна процентная доля такого признака в общем объеме выборки.
Изначально мы предполагаем, что признак принимает только два значения.
Таким образом, сумма доли элементов, в которых элементы статистического ряда имеют значение признака "нет" и элементов ряда, которые имеют значение признака "да" - равно единице. См. первую формулу.
Для нахождения среднего значения ряда, подставим значения альтернативных признаков ( 0 и 1 ) в формулу нахождения среднего взвешенного значения статистического ряда. Откуда, совершенно очевидно, в знаменателе будет единица, а в числителе - процентное значение элементов "1". То есть ровно процентное значение элементов с признаком "1". (Формула 2)
Формула дисперсии - это средневзвешенное значение квадратов отклонений каждого значения ряда данных. (Формула 3)
Поскольку в нашем ряду данные имеют только два типа значений - "0" и "1", то формула нахождения дисперсии для ряда, имеющего альтернативный признак сводится к Формуле 4.
Пояснение. поскольку мы только что вывели, что среднее значение выборки равно р (Формула 2), то значение квадрата разности значения (0/1) и среднего значения, согласно Формулы 1, будет в первом случае (1-p)2 , а во втором случае (1-q)2 , теперь, применив следствие из первой формулы: q = 1 - p, p = 1- q . Получим p2 и q2 . Соответственно, доля значений "0" и "1" равна p и q, в результате в числителе и получается q2 p и p2 q. Сумма долей признаков значений "0" и "1" согласно Формуле 1 равна 1. В итоге Формула 4 и принимает значение pq, которое и будет равно значению дисперсии альтернативного признака.
Исходя из найденного значения величины дисперсии альтернативного признака, найдем среднеквадратичное отклонение (Формула 5). Поставив значение из Формулы 1 в Формулу 5, получим формулу среднеквадратичного отклонения для дисперсии ряда с альтернативным признаком.
Статистическое распределение выборки |
Описание курса
| Межгрупповая дисперсия
|