«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ ДОНЕЦКИЙ НАЦИОНАЛЬНЫЙ УНИВЕРСИТЕТ ...»
Рассчитываем следующие абсолютные показатели вариации: размах вариации (R); среднее линейное отклонение (), дисперсию () и среднее квадратическое отклонение(). 60 – 0= = 60 (млн. грн.) Размер отклонений величины максимальной прибыли от минимальной по всей совокупности банков составляет 60 млн.грн.
Для расчета и определим средний размер прибыли по всей совокупности банков.
млн.грн; млн.грн.
Индивидуальные размеры прибыли в среднем по всей совокупности банков отклонялись в ту и другую сторону от своего среднего значения на 10,95 млн. грн.
Дисперсию определим двумя способами:
- по формуле среднего квадрата отклонений = = 233,44
- по формуле “разности средних”:
- (31,25) 2 = 1210 – 976,56 = 233,44.
Среднее квадратическое отклонение: млн.грн.
Размеры прибыли каждого из 200 банков отклонялись в ту и другую сторону от среднего значения на 15,28 млн. грн.
Определим теперь относительные показатели вариации:
- коэффициент осцилляции: ;
- относительное линейное отклонение: %;
- коэффициент вариации:
Анализируемый вариационный ряд распределения банков по размеру прибыли является статистически неоднородным, так как коэффициент вариации больше 33%. Об этом свидетельствует другие показатели вариации, например, коэффициент осциляции показывает, что разность между крайними значениями признака почти в 2 раза больше (или 192 %) их среднего значения.
Среднее значение показателя прибыли по данной совокупности банков ( тыс.грн) не является надежной или типической ее характеристикой.
Пример 3. Распределение семей по среднедушевым доходам следующее (таблица 5.4). 1. Определите: а) структурные характерис-тики распределения семей по размеру среднедушевого дохода; б) показатели формы и дифференциации распределения. 2. Проверьте статистическую гипотезу о соответствии эмпирического распределе-ния нормальному. 3. Постройте график эмпирического и теоретичес-кого распределения семей по размеру среднедушевого дохода.
Решение
1а. Определяем структурные характеристики ряда распределе-ния, т.е. моду медиану, квартили, децили по рассмотренным выше формулам этих характеристик для интервальных вариационных рядов.
Для выбора соответствующего интервала предварительно опре-делим накопленные частоты , (табл. 5.4, гр. 4).
Модальный интервал – это интервал с наибольшей частотой , тогда грн.
Большинство семей имеют среднедушевые доходы в размере 196,67 грн. Медианным является интервал , т.к. для него первая накопленная частота больше половины объема совокупности, т.е. 120>100. Тогда медиана будет равна: грн.
Половина семей имеют среднедушевые доходы, не превышаю-щие доходы 202 грн., а у другой половины семей среднедушевые доходы, соответственно, выше 202 грн.
Интервал, в котором будет находиться первый квартиль() рас-пределения, , т.к. ему соответствует первая накопленная час-тота , большая ; а интервал, в котором находится третий квартиль(), будет, т.к. ему соответствует > .
Тогда соответствующие квартили будут равны:
грн; грн.
Среднедушевые доходы, не превышающие 180 грн., получают не менее четверти (25%) из всей совокупности семей, а в размере, не превышающем 230грн., не менее 75% всех семей.
Более детальная характеристика распределения может быть получена на основе децилей распределения. Интервалы соответствующих децилей определяются аналогично по соответствующим накопленным частотам. Например, находим первую, - это будет ; тогда соответствующий ей интервал будет тем интервалом, в котором находится первый дециль (d1) – и т.д.
Рассчитаем соответствующие децили:
грн; грн;
грн; грн;
грн; грн;
грн; грн;
грн. Первый дециль показывает, что у 10% семей с самым низким среднедушевым доходом самый высокий размер среднедушевого дохода составляет 160 грн., а девятый дециль, - что среди 10% семей с самым высоким уровнем дохода – нижняя его граница составляет 254 грн.
1б. Анализ формы, дифференциации и концентрации распределения проводится с помощью системы специальных коэффициентов, в частности, рассчитываются:
- относительный показатель асимметрии (), показатель эксцесса (), коэффициент децильной дифференциации (), индекс Джинни (КДж).
Дополнительно используется графическое изображение степеней неравномерности распределения вариационного ряда в виде кривой Лоренца.
Относительный показатель асимметрии исчислим как:
; грн;
33,3 грн;
.
, т.е. это свидетельствует о наличии правосторонней асим-метрии, при этом она незначительная, т.к.. Наиболее точ-ным выступает коэффициент асимметрии, рассчитанный на основе третьего центрального момента:
; ;
Для проверки существенности (или несущественности) асимметрии определяется средняя квадратическая погрешность коэффициента асимметрии():;,т.е.асим-метрия несущественна в данном вариационном ряду. Так как приведенное распределение симметричное, то для таких распределений дополнительно рассчитывается коэффициент эксцесса:
; ; ; .
Значение свидетельствует о том, что распределение низко-вершинное или плосковершинное.
Для проверки гипотезы о статистической существенности эксцес-са рассчитываем среднеквадратическую ошибку эксцесса:
. Если, то гипотеза о статистической существенности экс-цесса не отвергается: т.е. 6,72 >3. Это подтверждает ги-потезу о статистической значимости (или существенности) эксцесса.
Для оценки степени дифференциации признака в совокупности рассчитаем коэффициент децильной дифференциации:
Это означает, что в 1,6 раза наименьший среднедушевой доход 10% семей, имеющих наибольшие доходы, больше наибольшего сред-недушевого дохода из 10% семей, имеющих самые низкие среднедуше-вые доходы.
Анализ дифференциации (или концентрации) распределения признаков основан на построении кривой Лоренца и расчета индекса дифференциации или коэффициента Джинни.
По данным таблицы 5.4 построим кумулятивные относительные показатели изучаемого признака (среднедушевого дохода) и частот (чис-ла семей), т.е. относительные показатели числа единиц в группах и раз-мерах признака (среднедушевые доходы) выражаются в относительных величинах (в долях или процентах к итогу) и определяются их накоп-ленные значения (табл.5.5, гр.5 и 8). Для построения кривой Лоренца по горизонтальной оси графика откладываются значения графы 5, а по вер-тикальной - значения графы 8, и соединение этих точек образует кривую Лоренца, характеризующую равномерность и степень концентрации распределения рабочих по уровню среднедушевого дохода (рис. 5.3).
Рис.5.3. Кривая Лоренца
Для количественной оценки меры концентрации рассчитывает-ся коэффициент концентрации Джинни:
= 1 – 2 · 0,538015 + 0,1500335 = 0,074.
Соотношение линий равномерного и фактического распределения (рис.5.3), а также значение коэффициента близкое к 0, свидетельствует о достаточно равномерном распределении семей по среднедушевомудоходу и, соответственно, о незначительной степени концентрации.
2. Проверяем гипотезу о соответствии эмпирического распределения семей по среднедушевому доходу нормальному закону распределения, используя критерий согласия К. Пирсона или 2 - критерий.
Таблица 5.4
Распределение семей по среднедушевому доходу
Среднеду-шевые доходы, грн | Число се- мей | Закрытые ин-тервалы сред-недушевых доходов, грн | х | xf | x 2 f | |||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
До 150,0 | 10 | 130 - 150 | 10 | 140 | 1400 | 196000 | - 64,5 | - 2683361,25 | 173076800,625 | 41602,5 |
150,0 -170,0 | 20 | 150 - 170 | 30 | 160 | 3200 | 512000 | - 44,5 | -1762422,5 | 78427801,25 | 39605 |
170,0 -190,0 | 40 | 170 - 190 | 70 | 180 | 7200 | 1296000 | - 24,5 | - 588245 | 14412002,5 | 24010 |
190,0 -210,0 | 50 | 190 - 210 | 120 | 200 | 10000 | 2000000 | - 4,5 | - 4556,25 | 20503,125 | 1012,5 |
210,0 -230,0 | 30 | 210 - 230 | 150 | 220 | 6600 | 1452000 | 15,5 | 111716,25 | 1731601,875 | 7207,5 |
230,0 -250,0 | 25 | 230 - 250 | 175 | 240 | 6000 | 1440000 | 35,5 | 1118471,875 | 33705751,625 | 31506,25 |
Свыше 250,0 | 25 | 250 - 270 | 200 | 260 | 6500 | 1690000 | 55,5 | 4273846,975 | 237198501,5625 | 77006,25 |
Итого | 200 | 40900 | 8586000 | 465450,0 | 544572962,5 | 221950 |
Таблица 5.5
Кумулятивные показатели распределения семей по среднедушевому доходу
Среднедушевой доход, грн. | Число семей | Общая сумма среднемесячных доходов | |||||||
интервальное распределение | диск- ретное, х | кол-во семей,f | частость, %, fотн, | накоплен- ная частость, %, fcum, | гри- вен, xf | в % к итогу xотн | накоплен- ный % к итогу, xcum | ||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
130 - 150 | 140 | 10 | 5,0 | 5 | 1400 | 3,42 | 3,42 | 0,00171 | 0,00171 |
150 - 170 | 160 | 20 | 10 | 15 | 3200 | 7,82 | 11,24 | 0,01124 | 0,00782 |
170 - 190 | 180 | 40 | 20 | 35 | 7200 | 17,6 | 28,84 | 0,05768 | 0,0352 |
190 - 210 | 200 | 50 | 25 | 60 | 10000 | 24,45 | 53,29 | 0,133225 | 0,061125 |
210 - 230 | 220 | 30 | 15 | 75 | 6600 | 16,1 | 69,39 | 0,104085 | 0,02415 |
230 - 250 | 240 | 25 | 12,5 | 87,5 | 6000 | 14,67 | 84,06 | 0,105075 | 0,0183375 |
250 - 270 | 260 | 25 | 12,5 | 100 | 6500 | 15,94 | 100 | 0,125 | 0,0019925 |
Итого: | - | 200 | 100 | - | 40900 | 100 | - | 0,538015 | 0,1500335 |
Таблица 5.6
Вспомогательная таблица для расчета теоретических частот
нормального распределения
Средне душевые доходы, грн. | Число семей, f | x | Теоретические частоты, fтеор | Округленные частоты,fтеор | Накопленные частоты | Разность между накопленными фактическими и теоретическими частотами | ||||
фактически | теоретически | |||||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 = 9 - 10 |
130 - 150 | 10 | 140 | -1,937 | 0,062 | 7,4462 | 7,4 | 0,9135 | 10 | 7,4 | - 2,6 |
150 - 170 | 20 | 160 | -1,336 | 0,1646 | 19,768 | 19,8 | 0,00202 | 30 | 27,2 | - 2.8 |
170 - 190 | 40 | 180 | - 0,7357 | 0,3040 | 36,63 | 36,6 | 0,3158 | 70 | 63,8 | 6,2 |
190 - 210 | 50 | 200 | 0,1351 | 0,3954 | 47,49 | 47,5 | 0,1316 | 120 | 111,3 | 8,7 |
210 - 230 | 30 | 220 | 0,4655 | 0,3585 | 43,056 | 43,0 | 3,93 | 150 | 154,3 | 4,3 |
230 - 250 | 25 | 240 | 1,066 | 0,240 | 29,06 | 29,1 | 0,578 | 175 | 183,4 | - 8,4 |
250 - 270 | 25 | 260 | 1,667 | 0,1000 | 12,06 | 12,1 | 13,75 | 200 | 195,5 | 4,5 |
Итого | 200 | 195,5' | 19,62 |
Этапы решения:
- определяем теоретические частоты нормального закона распределения () по формуле:; -нормированное отк-лонение; = 204,5 грн; = 33,3. (Все промежуточные расчеты представлены в таблице 5.6). Общий множитель ;
- по таблицам t-распределения (приложение 3) определяем значение плотности:,при этом . Например, для; для ; и т.д. Эти значения заносятся в графу 5 таблицы 5.6;
- определяем теоретические частоты () и заносим их в графу 6, а округленные – в графу 7 таблицы 5,6; сумма теоретических частот, т.е. несколько меньше 200, что объясняется округлением цифр при расчете f (t) и f теор.
Для оценки степени расхождения эмпирического и теоретического распределения используется критерий Пирсона (промежуточные расчеты представлены в графе 8 табл. 5.6) .
Определяем табличное значение критерия, т.е. по заданной вероятности ( или 0,9) и числу степеней свободы:3= (см. приложение 4).
Т.к., то гипотеза о соответствии эмпирического распределения нормальному закону распределения не подтверждается.
Для проверки этой же статистической гипотезы можно использовать критерий Романовского и критерий Колмогорова.
- Критерий Романовского:. Если , то гипотеза о соответствии эмпирического распределения нормальному не принимается.
- Критерий Колмогорова:.
- распределения определяет вероятность, т.е. = = 0,15 (приложение 5).
Если- значительна, т.е. близка к 1, то расхождения между эмпирическим и нормальным распределением несущественны. В нашем примере расхождения существенны, что подтверждает сделанные выше выводы.
3. Построим графики эмпирического и теоретического распределения семей по среднедушевым доходам (рис.5.4):
- гистограмма распределения
- полигон распределения
- теоретическая линия нормального распределения
Рис.5.4. Распределение семей по среднедушевому доходу
Пример 5. Налоговой инспекцией одного из районов города проверено 172 коммерческих киоска и в 146 из них выявлены финансовые нарушения. Определите среднее значение, дисперсию и среднее квадратическое отклонение альтернативного признака, т.е. доли киосков, у которых выявлены финансовые нарушения.
Решение
Определяем долю коммерческих киосков, у которых выявлены финансовые нарушения:. Тогда доля киосков, у которых отсутствуют финансовые нарушения, будет:.
Среднее значение альтернативного признака:. Дисперсия альтернативного признака составит: = 0,85 · 0,15 = 0,128, а среднее квадратическое отклонение:.
Пример 6. Имеется следующая аналитическая группировка зависимости средней заработной платы рабочих от возраста.
Группы ра-бочих по возрасту,лет | Число рабо- чих, fi | Средняя заработная плата, грн, у | ||
до 20,0 | 5 | 280, 320, 360, 350, 290 | 1600 | 320 |
20,0 – 30,0 | 8 | 420, 400, 510, 490, 380, 440, 480,500 | 3600 | 450 |
30 и старше | 7 | 570, 600, 680, 630, 560, 440, 620 | 4200 | 600 |
всего | 20 | 9400 | 470 |
Определите: 1) общую, межгрупповую и среднюю из внутригрупповых дисперсий; 2) проверьте правило сложения дисперсий.
Решение
- Общая дисперсия по заработной плате рассчитывается по формуле простой дисперсии: .
где средняя заработная плата всех рабочих;
грн
13450
Межгрупповая дисперсия:
11700,
где - средняя зарплата по i-группе, представлены в таблице.
Средняя из внутригрупповых дисперсий. Вначале рассчитываем дисперсии по каждой группе:
;
2025;
Тогда средняя из внутригрупповых дисперсий будет:
.
- Правило сложения дисперсий:=+;13450 = 11700 + 1750.
Задачи для самостоятельного решения
5.1. По имеющимся данным о производстве изделий двумя бригадами рабочих определите для каждой бригады: размах вариации, среднее линейное отклонение, дисперсию, коэффициент вариации, сравните степень однородности распределения по производству изделий.
Произведено изделий за смену, шт. | |
1 бригада | 2 бригада |
2 | 8 |
3 | 9 |
12 | 10 |
15 | 11 |
18 | 12 |
5.2. По имеющимся данным о производительности труда 50 рабочими определите абсолютные показатели вариации. Сделайте выводы.
Произведено продукции одним рабочим за смену,шт. | Число рабочих,чел. |
8 | 7 |
9 | 10 |
10 | 15 |
11 | 12 |
12 | 6 |
Итого | 50 |
5.3. На основе данных об урожайности ржи и размерах посевных площадей определите дисперсию и среднее квадратическое отклонение (двумя способами) и коэффициент вариации; моду и медиану.
Урожайность ржи, ц/га | Посевная площадь, га |
14 - 16 | 100 |
16 - 18 | 300 |
18 - 20 | 400 |
20 - 22 | 200 |
Итого | 1000 |
5.4. Из 150 выпускников средней школы 20 человек получили золотые и серебряные медали. Определите: дисперсию, среднее квадратическое отклонение и коэффициент вариации доли медалистов.
5.5. Имеются следующие данные о размере семей в районе (по числу человек в семье): 3, 4, 5, 7, 2, 1, 4, 6, 6, 5, 5, 7, 7, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, 4, 5, 6, 6, 1, 3, 3, 5, 5, 6, 2, 2, 3, 3, 4, 4, 2. Составьте дискретный вариационный ряд. Определите структурные средние распределения. Дайте графическое изображение ряда.
5.6. По данным о успеваемости по статистике студентов двух групп определите, в какой группе более ровная успеваемость студентов.
Оценка на экзамене, балл | Численность студентов в группе, чел. | |
1 группа | 2 группа | |
5 | 7 | 2 |
4 | 9 | 16 |
3 | 6 | 7 |
2 | 3 | 0 |
Итого | 25 | 25 |
5.7. Распределение студентов одного из факультетов по возрасту характеризуется данными:
Возраст студентов, лет | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | Итого |
Число студентов, чел. | 20 | 80 | 90 | 110 | 130 | 170 | 90 | 60 | 750 |
Определите: 1) средний возраст студентов факультета; 2) показатели вариации (размах вариации, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение, коэффициент вариации); 3) коэффициент асимметрии. Сделайте выводы о форме распределения.
5.8. Определите среднюю длину пробега автофургона торгово-посреднической фирмы, все относительные показатели вариации и коэффициент асимметрии, если известны:
Длина пробега за один рейс, км | 30-50 | 50-70 | 70-90 | 90-110 | 110-130 | 130-150 | Всего |
Число рейсов за квартал | 20 | 25 | 14 | 18 | 9 | 6 | 92 |
- Дисперсия признака равна 9, средний квадрат индивидуальных его значений – 130. Чему равна средняя?
- Средняя величина признака в совокупности равна 19, а средний квадрат индивидуальных значений этого признака – 397. Определите коэффициент вариации.
- Крестьянские хозяйства района подразделяются по размерам земельных наделов следующим образом:
Размер земельных наделов, га | Кол-во хозяйств |
До 4,0 | 20 |
4,0-6,0 | 50 |
6,0-8,0 | 60 |
8,0-10,0 | 40 |
Свыше 10,0 | 30 |
Всего | 200 |
Исчислите: 1) абсолютные и относительные показатели вариации; 2) структурные характеристики распределения хозяйств по размерам земельных наделов; 3) показатели формы и дифференциации распределения.
- По условию задачи 5.11. проверьте гипотезу о соответствии эмпирического распределения нормальному закону распределения с помощью критерия Пирсона.
- Известно следующее распределение населения области по размеру вклада в сберегательном банке:
Размер вклада, тыс.грн | До 1,0 | 1,0-3,0 | 3,0 –5,0 | 5,0 –7,0 | Свыше7,0 | Итого |
Количество вкладчиков, тыс.чел. | 20,0 | 40,0 | 25,0 | 10,0 | 5,0 | 100 |
Определите: 1) степень однородности распределения вкладчиков по размерам вклада; 2) показатели дифференциации распределения. Постройте кривую Лоренца. Сделайте выводы.
5.14. По условию задачи 5.13 аналитически и графически определите моду и медиану распределения. Сделайте выводы.
5.15. По условию задачи 5.13 определите показатели формы распределения, т.е. коэффициенты асимметрии и эксцесса. Сделайте выводы.
5.16. В трех партиях продукции, представленных на контроль качества, было обнаружено: а) первая партия – 1000 изделий, из них 800 годных; б) вторая партия – 800 изделий, из них 720 годных; в) третья партия – 900 изделий, из них 850 годных
Определите в целом по трем партиям дисперсию, среднее квадратическое отклонение и коэффициент вариации годной продукции.
5.17. Распределение семей по уровню среднедушевого дохода - числу минимальных заработных плат в месяц:
Среднедушевой доход – число минимальных зарплат в месяц | До 2 | 2- 4 | 4- 6 | 6- 8 | 8- 10 | 10- 12 | 12 и более | Все го |
Количество семей | 100 | 140 | 160 | 280 | 220 | 60 | 40 | 1000 |
Для анализа дифференциации семей по уровню среднедушевого дохода рассчитайте: 1) квантили и децили распределения семей; 2) децильный коэффициент дифференциации населения по уровню среднедушевого дохода; 3) коэффициент Джинни. Проанализируйте полученные результаты.
5.18. По условию задачи 5.17. проверьте гипотезу о соответствии эмпирического распределения нормальному закону распределения с помощью коэффициентов асимметрии и эксцесса.
5.19. Кожевенно-обувной комбинат планирует выпускать в 2003 году 10000 пар женской обуви которые по размерам распределялись следующим образом:
Размер обуви | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | Всего |
Удельный вес обуви, % | 5,3 | 19,6 | 26,3 | 27,3 | 9,0 | 6,5 | 4,0 | 2,0 | 100 |
Фактический спрос женщин на размеры обуви был следующим:
Размер обуви | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | Всего |
Удельный вес обуви, % | 5,5 | 9,5 | 24,8 | 29,2 | 16,7 | 8,5 | 3,8 | 2,0 | 100 |
Определите, верна ли стратегия предприятия по выпуску женской обуви, используя проверку статистической гипотезы “о существенности разности средних” с помощью t – критерия.
5.20. По результатам выборочного обследования домохозяйств области о размере среднемесячного совокупного дохода было получено следующее распределение:
Среднемесячный совокупный доход на одного члена домохозяйства, грн | Удельный вес домохозяйств, в % к итогу | |
город | село | |
До 50 | 7,3 | 29,6 |
50 - 100 | 32,3 | 38,6 |
100 - 150 | 26,2 | 10,7 |
150 - 200 | 18,4 | 16,4 |
200 - 300 | 8,9 | 3,2 |
300 - 500 | 4,5 | 1,1 |
Свыше 500 | 2,8 | 0,4 |
Всего | 100 | 100 |
Определите: 1) степень однородности (неоднородности) распреде-ления домохозяйств по размеру среднемесячного совокупного дохода, дифференцированно по городу и селу; 2) сравните степень однороднос-ти распределения домохозяйств, сопоставив относительные показатели вариации; 3) рассчитайте структурные характеристики распределения домохозяйств по городу и селу, в частности, моду, медиану и квартили распределения. Сделайте выводы по результатам расчетов.
5.21. По данным задачи 2.17 рассчитайте виды дисперсий по выпуску продукции. Проверьте правило взаимосвязи между дисперсиями.
5.22. На основе исходных данных задачи 2.21 определите: 1) межгрупповую дисперсию результативного фактора; 2) общую дисперсию. На основе правила сложения дисперсий определите среднюю из групповых дисперсий.
Тема 6. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
Методические указания
Целью выборочного наблюдения является определение характеристик генеральной совокупности – генеральной средней () и генеральной доли ( р). Характеристики выборочной совокупности - выборочная средняя ( ) и выборочная доля () отличаются от генеральных характеристик на величину ошибки выборки ( ).
Расчет ошибок при проведении отбора позволяет решить одну из главных проблем организации выборочного наблюдения – оценить репрезентативность (представительность) выборочной совокупности. Различают среднюю и предельную ошибки выборки. Эти два вида ошибок связаны между собой следующим образом:
,
где - предельная ошибка выборки;- средняя ошибка выборки; - коэффициент доверия, связанный с вероятностью (P) и определяемый по таблице значений интегральной функции Лапласа.
Так как вероятность, с которой гарантируется ошибка выборки, должна быть близка к 1 (в связи с этим ошибка называется предельно возможной, т.е. наивероятной), величина коэффициента доверия при-нимает определенные значения. Для целых значений коэффициента уровни вероятности, наиболее часто используемые в экономических и социологических исследованиях, следующие:
P | |
1 | 0,683 |
2 | 0,954 |
3 | 0,997 |
Величина средней ошибки выборки рассчитывается дифференцировано в зависимости от способа и вида отбора (таблица 6.1).
Расчет средней и предельной ошибок выборки позволяет определять возможные пределы, в которых будут находиться характеристики генеральной совокупности:
Таблица 6.1
Формулы для определения средней ошибки выборки
Способы отбора | Виды отбора | |
повторный отбор | бесповторный отбор | |
Собственно-cлучайный отбор: а) при изучении признака б) при изучении доли | ||
| - - | |
| ||
где,- дисперсия средняя из групповых соответственно для признака и доли | ||
| ||
где ,- межсерийная дисперсия соответственно для признака и доли; si S - количество серий соответственно в выборочной и генеральной совокупности. |
Формулы необходимого объема выборки для различных способов формирования выборочной совокупности выводятся из соответствующих соотношений, используются при расчете предельных ошибок выборки.
Таблица 6.2
Формулы для определения численности выборочной совокупности
Способы отбора | Виды отбора | |
повторный отбор | бесповторный отбор | |
1.Собственно-случайный отбор: а) при изучении признака б) при изучении доли | ||
2. Механический отбор: а) при изучении признака б) при изучении доли | - - | |
3. Типический отбор: а) при изучении признака б) при изучении доли | ||
|
Тесты
1. По какой формуле определяются пределы генеральной средней?
1); 2) ; 3) ; 4).
2. По какой формуле определяются пределы генеральной доли?
1); 2) ; 3) ; 4).
3. Какие ошибки не специфичны для выборочного наблюдения?
1) ошибки регистрации преднамеренные; 2) ошибки регистрации не-преднамеренные; 3) случайные ошибки репрезентативности; 4) пре-дельная ошибка выборки.
4. Как изменится средняя ошибка выборки при повторном отборе, если объем выборки увеличить в четыре раза?
1) уменьшится в 4 раза; 3) увеличится в 2 раза;
2) уменьшится в 2 раза; 4) увеличится в 4 раза.
5. Какой способ отбора является наиболее точным?
1) собственно-случайный; 3) типический;
2) механический; 4) серийный.
6. Чему равна средняя ошибка выборочной доли при случайном бесповторном отборе?
1); 2); 3) ; 4) .
7. По какой формуле определяется предельная ошибка выборки для признака при механическом отборе?
1) ; 2) ; 3) ; 4) .
8. Какая формула положена в основу определения необходимого объема выборочной совокупности при собственно-случайном повторном отборе?
1) ; 2) ; 3) ; 4) .
9. Как определяется предельная ошибка доли при типическом отборе?
1); 2) ; 3) ; 4) .
10. По какой формуле определяется предельная ошибка выборки для признака при серийном повторном отборе?
1) ; 2) ; 3) ; 4) .
Решение типовых задач
Пример 1. Для изучения оснащения заводов основными производственными фондами было проведено 10%-ное собственно-слу-чайное обследование, в результате которого получены следующие данные о распределении заводов по стоимости фондов:
Средняя годовая стоимость основных фондов, млн. грн | До 4 | 4 - 6 | 6 - 8 | Свыше 8 | Итого |
Количество заводов | 7 | 12 | 21 | 10 | 50 |
Определите: 1) с вероятностью 0,997 границы, в которых будет находиться средняя годовая стоимость основных фондов заводов в генеральной совокупности; 2) с вероятностью 0,954 границы, в которых будет находиться удельный вес заводов со стоимостью фондов выше 6 млн.грн. в генеральной совокупности.
Решение
1. Средняя годовая стоимость основных фондов в генеральной совокупности определяется по формуле:.
Предельная ошибка рассчитывается так:.
При собственно-случайном бесповторном отборе определяется по формуле:. Для расчета средней и дисперсии по выборочной совокупности построим таблицу 6.3.
Таблица 6.3
Вспомогательные расчеты для определения средней и
дисперсии по результатам выборки
Средняя годовая стоимость основных фондов, млн. грн | Кол-во заводов | Дискрет ный ряд, | ()2 | ()2f | ||
До 4 | 7 | 3 | 21 | - 3,4 | 11,56 | 80,92 |
4 – 6 | 12 | 5 | 60 | - 1,4 | 1,96 | 23,52 |
6 – 8 | 21 | 7 | 147 | 0,6 | 0,36 | 7,56 |
Свыше 8 | 10 | 9 | 90 | 2,6 | 6,76 | 67,60 |
Итого: | 50 | - | 318 | - | - | 179,60 |
Средняя в вариационном ряду, т.е. по выборочной совокупнос-ти, рассчитывается следующим образом:млн.грн.
Дисперсию определим по формуле:.
N = 500, т. к. по условию задачи объем выборки составляет 10% от генеральной совокупности (n = 50). Тогда средняя ошибка выборки составит: млн.грн.
В нашем примере задана вероятность 0,997, при которой , и предельная ошибка выборки будет равна:млн.грн.
Средняя годовая стоимость основных фондов в генеральной совокупности будет находиться в пределах:
= 6,4млн.грн. 0,75 млн.грн; 5,65 млн.грн 7,15млн.грн.
Следовательно, с вероятностью 0,997 можно утверждать, что средняя годовая стоимость основных фондов в генеральной совокупности будет находиться в пределах от 5,65 до 7,25 млн.грн.
2. Доля заводов со стоимостью основных фондов свыше 6 млн.грн в генеральной совокупности определяется по формуле: .
Доля таких заводов в выборочной совокупности будет следующей: ; .
В нашем примере задана вероятность 0,954, поэтому .
Тогда доля заводов, имеющих стоимость основных фондов свыше 6 млн.грн., в генеральной совокупности составит:
; .
Таким образом, доля заводов со стоимостью основных фондов свыше 6 млн.грн во всей генеральной совокупности будет находиться в пределах от 49 до 75%. Результат гарантируется с вероятностью 0,954.
Пример 2. Для определения средней месячной заработной платы работников финансово-банковских учреждений было проведено выборочное обследование 100 сотрудников по схеме собственно-слу-чайного повторного отбора. В результате установлено, что средняя зарплата составляет 880 грн. при среднем квадратическом отклонении 169 грн. С вероятностью 0,954 определите пределы, в которых находится средняя зарплата в генеральной совокупности.
Решение
Средняя зарплата работников в генеральной совокупности будет определяться по формуле: . Для определения границ генеральной средней необходимо вычислить предельную ошибку выборки: ; ; грн.; грн; 880 ± 33,8; 846,2 грн.913,8 грн.
С вероятностью 0,954 можно утверждать, что средняя зарплата работников финансово-банковских учреждений в генеральной совокупности находится в пределах от 846,2 до 913,8 грн.
Пример 3. В процессе осуществления технического контроля из партии готовой продукции методом случайного бесповторного отбора было проверено 80 изделий, из которых 4 оказались бракованными. С вероятностью 0,954 определите пределы бракованной продукции во всей, если процент отбора равен 10.
Решение
Доля бракованной продукции в генеральной совокупности будет находиться по формуле:. Определим процент бракованной продукции в выборочной совокупности:= 0,05 или 5 %.
Предельная ошибка выборки определяется так: ,
где при заданной в условии задачи вероятности.
Средняя ошибка выборки составит:
или ± 2,3 %.
.
Тогда доля бракованной продукции в генеральной совокупности будет следующей: ; .
С вероятностью 0,954 можно утверждать, что доля брака во всей партии готовой продукции будет находиться в пределах от 0,4 до 9,6%.
Пример 4. Для определения средней заработной платы продавцов в регионе была произведена 20 %-ная типическая выборка с отбором единиц пропорционально численности типических групп (внутри типов применялся метод случайного бесповторного отбора). Результаты выборки представлены в таблице:
Типические группы магазинов | Средняя заработная плата, грн, х | Среднее квадратическое отклонение, грн, | Число про-давцов, |
Продовольственные Непродовольственные | 330 410 | 26 44 | 62 38 |
С вероятностью 0,954 определите предел, в котором будет находиться средняя заработная плата всех продавцов в регионе.
Решение
Пределы генеральной средней определяются по формуле:
Определим среднюю в выборочной совокупности:
= грн.
Средняя ошибка выборки при типическом способе отбора для средней величины признака рассчитывается так:.
Определим среднюю из групповых дисперсий:
; грн.
Тогда предельная ошибка выборки составит:
грн
Следовательно, средняя зарплата продавцов в генеральной совокупности с вероятностью 0,954 будет находиться в пределах:
= 360,4 ± 9,0; 351,4 грн.369,4 грн.
Пример 5. Для выявления причин простоев была произведена фотография рабочего дня 10% рабочих трех цехов завода. Отбор рабочих внутри цехов производился механическим способом. В результате была выявлена такая доля простоев из-за несвоевременного поступления материалов к рабочему месту:
Цеха | Число рабочих в выборке, | Удельный вес простоев из-за несвоевременного поступления материалов |
1 2 3 | 36 14 30 | 0,10 0,15 0,02 |