Список предметов
Сведение и группировка статистических данных
7 / 16

См. также "математическая статистика и статистика"

Сведение и группировка статистических данных

Цель работы – получить навыки группировки данных в MS Excel.

Задание – сгруппировать статистические данные с помощью надстройки Excel “Анализ данных”

Сведение и группировка статистической информации целесообразно проводить с помощью модуля “Гистограмма” пристройки “Анализ”.

Режим “Гистограмма” служит для вычисления частот попадания данных в указанные границы интервалов, и так же для построения гистограммы интервального вариационного ряда распределения.

В диалоговом окне этого режима

Диалоговое окно "гистограмма" в Excel

задаются следующие параметры:

1. Входной интервал – вводятся ссылки на ячейки, которые содержат данные для анализа.

2. “Интервал карманов” (необязательный параметр) – вводится ссылки на ячейки, которые содержат набор граничных значений, которые определяют интервалы (карманы). Эти значения должны быть введены в возрастающем порядке. В MS Excel вычисляется число попаданий данных в сформированные интервал, при этом границы интервалов являются строгими нижними границами и нестрогими верхними.

Если диапазон карманов не был введен, то набор интервалов, равномерно распределенных между минимальными и максимальными значениями данных, будет создан автоматически.

3. Метки устанавливаются в активное положение, если первый ряд или столбец во входном диапазоне содержит заголовки. Если заголовки отсутствуют, флажок нужно деактивировать. В этом случае будут автоматически созданы стандартные названия данных выходного диапазона.

4. Выходной интервал/Новый рабочий лист/Новая рабочая книга – активируется поле, в которое необходимо ввести ссылку на левую верхнюю ячейку выходного диапазона.

5. Парето (отсортированная гистограмма) – устанавливается в активное положение, если нужно представить данные в порядке убывания частоты. Если флажок снят, то данные в выходном диапазоне будут приведены в порядке следования интервалов.

6. Интегральный процент – устанавливается в активное положение для расчета выраженных в процентах накопленных частот (накопленных частностей) и включения в гистограмму графика кумуляты.

7. Вывод графика – устанавливается в активное положение для автоматического создания встроенной диаграммы на листе, который содержит выходной диапазон.

Пример анализа статистических данных в Excel

Объем экспорта по регионам Украины за 2009 год приведен ниже.

Експорт

млн.дол. США

Експорт

млн.дол. США

Автономна Республiка Крим

342

Одеська

1148

Вiнницька

378,5

Полтавська

934,2

Волинська

258,7

Рiвненська

277,7

Днiпропетровська

4124,9

Сумська

611,6

Донецька

7595,1

Тернопiльська

103,3

Житомирська

305

Харкiвська

1028,2

Закарпатська

741

Херсонська

287,3

Запорiзька

2159,5

Хмельницька

205,2

Івано-Франківська

264

Черкаська

407,8

Київська

800,2

Чернiвецька

97,4

Кiровоградська

205,4

Чернігівська

239,7

Луганська

1440,8

Київ

5436,4

Львiвська

612,9

Севастополь

76,4

Миколаївська

1213,6

По набору данных необходимо построить гистограмму и кумуляту

Для решения задачи воспользуемся режимом работы “Гистограмма”. Значение параметров, установленных в диалоговом окне, находятся ниже.

Частоты и накопленные частоты, рассчитанные в данном режиме, представлены ниже.

Карман

Частота

Интегральный %

76,4

1

3,70%

1 580,14

22

85,19%

3 083,88

1

88,89%

4 587,62

1

92,59%

6 091,36

1

96,30%

Еще

1

100,00%

Построенная гистограмма и кумулята представлены ниже.

Изображение гистораммы и кумуляты с помощью в Excel

На основании частот рассчитываются накопленные частоты. Каждое значение накопленной частоты делится на максимальное накопленное значение, в результате чего получаются частоты, выраженные в долях единицы. После преобразования последних в процентный формат получается окончательный результат. 

См. также "математическая статистика и статистика"


0  


 Как импортировать информацию из базы данных | Описание курса | Базы данных