Как найти коэффициент вариации пример. Коэффициент вариации
Относительные показатели вариации - раздел Экономика, Данные о деятельности банков одного из регионов РФ 1. Коэффициент Вариации (Vσ) – Относительный Пока...
Совокупность считается качественно однородной, если коэффициент вариации не превышает 0,33 (или 33%).
Таблица 5.1.3.
Шкала оценки однородности совокупности
При этом средняя величина исследуемого признака может считаться типичной, надёжной характеристикой статистической совокупности.
Если же коэффициент вариации больше 0,33 (или 33%) то, следовательно, вариация исследуемого признака велика , и найденная средняя плохо представляет всю статистическую совокупность, не является её типичной, надёжной характеристикой , а сама совокупность является неоднородной по рассматриваемому признаку.
Аналогично коэффициенту вариации рассчитывают другие относительные показатели вариации , которые в практике статистики применяются реже:
2. Показатель осцилляции: ; (5.1.12.)
3. Линейный коэффициент вариации: . (5.1.13)
Рассчитаем показатели вариации для сквозной задачи:
Таблица 5.1.4.
Расчетная таблица для нахождения характеристик ряда распределения
Группы банков по объему кредитных вложений, млн. руб. X | Середина интервала | Число банков, | Произведение вариантов на частоты | |||
гр.4= гр.2*гр.3 | гр.6= гр.5*гр.5 | гр.7= гр.6*гр.3 | ||||
375,00 - 459,00 | =417 | 417*4= | 417-585= -168 | = | 28224*4= | |
459,00 - 543,00 | ? | ? | ? | ? | ||
543,00 - 627,00 | ? | ? | ? | ? | ||
627,00 - 711,00 | ? | ? | ? | ? | ||
711,00 - 795,00 | ? | ? | ? | ? | ||
Итого | ? | Х | х | ? |
Расчет средней арифметической взвешенной:
Расчет дисперсии:
σ2 =
Расчет среднего квадратического отклонения:
Расчет коэффициента вариации:
Вывод. Анализ полученных значений показателей и σ говорит о том, что средний объем кредитных вложений банков составляет _______?млн. руб., отклонение от среднего объема в ту или иную сторону составляет в среднем _________?млн. руб. (или ______?%), наиболее характерные значения объема кредитных вложений находятся в пределах от ______________?млн. руб. до _______________?млн. руб. (диапазон ).(см. табл. 3.2.5 -_____? банков или ______?% входят в этот интервал).
Значение V σ = ______?% _____? превышает 33%, следовательно, вариация кредитных вложений в исследуемой совокупности банков незначительна и совокупность по данному признаку качественно однородна. Расхождение между значениями , Мо и Ме незначительно (=585 млн. руб., Мо=593,40 млн. руб., Ме=588,818 млн. руб.), что подтверждает вывод об однородности совокупности банков. Таким образом, найденное среднее значение объема кредитных вложений банков (585 млн. руб.) ______? является типичной, надежной характеристикой исследуемой совокупности банков.
Конец работы -
Эта тема принадлежит разделу:
Данные о деятельности банков одного из регионов РФ
Данные сквозной задачи.. таблица.. данные о деятельности банков одного из регионов РФ номер банка кредитные вложения млн руб прибыль..
Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:
Что будем делать с полученным материалом:
Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:
Твитнуть |
Все темы данного раздела:
Предмет, метод и задачи статистики
1.1. Предмет, методы, задачи статистики
Термин «статистика» происходит от латинского «status»,которое вошло в употребление в Германии в середине 18 века. Впервые статистику стал преподават
Отдельные объекты или явления, образующие статистическую совокупность, называются единицами совокупности
Например, при проведении переписи торгового оборудования единицей наблюдения является торговое предприятие, а единицей совокупности - их оборудование (прилавки, холодильные агрегаты и т.д.).
Признак - это характерное свойство изучаемого явления, отличающее его от других явлений
В разных отраслях статистики изучаются разные признаки. Так, например, объектом изучения является предприятие, а его признаками - вид продукции, объем выпуска, численность работающих и т.д. Или объ
Понятие стат. наблюдения. Требования к собираемой информации
Статистическое наблюдение - это начальная стадия экономико-статистического наблюдения. Она представляет собой научно организационную работу по собиранию мас
Основные виды, формы и способы наблюдения
Специально организованное статистическое наблюдение представляет собой сбор сведений посредством переписей, единовременных учётов и обследований. Примером специально организованного статистического
Точность наблюдения и контроль данных наблюдения
Всякое статистическое наблюдение ставит задачу получения таких данных, которые точнее бы отражали действительность. Отклонения, или разности между исчисленными показателями и действительными (истин
Абсолютные и относительные величины
Для характеристики массовых явлений статистика использует статистические величины (показатели). Они подразделяются на абсолютные, относительные и
Каждая выделенная группа характеризуется СРЕДНЕЙ величиной (величинами) результативного признака
Таблица 3.2.3.
Аналитическая группировка зависимости кредитных вложений и прибыли банков
Номер
группы
Группы банков по величине кредитных вло
По объему кредитных вложений
Для построения интервального вариационного ряда, характеризующего распределение банков по объему кредитных вложений, необходимо вычислить величину и границы интервалов ряда.
Статистическим рядом распределения называют упорядоченное распределение единиц совокупности на группы по изучаемому признаку
В зависимости от вида признака, рассматриваемого как группировочный ряды могут быть вариационными (количественными) и атрибутивными (качественными).
Табличное и графическое представление статистических данных
Статистические таблицы – своего рода статистическое предложение, которое состоит из статистического подлежащего и статистического сказуемого.
Статистические таблицы - э
Или 15 16 17
4.отсутствие данных может быть обусловлено различными причинами и это по-разному должно отражаться в таблицах:
а) если данный признак вообще не подлежит заполнению, то ста
Графическое представление статистических данных
Применение графиков в статистике насчитывает более чем двухсотлетнюю историю. Основоположником графического метода в статистике коммерческой деятельности считают английского экономиста У. Плейфейра
Полигон распределения частот
На основе данных табл. 3.4.3. построим полигон частот
Таблица 3.4.3.
Распределение размеров обуви у мужчин-респондентов опроса
№ размера
Число
Гистограммы
Для изображения интервального ряда распределения используется гистограмма. При ее построении на оси абсцисс откладываются величины интервалов (
Кумулята
Для изображения рядов распределения используется кумулятивная кривая (кривая сумм). При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда (
Сущность средних величин. Две формы средних величин
Средняя величина – показатель, который дает обобщающую характеристику варьирующего признака однородной совокупности.
Свойства средней величины:
1. Средняя характеризует всю совок
Средняя гармоническая
Гармоника – подобие, созвучие, средняя гармоническая близка к средней арифметической величине
Средняя гармоническая используется в случаях, когда статистическая информация
Понятие вариации. Основные показатели вариации
Вариация – это различия в индивидуальных значениях признака у единиц изучаемой совокупности.
Необходимость изучения вариации связана с тем, что
Прочих, неучтенных факторов
Этот показатель вычисляется по формуле, (5.2.1.)
где yi
Объема кредитных вложений (наш факторный признак - х)
Показатель вычисляется по формуле
Прочих, неучтенных факторов
(5.2.9.)
Средняя из внутригрупповых дисперсий (
Кривая имеет форму колокола
2. Так как функция нормального распределения – чётная, то есть f(-t)=f(t), то кривая нормального распределения симметрична относительно максимальной ординаты, равной
Следовательно ассиметрия левосторонняя
Наиболее точный коэффициент асимметрии – коэффициент, рассчитанный с использованием центрального момента распределения третьего порядка.
Понятие о выборочном наблюдении и ошибках выборки
Выборочным называется такое несплошное наблюдение, при котором признаки регистрируются у отдельных единиц изучаемой статистической совокупности, отобранных с использ
Средняя и предельная ошибки выборки
Применение выборочного метода наблюдения всегда связано с установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений пока
Определение ошибки выборки для среднего объема кредитных вложений банков и границ, в которых будет находиться генеральная средняя
По условию сквозной задачи выборочная совокупность насчитывает 30 банков, выборка 20% механическая, следовательно, генеральная совокупность включает (______?)=________? банков.
Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой
, (6.3.4.)
где m – число единиц совокупности, обладающих з
Определение необходимого объема выборки с заданным значением допустимой предельной ошибки выборки, равной 10 млн. руб
Для собственно-случайной и механической выборки с бесповторным способом отбора необходимый объем выборки для средней количественного признака вычисляется по формуле:
Понятие о корреляционной связи. Виды и формы корреляционных связей
Среди многих форм связей, имеющих количественный характер и изучаемых количественными методами, особое место занимают факторные связи, для исследований которых применяются методы кор
Функциональные связи
Связь результативного признака Y с факторным признаком X называется функциональной, если каждому возможному значению xi признака X
Если в модели учитывается зависимость признака Y от ряда факторов, то модель имеет вид
(7.1.5.)
Характерной особенностью стохастических связей является
Визуально можно предположить существование корреляционной связи
3. Корреляционная таблица представляет собой комбинацию двух рядов распределения. Строки таблицы соответствуют группировке единиц совокупности по факторному признаку
Метод аналитической группировки
При использовании метода аналитической группировки строится интервальный ряд распределения единиц совокупности по факторному признаку Х и для каждой j-ой группы ряда определяется среднегруп
Регрессионный метод анализа взаимосвязи
Линию, сглаживающую эмпирическую ломаную линию связи, называют теоретической линией регрессии Y на X или просто линией регрессии. Эта линия от
Способ выражения уровней ряда
Таблица 8.1.2
Число квартир, построенных предприятиями и организациями всех форм собственности и их средний размер в РФ
Показатели
Средние показатели в рядах динамики
В табл. 8.2.1. представлены данные, характеризующие динамику изменения уровней ряда за отдельные периоды времени. Для обобщающей оценки изменений уровней ряда за весь рассматриваемый период времени
Прогнозирование объемов реализации продукции с использованием среднего темпа роста
Прогнозирование уровня ряда динамики с использованием среднего темпа (коэффициента) роста осуществляется по следующей формуле:
Методы выявления сезонных колебаний
В ряде случаев закономерно повторяются различия в уровнях ряда в зависимости от времени года. Задача заключается в том, чтобы измерить такие различия, чтобы они были не случ
Методы анализа основной тенденции в рядах динамики
Тренд – основная достаточно устойчивая тенденция развития явления в ряду динамики, иначе говоря, плавное и устойчивое изменение уровней (у) во времени.
На т
Производство зерна в РФ, млн.тонн
Годы
t
производство, млн. тн
y
Сред-няя за 3 года
Сколь-зящая сумма за 5 лет,
Сколь-зящая средняя за 5 лет,
расче
Индивидуальные и общие индексы. Проблемы соизмерения индексируемых величин в агрегатных индексах
Индивидуальный индекс – характеризует динамику уровня изучаемого явления во времени за два сравниваемых периода или выражает соотношение отдельных элементов совокупности.
Формуле Пааше отдается предпочтение, когда индекс цен рассматривается в системе с индексом товарооборота и индексом физического объема
Пример 9.2.2.
Таблица 9.2.3.
Данные о реализации продукции в магазине «Звездочка»
Продукт
Ед. изм.
Базисный период
О
Индексы средние из индивидуальных
Средний индекс – это индекс, исчисленный как средняя величина из индивидуальных индексов.
Эти индексы применяются в тех случаях, когда в исходной информации нет данных
Индекс товарооборота есть произведение индекса цен (по Пааше) и физического объема
, проверим это:
Индексы постоянного и переменного состава. Индексы фиксированной структуры
При изучении качественных показателей часто приходится рассматривать изменение во времени (или пространстве) СРЕДНЕЙ величины индексиру
Индекс структурных сдвигов
Все рассмотренные выше индексы рассчитывались по нескольким товарам, реализуемым в одном месте. Рассмотрим теперь случай, когда ОДИН товар реализуется в нескольких местах.
Пример 9.5.1.
Практическое занятие
Задача 01
Рассчитать аналитические и средние показателигодовых изменений уровней ряда, сделать соответствующие выводы.
Таблица 1.
Объем реализации по изд
Средний темп прироста -
Годы (t)
Объем реализации, тыс. тонн.
Абсолютный прирост, тыс. тонн
Темп роста, %
Темп прироста, %
Абсолютное значе-н
Коэффициент вариации в статистике применяется для сравнения разброса двух случайных величин с разными единицами измерения относительно ожидаемого значения. В итоге можно получить сопоставимые результаты. Показатель наглядно иллюстрирует однородность временного ряда.
Коэффициент вариации используется также инвесторами при портфельном анализе в качестве количественного показателя риска, связанного с вложением средств в определенные активы. Особенно эффективен в ситуации, когда у активов разная доходность и различный уровень риска. К примеру, у одного актива высокая ожидаемая доходность, а у другого – низкий уровень риска.
Как рассчитать коэффициент вариации в Excel
Коэффициент вариации представляет собой отношение среднеквадратического отклонения к среднему арифметическому. Для расчета в статистике используется следующая формула:
CV = σ / ǩ,
- CV – коэффициент вариации;
- σ – среднеквадратическое отклонение по выборке;
- ǩ – среднеарифметическое значение разброса значений.
Коэффициент вариации позволяет сравнить риск инвестирования и доходность двух и более портфелей активов. Причем последние могут существенно отличаться. То есть показатель увязывает риск и доходность. Позволяет оценить отношение между среднеквадратическим отклонением и ожидаемой доходностью в относительном выражении. Соответственно, сопоставить полученные результаты.
При принятии инвестиционного решения необходимо учитывать следующий момент: когда ожидаемая доходность актива близка к 0, коэффициент вариации может получиться большим. Причем показатель значительно меняется при незначительном изменении доходности.
В Excel не существует встроенной функции для расчета коэффициента вариации. Но можно найти частное от стандартного отклонения и среднего арифметического значения. Рассмотрим на примере.
Доходность двух ценных бумаг за предыдущие пять лет:
Наглядно это можно продемонстрировать на графике:
![](https://i0.wp.com/exceltable.com/otchety/images/otchety57-2.png)
Обычно показатель выражается в процентах. Поэтому для ячеек с результатами установлен процентный формат.
Значение коэффициента для компании А – 33%, что свидетельствует об относительной однородности ряда. Формула расчета коэффициента вариации в Excel:
![](https://i1.wp.com/exceltable.com/otchety/images/otchety57-3.png)
Сравните: для компании В коэффициент вариации составил 50%: ряд не является однородным, данные значительно разбросаны относительно среднего значения.
Интерпретация результатов
Прежде чем включить в инвестиционный портфель дополнительный актив, финансовый аналитик должен обосновать свое решение. Один из способов – расчет коэффициента вариации.
Ожидаемая доходность ценных бумаг составит:
![](https://i1.wp.com/exceltable.com/otchety/images/otchety57-4.png)
Среднеквадратическое отклонение доходности для активов компании А и В составляет:
![](https://i0.wp.com/exceltable.com/otchety/images/otchety57-5.png)
Ценные бумаги компании В имеют более высокую ожидаемую доходность. Они превышают ожидаемую доходность компании А в 1,14 раза. Но и инвестировать в активы предприятия В рискованнее. Риск выше в 1,7 раза. Как сопоставить акции с разной ожидаемой доходностью и различным уровнем риска?
Для сопоставления активов двух компаний рассчитан коэффициент вариации доходности. Показатель для предприятия В – 50%, для предприятия А – 33%. Риск инвестирования в ценные бумаги фирмы В выше в 1,54 раза (50% / 33%). Это означает, что акции компании А имеют лучшее соотношение риск / доходность. Следовательно, предпочтительнее вложить средства именно в них.
Таким образом, коэффициент вариации показывает уровень риска, что может оказаться полезным при включении нового актива в портфель. Показатель позволяет сопоставить ожидаемую доходность и риск. То есть величины с разными единицами измерения.
РАСЧЕТ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ
ПРАКТИЧЕСКАЯ РАБОТА 3
Цель работы : получение практических навыков в расчете различных показателей (меры) вариации в зависимости от поставленных исследованием задач.
Порядок выполнения работы :
1. Определить вид и форму (простая или взвешенная) показателей вариации.
3. Сформулировать выводы.
1. Определение вида и формы показателей вариации.
Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным относятся: размах вариации, квартильное отклонение, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Относительными показателями являются коэффициенты осцилляции, вариации, относительное линейное отклонение, относительный показатель квартильной вариации и т. д.
Размах вариации (R) является наиболее простым измерителем вариации признака и определяется по следующей формуле:
где – наибольшее значение варьирующего признака;
– наименьшее значение варьирующего признака.
Квартильное отклонение (Q) – применяется для характеристики вариации признака в совокупности. Может использоваться вместо размаха вариации во избежание недостатков, связанных с использованием крайних значений.
где и – соответственно первая и третья квартили распределения.
Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине ; 25% единиц будут заключены между и ; 25% единиц будут заключены между и , и остальные 25% превосходят .
Квартили 1 и 3 определяются по формулам:
,
Где – нижняя граница интервала, в котором находится первая квартиль;
– сумма накопленных частот интервалов, предшествующих интервалу, в котором находится первая квартиль;
– частота интервала, в котором находится первая квартиль.
где Ме – медиана ряда;
,
условные обозначения те же, что и для величин .
В симметричных или умеренно асимметричных распределениях Q»2/3s. Так как на квартильное отклонение не влияют отклонения всех значений признака, то его использование следует ограничить случаями, когда определение среднего квадратического отклонения затруднительно или невозможно.
Среднее линейное отклонение () представляет собой среднюю величину из абсолютных отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения.
Невзвешенное среднее линейное отклонение,
- взвешенное среднее линейное отклонение.
Дисперсия () – средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия вычисляется по формулам простой невзвешенной и взвешенной.
- невзвешенная,
- взвешенная.
Среднее квадратическое отклонение (s) – наиболее распространенный показатель вариации, представляет собой квадратный корень из значения дисперсии.
Размах вариации, квартильное отклонение, среднее линейное и квадратическое отклонения – величины именованные, имеют размерность осредняемого признака. Дисперсия единицы измерения не имеет.
Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Чаще всего относительные показатели выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности.
Коэффициент осцилляции (относительный размах вариации) рассчитывается по формуле:
,
Линейный коэффициент вариации (относительное линейное отклонение):
Относительный показатель квартильной вариации :
или
Коэффициент вариации :
,
Наиболее часто применяемый в статистике показатель относительной колеблемости – коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и как характеристику однородности совокупности. Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Существует шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации (17; С.61).
Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму).
В практике статистического исследования приходится встречаться с самыми различными распределениями. При изучении однородных совокупностей имеем дело, как правило, с одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности, появление двух и более вершин говорит о необходимости перегруппировки данных с целью выделения более однородных групп. Выяснение общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса. Симметричным является распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. Для симметричных распределений средняя арифметическая, мода и медиана равны между собой. В связи с этим простейший показатель асимметрии основан на соотношении показателей центра распределения: чем больше разница между средними , тем больше асимметрия ряда.
Для характеристики асимметричности в центральной части распределения, то есть основной массы единиц или для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель асимметрии К.Пирсона:
Величина показателя As может быть положительной и отрицательной. Положительная величина показателя указывает на наличие правосторонней асимметрии (правая ветвь относительно максимальной ординаты вытянута больше, чем левая). При правосторонней асимметрии между показателями центра распределения существует соотношение: . Отрицательный знак показателя асимметрии свидетельствует о наличии левосторонней асимметрии (рис. 1). Между показателями центра распределения в этом случае имеется соотношение: .
![]() |
Рис. 1. Распределение:
1 – с левосторонней асимметрией; 2 – с правосторонней асимметрией.
Другой показатель, предложенный шведским математиком Линдбергом, рассчитывают по формуле:
где П – процент тех значений признака, которые превосходят по величине среднюю арифметическую.
Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка (в симметричном распределении его величина равна нулю):
где - центральный момент третьего порядка:
σ – среднеквадратическое отклонение.
Применение этого показателя дает возможность не только определить величину асимметрии, но и ответить на вопрос о наличии или отсутствии асимметрии в распределении признака в генеральной совокупности. Оценка степени существенности этого показателя дается с помощью средней квадратической ошибки, которая зависит от объема наблюдений n и рассчитывается по формуле:
.
Если отношение , асимметрия существенна, и распределение признака в генеральной совокупности не является симметричным. Если отношение , асимметрия несущественна, ее наличие может быть объяснено влиянием различных случайных обстоятельств.
Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Линдбергом предложен следующий показатель для оценки эксцесса:
,
где П – доля (%) количества вариантов, лежащих в интервале, равном половине среднего квадратического отклонения в ту или другую сторону от средней арифметической.
Наиболее точным является показатель, использующий центральный момент четвертого порядка:
где - центральный момент четвертого момента;
- для несгруппированных данных;
- для сгруппированных данных.
На рисунке 2 представлены два распределения: одно – островершинное (величина эксцесса положительная), второе – плосковершинное (величина эксцесса отрицательная). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении отношение .
![]() |
Рис. 2. Распределение:
1,4 – нормальное; 2 – островершинное; 3 – плосковершинное
Средняя квадратическая ошибка эксцесса рассчитывается по формуле:
,
где n – число наблюдений.
Если , то эксцесс существенен, если , то несущественен.
Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпирическое исследование к типу кривых нормального распределения.
2. Рассмотрим методику исчисления показателей вариации.
Показатели вариации
Понятие вариации
Вариация - это наличие различий у отдельных единиц совокупности по какому-либо признаку.
Эта категория занимает особое место в статистической науке, ибо именно наличие вариации единиц совокупности предопределяет необходимость статистики. Если бы отдельные единицы совокупности имели они и те же значения признаков (например, рост, возраст у всех живущих людей был бы одинаковый), то для изучения данной совокупности по этим признакам достаточно было бы изучить только одну единицу совокупности. Однако зачастую значения признаков колеблются, изменяются при переходе от одной единицы к другой. Как правило, вариация является порождением следующих причин:
Своеобразие условий, в которых происходит развитие отдельных единиц совокупности;
Неравномерность развития отдельных единиц.
Например, причиной вариации роста у отдельно взятых людей является генетическая особенность каждого организма (основная причина), особенности питания, экологическая обстановка и т.д.; вариация урожайности может быть вызвана климатическими, почвенными особенностями зоны произрастания, режима и возможности полива, качеством посадочного материала и т.д.
Вариация существует во времени и в пространстве.
Под вариацией в пространстве понимается колеблемость значений признака по отдельным территориям (урожайность пшеницы в разных регионах).
Под вариацией во времени подразумевается объективное изменение значений признака в разные периоды (или моменты). Например, со временем изменяется средняя продолжительность предстоящей жизни, доходность предприятий отрасли, уровень потребностей людей и т.д.
Изучение вариации имеет важное значение, так как вариация характеризует степень однородности совокупности. Однородность совокупности - необходимое условие при расчете большинства статистических показателей, в частности средних величин.
Показатели вариации
Показатели вариации являются необходимым дополнением при расчете средних величин, так как определяют степень однородности совокупности.
Система показателей вариации включает следующее:
Размах вариации;
Среднее квадратическое отклонение;
Дисперсия;
Коэффициент вариации.
Значение показателей вариации:
Характеризуются размеры вариации признака;
Показатели вариации дополняют систему средних величин, в которой затушевываются индивидуальные различия;
Показатели вариации позволяют охарактеризовать уровень однородности совокупности;
С помощью показателей вариации, путем сравнения вариации у отдельных признаков (разных), есть возможность измерить взаимосвязь между этими признаками.
Первый показатель, так называемый размах вариации, - наиболее простой из показателей, характеризует абсолютные размеры изменения признака и определяется как разница максимального и минимального значений признака:
Несмотря на простоту расчета, этот показатель имеет важный недостаток - учитывает только два приграничных значения. В случае аномальности одного или двух приграничных значений, он может исказить действительную вариацию совокупности.
Для того чтобы избавиться от этого недостатка, рассчитывают отклонение каждой индивидуальной величины от средней по совокупности. Таким образом, учитывается значение каждой единицы совокупности. Для того чтобы охарактеризовать это отклонение одним числом, рассчитывают среднюю из этих значений. Данный показатель носит название среднее абсолютное (линейное) отклонение и определяется следующим образом:
Простой вид;
- взвешенный вид (для сгруппированных данных);
где d(L) - среднее абсолютное (линейное) отклонение;
х - индивидуальное значение признака (варианта);
Среднее из значений признака;
п - численность совокупности;
f - частота.
Среднее линейное отклонение характеризует средний размер отклонений индивидуальных значений признака от средней величины. Таким образом, он характеризует абсолютные размеры вариации, имеет те же единицы измерения, что и признак, вариацию которого характеризует.
Недостаток: ввиду того, что применяется модуль, затруднено проведение математических операций. Поэтому он применяется редко.
Для того чтобы избавиться от недостатка предыдущего показателя, разницу между индивидуальным значением и средней возведем в квадрат и затем извлечем корень квадратный из полученного среднего значения. Полученный показатель будет называться среднее квадратическое отклонение:
- простая.
- взвешенная.
Играет ту же роль, что и среднее абсолютное отклонение, но, имеет перед ним одно преимущество, а именно, с ним проще проводить математические операции. Ввиду этого в 90 случаях из 100 используется этот показатель.
Еще более удобный для математических преобразований показатель вариации - дисперсия, который представляет собой среднее квадратическое отклонение в квадрате:
- простая,
- взвешенная.
С помощью дисперсии и среднего квадратического отклонения измеряются взаимосвязи между различными признаками. Кроме того, по этим показателям можно сравнивать совокупности в смысле их однородности по одинаковым признакам.
Вывод об однородности совокупности позволяет сделать коэффициент вариации , который может быть рассчитан несколькими способами в зависимости от исходной информации:
Характеризует средний процент отклонений индивидуальных значений признака от средней величины.
,
,
,
где V – коэффициент вариации;
σ – среднее квадратическое отклонение;
d (L) – среднее линейное отклонение;
Х МО – мода (структурная средняя);
Х МЕ – медиана(структурная средняя).
Коэффициент вариации имеет большое значение. Он позволяет сравнивать уровень вариации по различным признакам и используется для характеристики однородности совокупности. Если коэффициент вариации меньше 33%, то совокупность однородна.
Пример расчета показателей вариации.
Распределение студентов вуза по возрасту характеризуются следующими данными (табл. 1):
Таблица 1
Рассчитайте показатели, характеризующие вариацию возраста студентов для каждой формы
обучения. Сравните полученные результаты.
Рассчитаем показатели вариации, характеризующие совокупность студентов очно-заочной формы
обучения.
1. Размах вариации:
R = x max – x min = 31 - 18,5 = 12,5 (лет)
2. Средняя арифметическая:
3. Среднее линейное отклонение:
Возраст отдельно взятого студента отклоняется от среднего по совокупности возраста - 27 лет - на 3 года. То есть можно утверждать, что возраст наибольшего числа студентов не будет выходить за границы интервала: от 24,3 до 30,4 лет.
27,36 - 3,07 < 27,36 < 27,36+ 3,07.
Среднее квадратическое отклонение:
Среднее квадратическое отклонение также характеризует абсолютную величину отклонения индивидуального значения от средней. Как правило, значение среднего квадратического отклонения больше среднего линейного отклонения.
Дисперсия:
=13,899
Характеризует квадрат отклонений индивидуального значения от средней величины. Коэффициент вариации:
Средний процент отклонений индивидуальных значений от средней величины составляет 13,6%. Совокупность однородна. Сделаем аналогичные расчеты по совокупности студентов дневного отделения. Получаем следующие результаты:
d(L) = 3,40
V = 21,9%
На основании приведенных расчетов можно сделать вывод о том, что совокупность студентов очно-заочного отделения более однородная.
Расчет показателей вариации - достаточно трудоемкий процесс. В некоторых случаях, когда имеется ряд показателей с равноотстоящими моментами времени или равноинтервальный ряд распределения, расчет может быть упрощен. Сокращенные способы расчета дисперсии базируются на знании свойств дисперсии. Свойства дисперсии:
Если от всех значений варианты х отнять (прибавить) постоянное число А, то дисперсия не изменится;
Если каждое значение варианты разделить (умножить) на постоянную величину к, то дисперсия уменьшится (увеличится) в к 2 раз.
Сокращенные способы расчета дисперсии:
2. Способ моментов – применяется только в случае равенства интервалов.
Полученные из опыта величины неизбежно содержат погрешности, обусловленные самыми разнообразными причинами. Среди них следует различать погрешности систематические и случайные. Систематические ошибки обусловливаются причинами, действующими вполне определенным образом, и могут быть всегда устранены или достаточно точно учтены. Случайные ошибки вызываются весьма большим числом отдельных причин, не поддающихся точному учету и действующих в каждом отдельном измерении различным образом. Эти ошибки невозможно совершенно исключить; учесть же их можно только в среднем, для чего необходимо знать законы, которым подчиняются случайные ошибки.
Будем обозначать измеряемую величину через А, а случайную ошибку при измерении х. Так как ошибка х может принимать любые значения, то она является непрерывной случайной величиной, которая вполне характеризуется своим законом распределения.
Наиболее простым и достаточно точно отображающим действительность (в подавляющем большинстве случаев) является так называемый нормальный закон распределения ошибок :
Этот закон распределения может быть получен из различных теоретических предпосылок, в частности, из требования, чтобы наиболее вероятным значением неизвестной величины, для которой непосредственным измерением получен ряд значений с одинаковой степенью точности, являлось среднее арифметическое этих значений. Величина 2 называется дисперсией данного нормального закона.
Среднее арифметическое
Определение дисперсии по опытным данным. Если для какой-либо величины А непосредственным измерением получено n значений a i с одинаковой степенью точности и если ошибки величины А подчинены нормальному закону распределения, то наиболее вероятным значением А будет среднее арифметическое :
a - среднее арифметическое,
a i - измеренное значение на i-м шаге.
Отклонение наблюдаемого значения (для каждого наблюдения) a i величины А от среднего арифметического : a i - a.
Для определения дисперсии нормального закона распределения ошибок в этом случае пользуются формулой:
2 - дисперсия,
a - среднее арифметическое,
n - число измерений параметра,
Среднеквадратическое отклонение
Среднеквадратическое отклонение показывает абсолютное отклонение измеренных значений от среднеарифметического . В соответствии с формулой для меры точности линейной комбинации средняя квадратическая ошибка среднего арифметического определяется по формуле:
, где
a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.
Коэффициент вариации
Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического :
, где
V - коэффициент вариации,
- среднеквадратическое отклонение,
a - среднее арифметическое.
Чем больше значение коэффициента вариации , тем относительно больший разброс и меньшая выравненность исследуемых значений. Если коэффициент вариации меньше 10%, то изменчивость вариационного ряда принято считать незначительной, от 10% до 20% относится к средней, больше 20% и меньше 33% к значительной и если коэффициент вариации превышает 33%, то это говорит о неоднородности информации и необходимости исключения самых больших и самых маленьких значений.
Среднее линейное отклонение
Один из показателей размаха и интенсивности вариации - среднее линейное отклонение (средний модуль отклонения) от среднего арифметического. Среднее линейное отклонение рассчитывается по формуле:
, где
_
a - среднее линейное отклонение,
a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.
Для проверки соответствия исследуемых значений закону нормального распределения применяют отношение показателя асимметрии к его ошибке и отношение показателя эксцесса к его ошибке.
Показатель асимметрии
Показатель асимметрии (A) и его ошибка (m a) рассчитывается по следующим формулам:
, где
А - показатель асимметрии,
- среднеквадратическое отклонение,
a - среднее арифметическое,
n - число измерений параметра,
a i - измеренное значение на i-м шаге.
Показатель эксцесса
Показатель эксцесса (E) и его ошибка (m e) рассчитывается по следующим формулам:
, где
![Bookmark and Share](http://s7.addthis.com/static/btn/v2/lg-share-en.gif)