Что показывает коэффициент вариации. Прогнозируем с Excel: как посчитать коэффициент вариации

Коэффициент вариации, VAR или CV, – ключевой показатель в оценке риска проектов и доходности ценных бумаг. Он позволяет заранее проанализировать сразу два показателя, которые обладают меняющимися во времени значениями. Если показатель оказывается менее 0,1, направление инвестирования характеризуется низким уровнем риска. При показателе свыше 0,3 уровень риска необоснованно высок. Для расчета удобнее всего использовать функции СТАНДОТКЛОН и СРЗНАЧ табличного редактора Excel.

 

Для того чтобы сформировать качественный инвестиционный портфель, инвесторам порой приходится прибегать к оценке входящих в него активов, которые обладают разным уровнем риска и доходности. Для этой цели используется широко известный в инвестиционном анализе и эконометрике показатель.

Коэффициент вариации (Coefficient of variation - CV, VAR) - относительный финансовый показатель, который демонстрирует сравнение рассеивания значений двух случайных показателей, которые имеют разные единицы измерения относительно ожидаемого значения.

Справка! Поскольку коэффициент вариации позволяет получить сопоставимые результаты, то его применение оптимально в рамках портфельного анализа. В ней он позволяет эффективно объединить значения риска и доходности и вывести результирующее значение.

Coefficient of variation - показатель из числа относительных методов статистики, который, как NPV и IRR, применяется в рамках инвестиционного анализа. Он измеряется в процентах и может применяться для сравнения вариаций двух несвязанных между собой критериев. Его чаще всего используют финансовые и инвестиционные аналитики.

Справка! На базе коэффициента вариации оценивается так называемый «унифицированный риск» (unitized risk), поскольку он оценивает относительный разброс двух показателей по отношению к прогнозному значению.

Для чего используют показатель VAR:

  • в целях сравнения двух разных показателей;
  • для определения степени устойчивости прогнозных моделей (в основном по инвестициям и портфельному инвестированию);
  • для осуществления XYZ-анализа.

Справка! XYZ-анализ - аналитический инструмент, в рамках которого продукция компании оценивается по двум параметрам: стабильность потребления и продаж.

Формула расчета коэффициента вариации

Суть расчета коэффициента вариации состоит в том, что по множеству значений рассчитывается сначала среднее квадратичное отклонение, а затем - среднее арифметическое, а после - найти их соотношение.

В общем виде формула расчета показателя VAR выглядит следующим образом:

CV = σ / t ср, где:

CV - коэффициент вариации;

σ - среднее квадратическое отклонение;

t - среднее арифметическое значение для случайной величины.

Формула расчета показателя VAR может принимать самые разнообразные интерпретации в зависимости от объекта оценки.

Важный момент! Очевидно, что применение представленных выше формул вручную, в особенности при наличии широкого круга значений, весьма затруднительно. Оттого для расчета применяется инструментарий табличного редактора Excel.

Значения показателя VAR в инвестиционном анализе

Нормативного значения этого показателя не существует. Однако имеются некоторые опорные критерии, которые помогают при его анализе и интерпретации.

Важный момент! Коэффициент CV имеет несколько недостатков - он не учитывает величины первоначальных вложений, предполагает симметричность разбросанных значений по отношению к среднему, а также не может использоваться для опционов, доходность которых может быть меньше 0. Оттого при наличии сомнений стоит дополнительно использовать показатели IRR и NPV.

Примеры расчета VAR в Excel

Расчет коэффициента вариации вручную − сложная и затяжная по времени процедура. Если выборка значительная, то расчёт по ней среднего квадратического отклонения вручную крайне чреват ошибками и неточностями.

Удобный способ определения VAR предлагает табличный редактор Excel. На его базе можно рассчитать:

  • среднее квадратическое отклонение (функция СТАНДОТКЛОН);
  • среднее арифметическое (функция СРЗНАЧ).

Для того чтобы разобраться в тонкостях использования CV, имеет смысл привести пример его расчета.

Пример расчета: оценка двух проектов с разной прибылью

Существует два бизнеса, которые на протяжении 5 лет демонстрируют разный финансовый результат. Для того чтобы сделать выбор между ними, инвестору стоит рассчитать коэффициент вариации.

Первоначально рассчитаем среднее квадратичное отклонение, используя статистическую функцию Excel СТАНДОТКЛОН.В.

Аналогичным образом на базе статистической функции СРЗНАЧ рассчитывается среднее арифметическое по обоим проектам

После этого остается разделить среднее квадратическое отклонение на среднее арифметическое и получить результат - значение коэффициента вариации.

Вывод! По проекту А уровень риска оказался равным 40%. При таком раскладе он представляется рискованным и неустойчивым. По проекту В уровень риска приемлемый - всего 11,64%. Инвестору уместно вложить средства в более надежный проект В, хотя в отдельные периоды проект А приносит большую прибыль.

Детальный алгоритм расчета показателя представлен в образце , составленном на базе табличного редактора Excel.

Детальный процесс расчета показателя вариации представлен в видеоролике.

Нам приходится сталкиваться с расчётом таких значений, как дисперсия, среднеквадратичное отклонение и, разумеется, коэффициент вариации. Именно расчёту последнего стоит уделить особое внимание. Очень важно, чтобы каждый новичок, который только приступает к работе с табличным редактором, мог быстро подсчитать относительную границу разброса значений.

Что такое коэффициент вариации и для чего он нужен?

Итак, как мне кажется, нелишним будет провести небольшой теоретический экскурс и разобраться в природе коэффициента вариации. Этот показатель необходим для отражения диапазона данных относительно среднего значения. Иными словами, он показывает отношение стандартного отклонения к среднему значению. Коэффициент вариации принято измерять в процентном выражении и отображать с его помощью однородность временного ряда.

Коэффициент вариации станет незаменимым помощником в том случае, когда вам необходимо будет сделать прогноз по данным из заданной выборки. Этот индикатор выделит главные ряды значений, которые будут наиболее полезными для последующего прогнозирования, а также очистит выборку от малозначительных факторов. Так, если вы видите, что значение коэффициента равно 0%, то с уверенностью заявляйте о том, что ряд является однородным, а значит, все значения в нём равны один с другим. В случае, если коэффициент вариации принимает значение, превышающее отметку в 33%, то это говорит о том, что вы имеете дело с неоднородным рядом, в котором отдельные значения существенно отличаются от среднего показателя выборки.

Как найти среднее квадратичное отклонение?

Поскольку для расчёта показателя вариации в Excel нам необходимо использовать среднее квадратичное отклонение, то вполне уместно будет выяснить, как нам посчитать этот параметр.

Из школьного курса алгебры мы знаем, что среднее квадратичное отклонение - это извлечённый из дисперсии квадратный корень, то есть этот показатель определяет степень отклонения конкретного показателя общей выборки от её среднего значения. С его помощью мы можем измерить абсолютную меру колебания изучаемого признака и чётко её интерпретировать.

Рассчитываем коэффициент в Экселе

К сожалению, в Excel не заложена стандартная формула , которая бы позволила рассчитать показатель вариации автоматически. Но это не значит, что вам придётся производить расчёты в уме. Отсутствие шаблона в «Строке формул» никоим образом не умаляет способностей Excel, потому вы вполне сможете заставить программу выполнить необходимый вам расчёт, прописав соответствующую команду вручную.

Для того чтобы рассчитать показатель вариации в Excel, необходимо вспомнить школьный курс математики и разделить стандартное отклонение на среднее значение выборки. То есть на деле формула выглядит следующим образом - СТАНДОТКЛОН(заданный диапазон данных)/СРЗНАЧ(заданный диапазон данных). Ввести эту формулу необходимо в ту ячейку Excel, в которой вы хотите получить нужный вам расчёт.

Не забывайте и о том, что поскольку коэффициент выражается в процентах, то ячейке с формулой нужно будет задать соответствующий формат. Сделать это можно следующим образом:

  1. Откройте вкладку «Главная».
  2. Найдите в ней категорию «Формат ячеек » и выберите необходимый параметр.

Как вариант, можно задать процентный формат ячейке при помощи клика по правой кнопке мыши на активированной клеточке таблицы. В появившемся контекстном меню, аналогично вышеуказанному алгоритму нужно выбрать категорию «Формат ячейки» и задать необходимое значение.

Выберите «Процентный», а при необходимости укажите число десятичных знаков

Возможно, кому-то вышеописанный алгоритм покажется сложным. На самом же деле расчёт коэффициента так же прост, как сложение двух натуральных чисел. Единожды выполнив эту задачу в Экселе, вы больше никогда не вернётесь к утомительным многосложным решениям в тетрадке.

Всё ещё не можете сделать качественное сравнение степени разброса данных? Теряетесь в масштабах выборки? Тогда прямо сейчас принимайтесь за дело и осваивайте на практике весь теоретический материал, который был изложен выше! Пусть статистический анализ и разработка прогноза больше не вызывают у вас страха и негатива. Экономьте свои силы и время вместе с

РАСЧЕТ ПОКАЗАТЕЛЕЙ ВАРИАЦИИ

ПРАКТИЧЕСКАЯ РАБОТА 3

Цель работы : получение практических навыков в расчете различных показателей (меры) вариации в зависимости от поставленных исследованием задач.

Порядок выполнения работы :

1. Определить вид и форму (простая или взвешенная) показателей вариации.

3. Сформулировать выводы.

1. Определение вида и формы показателей вариации.

Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным относятся: размах вариации, квартильное отклонение, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение. Относительными показателями являются коэффициенты осцилляции, вариации, относительное линейное отклонение, относительный показатель квартильной вариации и т. д.

Размах вариации (R) является наиболее простым измерителем вариации признака и определяется по следующей формуле:

где – наибольшее значение варьирующего признака;

наименьшее значение варьирующего признака.

Квартильное отклонение (Q) – применяется для характеристики вариации признака в совокупности. Может использоваться вместо размаха вариации во избежание недостатков, связанных с использованием крайних значений.

где и – соответственно первая и третья квартили распределения.

Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине ; 25% единиц будут заключены между и ; 25% единиц будут заключены между и , и остальные 25% превосходят .

Квартили 1 и 3 определяются по формулам:

,

Где – нижняя граница интервала, в котором находится первая квартиль;

– сумма накопленных частот интервалов, предшествующих интервалу, в котором находится первая квартиль;

– частота интервала, в котором находится первая квартиль.

где Ме – медиана ряда;

,

условные обозначения те же, что и для величин .

В симметричных или умеренно асимметричных распределениях Q»2/3s. Так как на квартильное отклонение не влияют отклонения всех значений признака, то его использование следует ограничить случаями, когда определение среднего квадратического отклонения затруднительно или невозможно.

Среднее линейное отклонение () представляет собой среднюю величину из абсолютных отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения.



Невзвешенное среднее линейное отклонение,

- взвешенное среднее линейное отклонение.

Дисперсия () – средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия вычисляется по формулам простой невзвешенной и взвешенной.

- невзвешенная,

- взвешенная.

Среднее квадратическое отклонение (s) – наиболее распространенный показатель вариации, представляет собой квадратный корень из значения дисперсии.

Размах вариации, квартильное отклонение, среднее линейное и квадратическое отклонения – величины именованные, имеют размерность осредняемого признака. Дисперсия единицы измерения не имеет.

Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Чаще всего относительные показатели выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности.

Коэффициент осцилляции (относительный размах вариации) рассчитывается по формуле:

,

Линейный коэффициент вариации (относительное линейное отклонение):

Относительный показатель квартильной вариации :

или

Коэффициент вариации :

,

Наиболее часто применяемый в статистике показатель относительной колеблемости – коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и как характеристику однородности совокупности. Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Существует шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации (17; С.61).

Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму).

В практике статистического исследования приходится встречаться с самыми различными распределениями. При изучении однородных совокупностей имеем дело, как правило, с одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности, появление двух и более вершин говорит о необходимости перегруппировки данных с целью выделения более однородных групп. Выяснение общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса. Симметричным является распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. Для симметричных распределений средняя арифметическая, мода и медиана равны между собой. В связи с этим простейший показатель асимметрии основан на соотношении показателей центра распределения: чем больше разница между средними , тем больше асимметрия ряда.

Для характеристики асимметричности в центральной части распределения, то есть основной массы единиц или для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель асимметрии К.Пирсона:

Величина показателя As может быть положительной и отрицательной. Положительная величина показателя указывает на наличие правосторонней асимметрии (правая ветвь относительно максимальной ординаты вытянута больше, чем левая). При правосторонней асимметрии между показателями центра распределения существует соотношение: . Отрицательный знак показателя асимметрии свидетельствует о наличии левосторонней асимметрии (рис. 1). Между показателями центра распределения в этом случае имеется соотношение: .



Рис. 1. Распределение:

1 – с левосторонней асимметрией; 2 – с правосторонней асимметрией.

Другой показатель, предложенный шведским математиком Линдбергом, рассчитывают по формуле:

где П – процент тех значений признака, которые превосходят по величине среднюю арифметическую.

Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка (в симметричном распределении его величина равна нулю):

где - центральный момент третьего порядка:

σ – среднеквадратическое отклонение.

Применение этого показателя дает возможность не только определить величину асимметрии, но и ответить на вопрос о наличии или отсутствии асимметрии в распределении признака в генеральной совокупности. Оценка степени существенности этого показателя дается с помощью средней квадратической ошибки, которая зависит от объема наблюдений n и рассчитывается по формуле:

.

Если отношение , асимметрия существенна, и распределение признака в генеральной совокупности не является симметричным. Если отношение , асимметрия несущественна, ее наличие может быть объяснено влиянием различных случайных обстоятельств.

Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Линдбергом предложен следующий показатель для оценки эксцесса:

,

где П – доля (%) количества вариантов, лежащих в интервале, равном половине среднего квадратического отклонения в ту или другую сторону от средней арифметической.

Наиболее точным является показатель, использующий центральный момент четвертого порядка:

где - центральный момент четвертого момента;

- для несгруппированных данных;

- для сгруппированных данных.

На рисунке 2 представлены два распределения: одно – островершинное (величина эксцесса положительная), второе – плосковершинное (величина эксцесса отрицательная). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении отношение .



Рис. 2. Распределение:

1,4 – нормальное; 2 – островершинное; 3 – плосковершинное

Средняя квадратическая ошибка эксцесса рассчитывается по формуле:

,

где n – число наблюдений.

Если , то эксцесс существенен, если , то несущественен.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпирическое исследование к типу кривых нормального распределения.

2. Рассмотрим методику исчисления показателей вариации.

Как доказать, что закономерность, полученная при изучении экспериментальных данных, не является результатом совпадения или ошибки экспериментатора, что она достоверна? С таким вопросом сталкиваются начинающие исследователи.Описательная статистика предоставляет инструменты для решения этих задач. Она имеет два больших раздела – описание данных и их сопоставление в группах или в ряду между собой.

Показатели описательной статистики

Существует несколько показателей, которые использует описательная статистика.

Итак, представим, что перед нами стоит задача описать рост всех студентов в группе из десяти человек. Вооружившись линейкой и проведя измерения, мы получаем маленький ряд из десяти чисел (рост в сантиметрах):

168, 171, 175, 177, 179, 187, 174, 176, 179, 169.

Если внимательно посмотреть на этот линейный ряд, то можно обнаружить несколько закономерностей:

  • Ширина интервала, куда попадает рост всех студентов, – 18 см.
  • В распределении рост наиболее близок к середине этого интервала.
  • Встречаются и исключения, которые наиболее близко расположены к верхней или нижней границе интервала.

Совершенно очевидно, что для выполнения задачи по описанию роста студентов в группе нет необходимости приводить все значения, которые будут измеряться. Для этой цели достаточно привести всего два, которые в статистике называются параметрами распределения. Это среднеарифметическое и стандартное отклонение от среднего арифметического. Если обратиться к росту студентов, то формула будет выглядеть следующим образом:

Среднеарифметическое значение роста студентов = (Сумма всех значений роста студентов) / (Число студентов, участвовавших в измерении)

Если свести все к строгим математическим терминам, то определение среднего арифметического (обозначается греческой буквой – μ («мю»)) будет звучать так:

Среднее арифметическое – это отношение суммы всех значений одного признака для всех членов совокупности (X) к числу всех членов совокупности (N).

Если применить эту формулу к нашим измерениям, то получаем, что μ для роста студентов в группе 175,5 см.

Если присмотреться к росту студентов, который мы измерили в предыдущем примере, то понятно, что рост каждого на сколько-то отличается от вычисленного среднего (175,5 см). Для полноты описания нужно понять, какой является разница между средним ростом каждого студента и средним значением.

На первом этапе вычислим параметр дисперсии. Дисперсия в статистике (обозначается σ 2 (сигма в квадрате)) – это отношение суммы квадратов разности среднего арифметического (μ) и значения члена ряда (Х) к числу всех членов совокупности (N). В виде формулы это рассчитывается понятнее:

Значения, которые мы получим в результате вычислений по этой формуле, мы будем представлять в виде квадрата величины (в нашем случае – квадратные сантиметры). Характеризовать рост в сантиметрах квадратными сантиметрами, согласитесь, нелепо. Поэтому мы можем исправить, точнее, упростить это выражение и получим среднеквадратичное отклонение формулу и расчёт, пример:

Таким образом, мы получили величину стандартного отклонения (или среднего квадратичного отклонения) – квадратный корень из дисперсии. С единицами измерения тоже теперь все в порядке, можем посчитать стандартное отклонение для группы:

Получается, что наша группа студентов исчисляется по росту таким образом: 175,50±5,25 см.

Среднее квадратичное отклонение хорошо работает с рядами, в которых разброс значений не очень велик (это хорошо прослеживалось на примере роста, где интервал был всего 18 см). Если бы ряд наших измерений был значительнее, а варьирование роста было сильнее, то стандартное отклонение стало непоказательным и нам потребовался бы критерий, который может отразить разброс в относительных единицах (т. е. в процентах, относительно средней величины).

Для этих целей предусмотрены абсолютные и относительные показатели вариации в статистике, характеризующие вариационные масштабы:

  • Размах вариации.

Квадратический коэффициент вариации (обозначается как Vσ) – это отношение среднеквадратичного отклонения к среднеарифметическому значению, выраженное в процентах.

Для нашего примера со студентами, определить Vσ несложно - он будет равен 3,18%. Основная закономерность – чем больше будет изменяться значение коэффициента, тем больше разброс вокруг среднего значения и тем менее однородна выборка.

Преимущество коэффициента вариации в том, что он показывает однородность значений (асимметрия) в ряду наших измерений, кроме того, на него не оказывают влияния масштаб и единицы измерения. Эти факторы делают коэффициент вариации особенно популярным в биомедицинских исследованиях. Будет считаться , что эксцесс значения Vσ =33% отделяет однородные выборки от неоднородных.

Если найти в ряду значений роста (первый пример) максимальное и минимальное значения, то получим размах вариации (обозначается как R, иногда ещё называется колеблемостью). В нашем примере – это значение будет равно 18 см. Эта характеристика используется для расчёта коэффициента осцилляции:

Коэффициент осцилляции – показывает как размах вариации будет относиться к среднему арифметическому ряда в процентном отношении.

Расчёты в Microsoft Ecxel 2016

* — в таблице указан диапазон A1:A10 для примера, при расчётах нужно указать требуемый диапазон.

Итак, обобщим информацию :

  1. Среднее арифметическое – это значение, позволяющее найти среднее значение показателя в ряду данных.
  2. Дисперсия – это среднее значение отклонений возведенное в квадрат.
  3. Стандартное отклонение (среднеквадратичное отклонение) – это корень квадратный из дисперсии, для приведения единиц измерения к одинаковым со среднеарифметическим.
  4. Коэффициент вариации – значение отклонений от среднего, выраженное в относительных величинах (%).

Отдельно следует отметить, что все приведённые в статье показатели, как правило, не имеют собственного смысла и используются для того, чтобы составлять более сложную схему анализа данных. Исключение из этого правила — коэффициент вариации, который является мерой однородности данных.

Вариация признака определяется различными факторами, часть этих факторов можно выделить, если статистическую совокупность разделить на группы по определенному признаку. Тогда, наряду с изучением вариации признака по совокупности в целом, можно изучить вариацию для каждой из составляющих ее группы и между этими группами. В простом случае, когда совокупность разделена на группы по одному фактору, изучение вариации достигается посредством вычисления и анализа трех видов дисперсий: общей, межгрупповой и внутригрупповой.

Эмпирический коэффициент детерминации

Эмпирический коэффициент детерминации широко применяется в статистическом анализе и является показателем, представляющим долю межгруппопой дисперсии в результативного признака и характеризует силу влияния группировочного признака на образование общей вариации. Он может быть рассчитан по формуле:

Показывает долю вариации результативного признака у под влиянием факторного признака х, он связан с коэффициентом корреляции квадратичной зависимостью. При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной связи - единице.

Например, когда изучается зависимость производительности труда рабочих от их квалификации коэффициент детерминации равен 0,7, то на 70% вариация производительности труда рабочих обусловлена различиями в их квалификации и на 30% - влиянием прочих факторов.

Эмпирическое корреляционное отношение - это квадратный корень из коэффициента детерминации. Отношение показывает тесноту связи между группировочным и результативным признаками. Эмпирическое корреляционное отношение принимает значения от -1 до 1. Если связи нет, то корреляционное отношение равняется нулю, т.е. все групповые средние равняются между собой и межгрупповой вариации нет. Значит, группировочный признак не влияет на образование общей вариации.

Если связь функциональная, то корреляционное отношение равняется единице. В таком случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповой вариации нет. Это значит, что группировочный признак полностью определяет вариацию результативного признака.

Чем ближе значение корреляционного отношения к единице, тем сильнее и ближе к функциональной зависимости связь между признаками. Для качественной оценки силы связи на основе показателя эмпирического коэффициента корреляции можно использовать соотношение Чэддока.

Соотношение Чэддока

  • Связь весьма тесная — коэффициент корреляции находится в интервале 0,9 — 0,99
  • Связь тесная — Rxy = 0,7 — 0,9
  • Связь заметная — Rxy = 0,5 — 0,7
  • Связь умеренная — Rxy = 0,3 — 0,5
  • Связь слабая — Rxy = 0,1 — 0,3