Коэффициент корреляции знаков (коэффициент Фехнера). Коэффициент корреляции в Excel Линейный коэффициент корреляции

Коэффициент Фехнера - это оценка степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от средних значений факторного и результативного признаков. Коэффициент Фехнера наряду с такими коэффициентами, как коэффициент Спирмэна и коэффициент Кэндэла, относится к коэффициентам корреляции знаков . Коэффициент корреляции знаков основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Вычисляется он следующим образом:

A #n b " data-id="a;b" data-formul="(a-b)/(a+b)" data-r="K ф ">Рассчитать свое значение


Коэффициент Фехнера может принимать значения от –1 до +1. Kф = 1 свидетельствует о возможном наличии прямой связи, Kф=-1 свидетельствует о возможном наличии обратной связи.

Назначение сервиса . Данный сервис предназначен для расчета коэффициент Фехнера в онлайн режиме. Также определяется значимость данного коэффициента.

Инструкция . Укажите количество данных (количество строк), нажмите Далее. Полученное решение сохраняется в файле Word . Также автоматически создается шаблон для проверки решения в Excel .

Расчет коэффициента Фехнера состоит из следующих этапов:

  1. Определяют средние значения для каждого признака (X и Y).
  2. Определяют знаки отклонения (-,+) от среднего значения каждого из признаков.
  3. Если знаки совпадают, присваивают значение А, иначе В.
  4. Считают количество А и В, вычисляя коэффициент Фехнера по формуле: K ф = (n a - n b)/(n a + n b) где n a - число совпадений знаков отклонений индивидуальных величин от средней; n b - число несовпадений.
Коэффициент Фехнера изменяется в пределах [-1;+1] и применяется для оценки тесноты связи качественных признаков (непараметрические методы).

Графическое представление коэффициента Фехнера


Пример №1 . При разработке глинистого раствора с пониженной водоотдачей в высокотемпературных условиях проводили параллельное испытание двух рецептур, одна из которых содержала 2% КМЦ и 1% Na2CO3, а другая 2% КМЦ, 1% Na2CO3 и 0,1% бихромата калия. В результате получена следующие значения Х (водоотдача через 30 с).

X1 9 9 11 9 8 11 10 8 10
X2 10 11 10 12 11 12 12 10 9
Проверит, различимы ли рассматриваемые растворы по значению водоотдачи.

Пример №2 . Коэффициент корреляции знаков , или коэффициент Фехнера, основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Вычисляется он следующим образом:

,

где n a - число совпадений знаков отклонений индивидуальных величин от средней; n b - число несовпадений.

Коэффициент Фехнера может принимать значения от -1 до +1. Kф = 1 свидетельствует о возможном наличии прямой связи, Kф =-1 свидетельствует о возможном наличии обратной связи.

Пример №2
Рассмотрим на примере расчет коэффициента Фехнера по данным, приведенным в таблице:
Средние значения:


Знаки отклонений от средней X

Знаки отклонений от средней Y

Совпадение (а) или несовпадение (b) знаков


Значение коэффициента свидетельствует о том, что можно предполагать наличие обратной связи.

Оценка Коэффициента корреляции знаков.

Для оценки коэффициента Фехнера достаточно оценить его значимость и найти доверительный интервал.
Значимость коэффициента Фехнера.

По таблице Стьюдента находим t табл:
t табл (n-m-1;a) = (6;0.05) = 1.943
Поскольку Tнабл > tтабл, то отклоняем гипотезу о равенстве 0 коэффициента корреляции знаков. Другими словами, коэффициент Фехнера статистически - значим.


Доверительный интервал для коэффициента Фехнера:
r(-1.0;-0.4495)

Пример №3 .
Рассмотрим на примере расчет коэффициента корреляции знаков по данным, приведенным в таблице.

Различные признаки могут быть связаны между собой.

Выделяют 2 вида связи между ними:

  • функциональная;
  • корреляционная.

Корреляция в переводе на русский язык – не что иное, как связь.
В случае корреляционной связи прослеживается соответствие нескольких значений одного признака нескольким значениям другого признака. В качестве примеров можно рассмотреть установленные корреляционные связи между:

  • длиной лап, шеи, клюва у таких птиц как цапли, журавли, аисты;
  • показателями температуры тела и частоты сердечных сокращений.

Для большинства медико-биологических процессов статистически доказано присутствие этого типа связи.

Статистические методы позволяют установить факт существования взаимозависимости признаков. Использование для этого специальных расчетов приводит к установлению коэффициентов корреляции (меры связанности).

Такие расчеты получили название корреляционного анализа. Он проводится для подтверждения зависимости друг от друга 2-х переменных (случайных величин), которая выражается коэффициентом корреляции.

Использование корреляционного метода позволяет решить несколько задач:

  • выявить наличие взаимосвязи между анализируемыми параметрами;
  • знание о наличии корреляционной связи позволяет решать проблемы прогнозирования. Так, существует реальная возможность предсказывать поведение параметра на основе анализа поведения другого коррелирующего параметра;
  • проведение классификации на основе подбора независимых друг от друга признаков.

Для переменных величин:

  • относящихся к порядковой шкале, рассчитывается коэффициент Спирмена;
  • относящихся к интервальной шкале – коэффициент Пирсона.

Это наиболее часто используемые параметры, кроме них есть и другие.

Значение коэффициента может выражаться как положительным, так и отрицательными.

В первом случае при увеличении значения одной переменной наблюдается увеличение второй. При отрицательном коэффициенте – закономерность обратная.

Для чего нужен коэффициент корреляции?

Случайные величины, связанные между собой, могут иметь совершенно разную природу этой связи. Не обязательно она будет функциональной, случай, когда прослеживается прямая зависимость между величинами. Чаще всего на обе величины действует целая совокупность разнообразных факторов, в случаях, когда они являются общими для обеих величин, наблюдается формирование связанных закономерностей.

Это значит, что доказанный статистически факт наличия связи между величинами не является подтверждением того, что установлена причина наблюдаемых изменений. Как правило, исследователь делает вывод о наличии двух взаимосвязанных следствий.

Свойства коэффициента корреляции

Этой статистической характеристике присущи следующие свойства:

  • значение коэффициента располагается в диапазоне от -1 до +1. Чем ближе к крайним значениям, тем сильнее положительная либо отрицательная связь между линейными параметрами. В случае нулевого значения речь идет об отсутствии корреляции между признаками;
  • положительное значение коэффициента свидетельствует о том, что в случае увеличения значения одного признака наблюдается увеличение второго (положительная корреляция);
  • отрицательное значение – в случае увеличения значения одного признака наблюдается уменьшение второго (отрицательная корреляция);
  • приближение значения показателя к крайним точкам (либо -1, либо +1) свидетельствует о наличии очень сильной линейной связи;
  • показатели признака могут изменяться при неизменном значении коэффициента;
  • корреляционный коэффициент является безразмерной величиной;
  • наличие корреляционной связи не является обязательным подтверждением причинно-следственной связи.

Значения коэффициента корреляции

Охарактеризовать силу корреляционной связи можно прибегнув к шкале Челдока, в которой определенному числовому значению соответствует качественная характеристика.

В случае положительной корреляции при значении:

  • 0-0,3 – корреляционная связь очень слабая;
  • 0,3-0,5 – слабая;
  • 0,5-0,7 – средней силы;
  • 0,7-0,9 – высокая;
  • 0,9-1 – очень высокая сила корреляции.

Шкала может использоваться и для отрицательной корреляции. В этом случае качественные характеристики заменяются на противоположные.

Можно воспользоваться упрощенной шкалой Челдока, в которой выделяется всего 3 градации силы корреляционной связи:

  • очень сильная – показатели ±0,7 — ±1;
  • средняя – показатели ±0,3 — ±0,699;
  • очень слабая – показатели 0 — ±0,299.

Данный статистический показатель позволяет не только проверить предположение о существовании линейной взаимосвязи между признаками, но и установить ее силу.

Виды коэффициента корреляции

Коэффициенты корреляции можно классифицировать по знаку и значению:

  • положительный;
  • нулевой;
  • отрицательный.

В зависимости от анализируемых значений рассчитывается коэффициент:

  • Пирсона;
  • Спирмена;
  • Кендала;
  • знаков Фехнера;
  • конкорддации или множественной ранговой корреляции.

Корреляционный коэффициент Пирсона используется для установления прямых связей между абсолютными значениями переменных. При этом распределения обоих рядов переменных должны приближаться к нормальному. Сравниваемые переменные должны отличаться одинаковым числом варьирующих признаков. Шкала, представляющая переменные, должна быть интервальной либо шкалой отношений.

  • точного установления корреляционной силы;
  • сравнения количественных признаков.

Недостатков использования линейного корреляционного коэффициента Пирсона немного:

  • метод неустойчив в случае выбросов числовых значений;
  • с помощью этого метода возможно определение корреляционной силы только для линейной взаимосвязи, при других видах взаимных связей переменных следует использовать методы регрессионного анализа.

Ранговая корреляция определяется методом Спирмена, позволяющим статистически изучить связь между явлениями. Благодаря этому коэффициенту вычисляется фактически существующая степень параллелизма двух количественно выраженных рядов признаков, а также оценивается теснота, выявленной связи.

  • не требующих точного определения значение корреляционной силы;
  • сравниваемые показатели имеют как количественные, так и атрибутивные значения;
  • равнения рядов признаков с открытыми вариантами значений.

Метод Спирмена относится к методам непараметрического анализа, поэтому нет необходимости проверять нормальность распределения признака. К тому же он позволяет сравнивать показатели, выраженные в разных шкалах. Например, сравнение значений количества эритроцитов в определенном объеме крови (непрерывная шкала) и экспертной оценки, выражаемой в баллах (порядковая шкала).

На эффективность метода отрицательно влияет большая разница между значениями, сравниваемых величин. Не эффективен метод и в случаях когда измеряемая величина характеризуется неравномерным распределением значений.

Пошаговый расчет коэффициента корреляции в Excel

Расчёт корреляционного коэффициента предполагает последовательное выполнение ряда математических операций.

Приведенная выше формула расчета коэффициента Пирсона, показывает насколько трудоемок этот процесс если выполнять его вручную.
Использование возможностей Excell ускоряет процесс нахождения коэффициента в разы.

Достаточно соблюсти несложный алгоритм действий:

  • введение базовой информации – столбец значений х и столбец значений у;
  • в инструментах выбирается и открывается вкладка «Формулы»;
  • в открывшейся вкладке выбирается «Вставка функции fx»;
  • в открывшемся диалоговом окне выбирается статистическая функция «Коррел», позволяющая выполнить расчет корреляционного коэффициента между 2 массивами данных;
  • открывшееся окно вносятся данные: массив 1 – диапазон значений столбца х (данные необходимо выделить), массив 2 – диапазон значений столбца у;
  • нажимается клавиша «ок», в строке «значение» появляется результат расчета коэффициента;
  • вывод относительно наличия корреляционной связи между 2 массивами данных и ее силе.
Коэффициент Фехнера - это оценка степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от средних значений факторного и результативного признаков. Коэффициент Фехнера наряду с такими коэффициентами, как коэффициент Спирмэна и коэффициент Кэндэла, относится к коэффициентам корреляции знаков . Коэффициент корреляции знаков основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Вычисляется он следующим образом:

A #n b " data-id="a;b" data-formul="(a-b)/(a+b)" data-r="K ф ">Рассчитать свое значение


Коэффициент Фехнера может принимать значения от –1 до +1. Kф = 1 свидетельствует о возможном наличии прямой связи, Kф=-1 свидетельствует о возможном наличии обратной связи.

Назначение сервиса . Данный сервис предназначен для расчета коэффициент Фехнера в онлайн режиме. Также определяется значимость данного коэффициента.

Инструкция . Укажите количество данных (количество строк), нажмите Далее. Полученное решение сохраняется в файле Word . Также автоматически создается шаблон для проверки решения в Excel .

Расчет коэффициента Фехнера состоит из следующих этапов:

  1. Определяют средние значения для каждого признака (X и Y).
  2. Определяют знаки отклонения (-,+) от среднего значения каждого из признаков.
  3. Если знаки совпадают, присваивают значение А, иначе В.
  4. Считают количество А и В, вычисляя коэффициент Фехнера по формуле: K ф = (n a - n b)/(n a + n b) где n a - число совпадений знаков отклонений индивидуальных величин от средней; n b - число несовпадений.
Коэффициент Фехнера изменяется в пределах [-1;+1] и применяется для оценки тесноты связи качественных признаков (непараметрические методы).

Графическое представление коэффициента Фехнера


Пример №1 . При разработке глинистого раствора с пониженной водоотдачей в высокотемпературных условиях проводили параллельное испытание двух рецептур, одна из которых содержала 2% КМЦ и 1% Na2CO3, а другая 2% КМЦ, 1% Na2CO3 и 0,1% бихромата калия. В результате получена следующие значения Х (водоотдача через 30 с).

X1 9 9 11 9 8 11 10 8 10
X2 10 11 10 12 11 12 12 10 9
Проверит, различимы ли рассматриваемые растворы по значению водоотдачи.

Пример №2 . Коэффициент корреляции знаков , или коэффициент Фехнера, основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Вычисляется он следующим образом:

,

где n a - число совпадений знаков отклонений индивидуальных величин от средней; n b - число несовпадений.

Коэффициент Фехнера может принимать значения от -1 до +1. Kф = 1 свидетельствует о возможном наличии прямой связи, Kф =-1 свидетельствует о возможном наличии обратной связи.

Пример №2
Рассмотрим на примере расчет коэффициента Фехнера по данным, приведенным в таблице:
Средние значения:


Знаки отклонений от средней X

Знаки отклонений от средней Y

Совпадение (а) или несовпадение (b) знаков


Значение коэффициента свидетельствует о том, что можно предполагать наличие обратной связи.

Оценка Коэффициента корреляции знаков.

Для оценки коэффициента Фехнера достаточно оценить его значимость и найти доверительный интервал.
Значимость коэффициента Фехнера.

По таблице Стьюдента находим t табл:
t табл (n-m-1;a) = (6;0.05) = 1.943
Поскольку Tнабл > tтабл, то отклоняем гипотезу о равенстве 0 коэффициента корреляции знаков. Другими словами, коэффициент Фехнера статистически - значим.


Доверительный интервал для коэффициента Фехнера:
r(-1.0;-0.4495)

Пример №3 .
Рассмотрим на примере расчет коэффициента корреляции знаков по данным, приведенным в таблице.

При корреляционному связи вместе с исследуемым фактором или несколькими факторами при множественной корреляции на результативный признак оказывают влияние и другие факторы, которые не учитываются или не могут быть точно учтены. При этом действие их может быть направлена как в сторону повышения результативного признака, так и в сторону ее снижения. Итак, исследование связи происходит в условиях, когда эта связь в большей или меньшей степени затушевывается противоречивой действием других причин. Поэтому одна из задач корреляционного анализа состоит в определении тесноты связи между признаками, в определении силы воздействия исследуемого фактора (факторов) на результативный признак.

Теснота связи в корреляционному анализе характеризуется с помощью специального относительного показателя, который получил название коэффициента корреляции.

При парной линейной зависимости теснота связи определяется с помощью линейного коэффициента корреляции

Коэффициент корреляции находится в пределах от 0 к ±1. в Если коэффициент корреляции равен нулю, то связь отсутствует, а если единице, то связь функциональная. Знак при коэффициенте корреляции указывает на направление связи ("+" - прямой "-" - обратная). Чем ближе коэффициент корреляции к единице, тем связь между признаками теснее.

Квадрат коэффициента корреляции называется коэффициентом детерминации (г2). Он показывает, какая доля общей вариации результативного признака определяется исследуемым фактором. Если коэффициент детерминации выраженный в процентах, то его следует читать так: вариация (колебания) зависимой переменной на столько-то процентов обусловлена вариацией фактора.

Между линейным коэффициентом корреляции (г) и коэффициентом полной регрессии (Ь) связь:

Следовательно, зная коэффициент корреляции (г) и значения средних квадратических отклонений по х и в можно определить коэффициент регрессии (Ь) и наоборот, зная коэффициент регрессии (Ь) и соответствующие средние квадратические отклонения можно вычислить коэффициент корреляции (г).

При парной линейной зависимости коэффициент корреляции и коэффициент полной регрессии имеют одинаковые знаки (плюс, минус).

Линейный коэффициент корреляции предназначен для оценки степени тесноты связи при линейной зависимости. Для случаев нелинейной связи между признаками используется другая формула коэффициента корреляции, которая следует из правила сложения дисперсий:

Из приведенного равенства видно, что чем больше влияние фактора на результативный признак, тем в большей степени ее значение дисперсии ("м.гр) приближается к значению общей дисперсии результативного признака.

Соответственно, чем больше "м.гР и меньше ае.гр тем связь между признаками будет теснее и наоборот. Следовательно, отношение межгрупповой (факторной) и общей дисперсий используется для оценки тесноты связи между признаками. Формула коэффициента корреляции имеет вид:

Учитывая, щосг2я = о-а-огля!>, формулу коэффициента корреляции можно представить как

Обе формулы коэффициента корреляции применяются для расчета тесноты связи при любой форме связи.

Из правила сложения дисперсий видно, что значение коэффициента корреляции находится в пределах от 0 до 1. Знак коэффициента корреляции с формулы не выводится. Если изучается связь между двумя признаками (парная простая корреляция), то направление связи (знак перед г) определяется непосредственно за знаком перед коэффициентом регрессии линейного уравнения.

При парной криволинейной зависимости, теснота связи при линейной зависимости, определяется с помощью специального показателя, аналогичного рассмотренному выше коэффициента корреляции г.

Этот показатель (чтобы подчеркнуть его принадлежность к криволинейного связи) обозначают символом иг и называют индексом корреляции:

Числовое значение индекса корреляции аналогичное коэффициенту корреляции: если иг = 1 - связь функциональная, если иг = 0 - связь отсутствует; чем иг ближе к единице, тем связь между признаками теснее.

Если известны коэффициенты регрессии уравнения связи, то индекс корреляции можно определить по другой, более простой формуле. Так, при параболической зависимости формула индекса корреляции может быть представлена как

Теснота связи при множественной корреляции определяется с помощью коэффициента множественной корреляции (ее) и коэффициента множественной детерминации (її2). По содержанию они аналогичны коэффициентам корреляции и детерминации при парном связи. их вычисления основывается на сравнении межгрупповой (факторной) и общей дисперсий:

Эта формула может быть применена для определения тесноты связи при любой форме связи.

Величина рч. изменяется от 0 до 1 и рассматривается как положительная, поскольку при множественных зависимостях связь результативного признака с одними факторами может быть положительным, а с другими - отрицательным.

Для случая зависимости результативного признака от двух факторов формула коэффициента множественной корреляции имеет вид

где Ги - парные линейные коэффициенты корреляции.

Приведенная формула применяется для определения тесноты связи при линейной зависимости.

Для определения тесноты связи между результативным признаком и каждым фактором при исключены влияния других факторов определяют частные коэффициенты корреляции, которые характеризуют "чистая" влияние фактора на результативный признак. Для их расчета используются парные коэффициенты корреляции.

В случае зависимости результативного признака от двух факторов (х1 и х2) можно рассчитать три коэффициента частичной корреляции:

1) между в и х1 при исключении влияния х2:

Коэффициенты корреляции при парных и множественных связей, а также индекс корреляции - это относительные величины, поэтому они могут быть использованы для сопоставления тесноты связи по нескольким явлениях, которые анализируются.

Следует иметь в виду, что показатели тесноты связи зависят от размаха варьирования изучаемых признаков. Чем больше вариация переменных, тем выше будет величина показателей тесноты связи.

Определим тесноту связи между исследуемыми признаками для нашего примера. Поскольку между продуктивностью коров и уровнем кормления имеет место линейная связь, тесноту связи определим с помощью линейного коэффициента корреляции

Коэффициент корреляции показывает, что между продуктивностью коров и уровнем кормления имеет место тесная (сильная) связь.

Коэффициент детерминации г2 = 0,93442 = 0,8731 показывает, что 87,31% общего колебания продуктивности коров обусловлено различиями в уровне кормления, а остальные 12,69% (100 - 87,31) - другими факторами, которые в данном случае не было учтено.

Коэффициент корреляции можно найти и по другим формулам.

  • Ранговый коэффициент корреляции Кендалла.
    Расчетная формула имеет вид: Ранжируем все элементы по признаку х^, по ряду другого признака х 10 ): где иа/2 - квантиль, определяемый по таблице нормального распределения для выбранного уровня значимости а (например, для а = 0,05 получим иа/2 = 1,96). Если п 10, то рассчитывают...
    (Многомерные статистические методы в экономике)
  • Коэффициенты корреляции показателей состояния региональных подсистем с показателем инвестиций
    Коэффициент рождаемости -0,08 (р = 0,768) 0,10 (р = 0,707) Коэффициент смертности -0,36 (р = 0,158) -0,65 (р = 0,004) Коэффициент младенческой смертности -0,13 (р = 0,619) -0,40 (р = 0,113) Численность населения 0,98 (р = 0,000) 0,62 (р = 0,008) Ожидаемая продолжительность жизни при рождении, лет 0,20...
    (Развитие регионов: диагностика региональных различий)
  • Коэффициенты корреляции показателей состояния региональных подсистем с показателем инвестиций
    Коэффициент рождаемости -0,08 (р = 0,768) 0,10 (р = 0,707) Коэффициент смертности -0,36 (р = 0,158) -0,65 (р = 0,004) Коэффициент младенческой смертности -0,13 (р = 0,619) -0,40 (р = 0,113) Численность населения 0,98 (р = 0,000) 0,62 (р = 0,008) Ожидаемая продолжительность жизни при рождении, лет 0,20...
    (Развитие регионов: диагностика региональных различий)
  • Коэффициент корреляции рангов Спирмэна
    Данный коэффициент относится к ранговым, т. е. коррелируются не сами значения факторного и результативного признаков, а их ранги (номера их мест, занимаемых в каждом ряду значений по возрастанию или убыванию). Коэффициент корреляции рангов Спирмэна основан на рассмотрении разности рангов значений факторного...
    (Общая теория статистики)