Т.В. Чернова
Экономическая статистика
Учебное пособие. Таганрог: Изд-во ТРТУ,
1999
Глава 8. Статистическое изучение взаимосвязей
8.1. Основные понятия корреляционного и регрессионного
анализа
Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью
наблюдаемых процессов и явлений. При этом полнота описания так или иначе определяется
количественными характеристиками причинно-следственных связей между ними. Оценка
наиболее существенных из них, а также воздействия одних факторов на другие является
одной из основных задач статистики.
Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих
их видов выделяют функциональную (полную) и корреляционную (неполную)
связи. В первом случае величине факторного признака строго соответствует одно
или несколько значений функции. Достаточно часто функциональная связь проявляется
в физике, химии. В экономике примером может служить прямо пропорциональная зависимость
между производительностью труда и увеличением производства продукции.
Корреляционная связь (которую также называют неполной, или статистической)
проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой
переменной соответствует некоторый ряд вероятных значений независимой переменной.
Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на
взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между
признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи
каждому значению аргумента соответствуют случайно распределенные в некотором
интервале значения функции.
Например, некоторое увеличение аргумента повлечет за собой лишь среднее увеличение
или уменьшение (в зависимости от направленности) функции, тогда как конкретные
значения у отдельных единиц наблюдения будут отличаться от среднего. Такие зависимости
встречаются повсеместно. Например, в сельском хозяйстве это может быть связь
между урожайностью и количеством внесенных удобрений. Очевидно, что последние
участвуют в формировании урожая. Но для каждого конкретного поля, участка одно
и то же количество внесенных удобрений вызовет разный прирост урожайности, так
как во взаимодействии находится еще целый ряд факторов (погода, состояние почвы
и др.), которые и формируют конечный результат. Однако в среднем такая связь
наблюдается – увеличение массы внесенных удобрений ведет к росту урожайности.
По направлению связи бывают прямыми, когда зависимая переменная растет
с увеличением факторного признака, и обратными, при которых рост последнего
сопровождается уменьшением функции. Такие связи также можно назвать соответственно
положительными и отрицательными.
Относительно своей аналитической формы связи бывают линейными и нелинейными.
В первом случае между признаками в среднем проявляются линейные соотношения. Нелинейная взаимосвязь
выражается нелинейной функцией, а переменные связаны между собой в среднем нелинейно.
Существует еще одна достаточно важная характеристика связей с точки зрения взаимодействующих
факторов. Если характеризуется связь двух признаков, то ее принято называть парной.
Если изучаются более чем две переменные – множественной.
Указанные выше классификационные признаки наиболее часто встречаются в статистическом анализе.
Но кроме перечисленных различают также непосредственные, косвенные и ложные
связи. Собственно, суть каждой из них очевидна из названия. В первом случае факторы взаимодействуют
между собой непосредственно. Для косвенной связи характерно участие какой-то третьей переменной,
которая опосредует связь между изучаемыми признаками. Ложная связь – это связь, установленная
формально и, как правило, подтвержденная только количественными оценками. Она не имеет под
собой качественной основы или же бессмысленна.
По силе различаются слабые и сильные связи. Эта формальная характеристика
выражается конкретными величинами и интерпретируется в соответствии с общепринятыми
критериями силы связи для конкретных показателей.
В наиболее общем виде задача статистики в области изучения взаимосвязей состоит
в количественной оценке их наличия и направления, а также характеристике силы
и формы влияния одних факторов на другие. Для ее решения применяются две группы
методов, одна из которых включает в себя методы корреляционного анализа, а другая
– регрессионный анализ. В то же время ряд исследователей объединяет эти методы
в корреляционно-регрессионный анализ, что имеет под собой некоторые основания:
наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации
результатов и др.
Поэтому в данном контексте можно говорить о корреляционном анализе в широком
смысле – когда всесторонне характеризуется взаимосвязь. В то же время выделяют
корреляционный анализ в узком смысле – когда исследуется сила связи – и регрессионный
анализ, в ходе которого оцениваются ее форма и воздействие одних факторов на
другие.
Задачи собственно корреляционного анализа сводятся к измерению тесноты
связи между варьирующими признаками, определению неизвестных причинных связей
и оценке факторов оказывающих наибольшее влияние на результативный признак.
Задачи регрессионного анализа лежат в сфере установления формы зависимости,
определения функции регрессии, использования уравнения для оценки неизвестных
значении зависимой переменной.
Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели,
применение которых дает основание говорить о статистическом изучении взаимосвязей.
Следует заметить, что традиционные методы корреляции и регрессии широко представлены
в разного рода статистических пакетах программ для ЭВМ. Исследователю остается
только правильно подготовить информацию, выбрать удовлетворяющий требованиям
анализа пакет программ и быть готовым к интерпретации полученных результатов.
Алгоритмов вычисления параметров связи существует множество, и в настоящее время
вряд ли целесообразно проводить такой сложный вид анализа вручную. Вычислительные
процедуры представляют самостоятельный интерес, но знание принципов изучения
взаимосвязей, возможностей и ограничений тех или иных методов интерпретации
результатов является обязательным условием исследования.
Методы оценки тесноты связи подразделяются на корреляционные (параметрические)
и непараметрические. Параметрические методы основаны на использовании, как правило,
оценок нормального распределения и применяются в случаях, когда изучаемая совокупность
состоит из величин, которые подчиняются закону нормального распределения. На
практике это положение чаще всего принимается априори. Собственно, эти методы
– параметрические – и принято называть корреляционными.
Непараметрические методы не накладывают ограничений на закон распределения
изучаемых величин. Их преимуществом является и простота вычислений.
Это может быть интересно (избранные параграфы):
- Индексы при анализе структурных изменений
- Виды средних и способы их вычисления
- Показатели статистики основных производственных фондов
- Предмет, метод и основные категории статистики как науки
- Формы, виды и способы наблюдения
- Методы исчисления и анализа общественного продукта и национального дохода
|