Анализ пути (статистика)

Материал из wikixw
Перейти к навигации Перейти к поиску

В статистике анализ путей используется для описания направленных зависимостей между набором переменных. Это включает модели, эквивалентные любой форме множественного регрессионного анализа, факторного анализа , канонического корреляционного анализа , дискриминантного анализа , а также более общие семейства моделей в многомерном дисперсионном анализе и ковариационном анализе ( MANOVA , ANOVA, ANCOVA ).

В дополнение к тому, чтобы считаться формой множественной регрессии, фокусирующейся на причинности, анализ пути можно рассматривать как частный случай моделирования структурных уравнений (SEM), в котором для каждой из переменных в причинной модели используются только отдельные индикаторы. Таким образом, анализ пути-SEM со структурной моделью, но никакой моделью измерения. Другие термины, используемые для обозначения анализа путей, включают каузальное моделирование, анализ ковариационных структур и модели латентных переменных .

Иудея Перл считает анализ путей прямым предком методов причинного вывода

История[править]

Анализ пути был разработан примерно в 1918 году генетиком Сьюэлом Райтом, который более подробно писал об этом в 1920-х годах. [2] это было с тех пор применено к обширному множеству сложных областей моделирования, включая биологию , психологию , социологию и эконометрику .[3]

Моделирование пути[править]

Обычно модели путей состоят из независимых и зависимых переменных, графически изображенных прямоугольниками или прямоугольниками. Переменные, которые являются независимыми переменными, а не зависимыми переменными, называются "экзогенными". Графически, эти экзогенные переменные коробки лежат на внешних краях модели и имеют только одноглавые стрелки, выходящие из них. Никакие одноголовые стрелки не указывают на экзогенные переменные. Переменные, которые являются исключительно зависимыми переменными или являются как независимыми, так и зависимыми переменными, называются "эндогенными". Графически эндогенные переменные имеют по крайней мере одну стрелку, направленную на них.

В приведенной ниже модели две экзогенные переменные (Ex 1 и Ex 2 ) моделируются как коррелированные, как показано двуглавой стрелкой. Обе эти переменные оказывают прямое и косвенное (через En 1 ) влияние на En 2 (две зависимые или "эндогенные" переменные/факторы). В большинстве моделей реального мира на эндогенные переменные могут также влиять переменные и факторы, происходящие извне модели (внешние эффекты, включая ошибку измерения). Эти эффекты изображаются терминами" e " или error в модели.

описание

Используя одни и те же переменные, возможны альтернативные модели. Например, можно предположить , что Ex 1 оказывает только косвенное влияние на En 2, удаляя стрелку из Ex 1 в En 2 ; и вероятность или "подгонку" этих двух моделей можно сравнить статистически.

Правила трассировки пути[править]

Чтобы справедливо вычислить отношения между любыми двумя коробками на диаграмме, Райт (1934) предложил простой набор правил трассировки пути, [4] для вычисления корреляции между двумя переменными. Корреляция равна сумме вклада всех путей, через которые связаны две переменные. Сила каждого из этих способствующих путей вычисляется как произведение коэффициентов пути вдоль этого пути.

Правила трассировки пути:

  • 1 Вы можете проследить стрелку назад, а затем вперед вдоль следующей или вперед от одной переменной к другой, но никогда не вперед, а затем назад. Другой способ думать об этом правиле состоит в том, что вы никогда не сможете перейти из одной головки стрелы в другую: головы-хвосты или хвосты-головы, а не головы-головы.
  • 2 Вы можете пройти через каждую переменную только один раз в данной цепочке путей.
  • 3 В каждую цепочку путей может быть включено не более одной двунаправленной стрелки.

Опять же, ожидаемая корреляция, обусловленная каждой цепочкой, прослеживаемой между двумя переменными, является произведением стандартизованных коэффициентов пути, а общая ожидаемая корреляция между двумя переменными является суммой этих составляющих цепочек путей.

NB: правила Райта предполагают модель без обратных связей: направленный граф модели не должен содержать циклов , т. е. это направленный ациклический граф , который широко изучался в рамках причинного анализа Иудеи Перл .

Трассировка пути в нестандартных моделях[править]

Если смоделированные переменные не стандартизированы, дополнительное правило позволяет вычислять ожидаемые ковариации, пока не существует путей, соединяющих зависимые переменные с другими зависимыми переменными.

Простейший случай получает, где все остаточные дисперсии моделируются явно. В этом случае, в дополнение к трем вышеприведенным правилам, вычислите ожидаемые ковариации:

  • Вычислить произведение коэффициентов в каждом маршруте между интересующими переменными, трассировка назад, изменение направления по двуглавой стрелке, затем трассировка вперед.
  • Суммирование по всем различным маршрутам, где пути считаются различными, если они содержат разные коэффициенты, или сталкиваются с этими коэффициентами в другом порядке.

Если остаточные дисперсии не включены явно или как более общее решение при любом изменении направления, встречающемся на маршруте (за исключением стрелок с двусторонним движением), включают дисперсию переменной в точке изменения. То есть, при трассировке пути от зависимой переменной к независимой переменной включите дисперсию независимой переменной, за исключением случаев, когда это нарушает правило 1 выше (проходя через соседние стрелки: т. е., когда независимая переменная также подключается к двуглавой стрелке, соединяющей ее с другой независимой переменной). При выводе дисперсий (что необходимо в случае, когда они не моделируются явно) путь из зависимой переменной в независимую переменную и обратно учитывается только один раз.

См. также[править]

Пруф[править]

/onyx.brandmaier.de/