Каузальная модель

Материал из wikixw
Перейти к навигации Перейти к поиску

В философии науки каузальная модель (или структурная каузальная модель) - это концептуальная модель, описывающая каузальные механизмы системы . Причинно-следственные модели могут улучшить структуру исследований, предоставляя четкие правила для принятия решения о том, какие независимые переменные должны быть включены/контролироваться.

Они могут позволить получить ответы на некоторые вопросы из существующих данных наблюдений без необходимости проведения интервенционного исследования, такого как рандомизированное контролируемое исследование . Некоторые интервенционные исследования неуместны по этическим или практическим причинам, что означает, что без причинно-следственной модели некоторые гипотезы не могут быть проверены.

Причинные модели могут помочь решить вопрос о внешней валидности (применимы ли результаты одного исследования к неисследованным популяциям). Причинно-следственные модели могут позволять объединять данные из нескольких исследований (при определенных обстоятельствах) для ответа на вопросы, на которые не может ответить ни один отдельный набор данных.

Причинно-следственные модели поддаются фальсификации, поскольку если они не соответствуют данным, они должны быть отклонены как недействительные.

Причинно-следственные модели нашли применение в области обработки сигналов, эпидемиологии и машинного обучения .

Сравнение двух конкурирующих каузальных моделей (DCM, GCM), используемых для интерпретации изображений фМРТ

Определение[править]

  • Причинные модели-это математические модели, представляющие причинно-следственные связи внутри отдельной системы или популяции. Они облегчают вывод о причинно-следственных связях из статистических данных. Они могут многое рассказать нам об эпистемологии причинности и о связи между причинностью и вероятностью. Они также были применены к темам, представляющим интерес для философов, таким как логика контрфактических предложений, теория принятия решений и анализ фактической причинности.
   - Стэнфордская энциклопедия философии

Pearl определяет причинную модель как упорядоченную тройку ⟨ U , V , E ⟩ rangle , где U-множество экзогенных переменных, значения которых определяются факторами вне модели; V-множество эндогенных переменных, значения которых определяются факторами внутри модели; и E-множество структурных уравнений, выражающих значение каждой эндогенной переменной как функцию значений других переменных в U и V.

История[править]

Аристотель определил таксономию причинности, включающую материальные, формальные, действенные и конечные причины. Юм отверг систематику Аристотеля в пользу контрфактических предложений . В какой-то момент он отрицал, что объекты обладают "силами", которые делают одну причину, а другую следствие. позже он принял "если первый объект не был, то второй никогда не существовал" ("но-для" причинности).

В конце 19 века начала формироваться дисциплина статистики. После многолетних усилий по выявлению причинных правил для таких областей, как биологическое наследование, Гальтон ввел концепцию средней регрессии (воплощенной на втором курсе спада в спорте), которая позже привела его к не-причинной концепции корреляции .

Будучи позитивистом , Пирсон вычеркнул понятие причинности из большей части науки как недоказуемый частный случай ассоциации и ввел коэффициент корреляции как метрику ассоциации. Он писал: "сила как причина движения-это точно то же самое, что Бог дерева-причина роста", и эта причина была только "фетишем среди непостижимых тайн современной науки". Пирсон основал компанию Biometrika и лабораторию биометрии в Университетском колледже Лондона, которая стала мировым лидером в области статистики.

В 1908 году Харди и Вайнберг решили проблему стабильности признаков, которая привела Гальтона к отказу от причинности, возродив менделевское наследование .

В 1921 году путь анализа Райта стал теоретическим предком причинного моделирования и причинно-следственных графиков.[5] он разработал этот подход , пытаясь распутать относительное влияние наследственности, развития и окружающей среды на паттерны шерсти морских свинок. Он подкрепил свои тогдашние еретические утверждения, показав, как такие анализы могут объяснить связь между весом морской свинки при рождении, in utero время и размер подстилки. Оппозиция этим идеям видных статистиков привела к тому, что в течение последующих 40 лет они игнорировались (за исключением животноводов). Вместо этого ученые полагались на корреляции, отчасти по указанию критика Райта (и ведущего статистика) Фишера .[4] одним исключением был Буркс, студент, который в 1926 году был первым, кто применил диаграммы путей для представления опосредующего влияния ( медиатора ) и утверждал, что удержание постоянной медиатора вызывает ошибки. Она, возможно, изобрела схемы путей самостоятельно.

В 1923 году Нейман представил концепцию потенциального результата, но его статья не была переведена с польского на английский язык до 1990 года.

В 1958 году Кокс писал, что управление для переменной Z допустимо только в том случае, если она вряд ли будет затронута независимыми переменными.

В 1960-х годах Дункан, Блалок , Голдбергер и другие вновь открыли для себя анализ пути. Читая работу Блалока о диаграммах пути, Дункан вспомнил лекцию Огберна двадцатью годами ранее, в которой упоминалась статья Райта, в которой в свою очередь упоминался Беркс.

Социологи первоначально называли причинные модели структурным уравнением моделирования, но как только он стал механическим методом, он потерял свою полезность, что привело некоторых практиков отвергать любую связь с причинностью. Экономисты приняли алгебраическую часть анализа траекторий, назвав ее одновременным моделированием уравнений. Однако экономисты все еще избегали приписывать своим уравнениям каузальный смысл.

Через шестьдесят лет после своей первой статьи Райт опубликовал статью, которая резюмировала ее, следуя Карлину и др.критика, которая возражала, что он обрабатывает только линейные отношения и что надежные, свободные от модели представления данных были более показательными.

В 1973 году Льюис выступал за замену корреляции на причинно-следственную связь (контрфактические предложения). Он имел в виду способность человека представлять себе альтернативные миры, в которых есть причина или нет и в которых следствие появляется только после его причины. в 1974 году Рубин ввел понятие "потенциальные результаты" в качестве языка для постановки причинных вопросов.

В 1983 году Картрайт предложил, чтобы любой фактор, который "причинно релевантен" к эффекту, был обусловлен, выходя за пределы простой вероятности в качестве единственного руководства.

В 1986 году Барон и Кенни ввели принципы обнаружения и оценки медиации в системе линейных уравнений. По состоянию на 2014 год их статья была 33-й наиболее цитируемой из всех времен. в том же году Гренландия и Робинс ввели "обменный" подход к обработке путаницы, рассматривая контрфактический. Они предложили оценить, что произошло бы с группой лечения, если бы они не получили лечение, и сравнить этот результат с результатами лечения контрольной группы. Если они совпадали, то смешение считалось отсутствующим.

Лестница причинности[править]

Причинная метамодель перла включает в себя трехуровневую абстракцию, которую он называет лестницей причинности. Самый низкий уровень-ассоциативный (видение / наблюдение) - предполагает выявление закономерностей или закономерностей во входных данных, выраженных в виде корреляций. Средний уровень, вмешательство (делание), предсказывает последствия преднамеренных действий, выраженных в виде причинно-следственных связей. Высший уровень, Контрфактуалы (воображаемые), включает в себя построение теории (части) мира, которая объясняет, почему конкретные действия имеют конкретные последствия и что происходит в отсутствие таких действий.

Ассоциация[править]

Один объект ассоциируется с другим, если наблюдение за одним изменяет вероятность наблюдения за другим. Пример: покупатели, которые покупают зубную пасту, скорее всего, также купят зубную нить. Математически:

  • P ( f l o s s | t o o t h p a s t e )

или вероятность получения (покупки) зубной нити с учетом (покупки) зубной пасты. Ассоциации также могут быть измерены путем вычисления корреляции этих двух событий. Ассоциации не имеют никаких причинных следствий. Одно событие может привести к другому, обратное может быть истинным, или оба события могут быть вызваны каким-то третьим событием (несчастный hygenist пристыдит покупателя, чтобы лучше лечить свой рот ).

Интервенция[править]

Этот уровень утверждает определенные причинно-следственные связи между событиями. Причинность оценивается путем экспериментального выполнения некоторого действия, которое влияет на одно из событий. Пример: если бы мы удвоили цены на зубную пасту, какова была бы новая вероятность покупки? Причинно-следственная связь не может быть установлена путем изучения истории (изменения цен), потому что изменение цены может быть вызвано какой-то другой причиной, которая сама может повлиять на второе событие (тариф, который увеличивает цену обоих товаров). Математически:

  • P ( f l o s s | d o ( t o o t h p a s t e ) )

где do-оператор, который сигнализирует об экспериментальном вмешательстве (удвоении цены). Контрфактические

Самый высокий, контрфактический уровень предполагает рассмотрение альтернативной версии прошедшего события. Пример: какова вероятность того, что, если бы магазин удвоил цену зубной нити, покупатель зубной пасты все равно купил бы ее? Ответ " да " утверждает существование причинно-следственной связи. Модели, которые могут ответить на контрфактические предложения, позволяют проводить точные вмешательства, последствия которых можно предсказать. В крайнем случае, такие модели принимаются как физические законы (как в законах физики, например, инерция, которая говорит, что если сила не приложена к неподвижному объекту, он не будет двигаться).

Причинность[править]

Причинность vs корреляция[править]

Статистика вращается вокруг анализа взаимосвязей между несколькими переменными. Традиционно эти отношения описываются как корреляции, ассоциации без каких-либо подразумеваемых причинно-следственных связей. Причинные модели пытаются расширить эту структуру, добавляя понятие причинно-следственных связей, в которых изменения одной переменной вызывают изменения в других.

Определения причинности в двадцатом веке основывались исключительно на вероятностях/ассоциациях. Было сказано, что одно событие (X) вызывает другое, если оно повышает вероятность другого (Y). Математически это выражается как:

  • P ( Y | X ) > P ( Y )

Такие определения неадекватны, поскольку другие отношения (например, общая причина для X и Y) могут удовлетворять этому условию. Причинно-следственная связь имеет отношение ко второй ступени лестницы. Ассоциации находятся на первом этапе и предоставляют только доказательства последнего.

Более позднее определение попыталось устранить эту двусмысленность, обусловив ее фоновыми факторами. Математически:

  • P ( Y | X , K = k ) > P ( Y | K = k )

где K-множество фоновых переменных, а k представляет значения этих переменных в определенном контексте. Однако требуемый набор фоновых переменных является неопределенным (несколько наборов могут увеличить вероятность), пока вероятность является единственным критерием [ требуется разъяснение ] .

Другие попытки определить причинность включают причинность Грейнджера, тест статистической гипотезы, что причинность (в экономике ) может быть оценена путем измерения способности предсказывать будущие значения одного временного ряда, используя предыдущие значения другого временного ряда.

Типы[править]

Причина может быть необходимой, достаточной, способствующей или некоторой комбинацией.[6]

Необходимо[править]

Для того чтобы x был необходимой причиной y, наличие y должно подразумевать предшествующее возникновение X. Наличие x, однако, не означает, что произойдет y.[7] необходимые причины также известны как "но-для" причин, поскольку в y не произошло бы, если бы не наступление X.

Достаточные причины=[править]

Для того чтобы x был достаточной причиной y, наличие x должно подразумевать последующее возникновение y . Однако другая причина z может независимо вызывать Y. Таким образом, наличие y не требует предварительного появления X.

Сопутствующие причины[править]

Для того чтобы x был сопутствующей причиной y , наличие x должно увеличивать вероятность Y. Если вероятность равна 100%, то вместо этого x называется достаточным. Кроме того, может возникнуть необходимость в наличии сопутствующей причины.

Модель[править]

Причинная диаграмма[править]

Причинная диаграмма-это направленный график, который отображает причинные связи между переменными в причинной модели. Причинная диаграмма содержит набор переменных (или узлов). Каждый узел соединен стрелкой с одним или несколькими другими узлами, на которые он оказывает причинное влияние. Наконечник стрелы определяет направление причинности, например, стрелка, соединяющая переменные A и B со наконечником стрелы в точке B, указывает на то, что изменение A вызывает изменение B (с соответствующей вероятностью). Путь-это обход графа между двумя узлами, следующий за причинными стрелками.

Причинно-следственные диаграммы включают в себя причинно-следственные циклические диаграммы, направленные ациклические графики и диаграммы Исикавы .

Причинные диаграммы не зависят от количественных вероятностей, которые их информируют. Изменения этих вероятностей (например, вследствие технологических усовершенствований) не требуют внесения изменений в модель.

Элементы модели[править]

Причинные модели имеют формальные структуры с элементами, обладающими определенными свойствами.

Узоры соединения[править]

Три типа соединений трех узлов-это линейные цепи, ветвящиеся вилки и сливающиеся коллайдеры.[4]

Цепочка[править]

Цепи-это прямые линейные соединения со стрелками, указывающими от причины к следствию. В этой модели B является посредником в том, что он опосредует изменение, которое в противном случае имело бы место на C.

  • A → B → C

Вилка[править]

В Форксе одна причина имеет несколько следствий. Эти два следствия имеют общую причину. Обусловленность на B (для конкретного значения B) обнаруживает положительную корреляцию между A и C, которая не является причинной.

  • A ← B → C A\левый угол B\правый угол C

"Обусловленность на B "означает" данное B " (т. е. данное значение B).

Разработка вилки-это конфаундер:

  • A ← B → C → A

В таких моделях B является общей причиной А и С (которая также вызывает А), что делает B конфаундером [ требуется разъяснение ] .

Коллайдер[править]

В коллайдерах несколько причин влияют на один результат. Кондиционер на B (для конкретного значения Б) часто выявляется причинная отрицательная корреляция между A и C. эта отрицательная корреляция был назван коллайдер предвзятости и "объяснить-далеко" эффект, как в, Б объясняет от соотношения между A и C. корреляция может быть положительной в случае, когда вклад от обоих A и C необходимы, чтобы повлиять Б.

  • A → B ← C

Типы узлов[править]

Посредник[править]

Узел-посредник изменяет влияние других причин на результат (в отличие от простого влияния на результат). например, в приведенном выше примере цепи B является посредником, поскольку он изменяет воздействие A (косвенная причина C) на C (результат).

Confounder[править]

Узел-конфаундер влияет на несколько результатов, создавая положительную корреляцию между ними.

Инструментальная переменная[править]

Инструментальная переменная-это та, которая:

  • есть путь к результату
  • не имеет другого пути к причинным переменным
  • не оказывает прямого влияния на результат

Коэффициенты регрессии могут служить оценками причинного влияния инструментальной переменной на конечный результат до тех пор, пока это влияние не смешивается. Таким образом, инструментальные переменные позволяют количественно определять причинные факторы без данных о конфаундерах.

Например, учитывая модель:

  • Z → X → Y ← U → X

Z является инструментальной переменной, поскольку она имеет путь к результату Y и не обоснована, например, U.

В приведенном выше примере, если Z и X принимают двоичные значения, то предположение о том, что Z = 0, X = 1 не происходит, называется монотонностью .

Уточнения к методике [требуется разъяснение ] включают создание инструмента [ требуется разъяснение ] путем обусловливания другой переменной [ требуется разъяснение ] для блокирования [ требуется разъяснение ] путей [ требуется разъяснение ] между инструментом и конфаундером [ требуется разъяснение] и объединения нескольких переменных для формирования единого инструмента [ требуется разъяснение].

Менделевская рандомизация[править]

Определение: Менделевская рандомизация использует измеренные вариации в генах известной функции для изучения причинного эффекта модифицируемого воздействия на заболевание в наблюдательных исследованиях .

Поскольку гены изменяются случайным образом в разных популяциях, наличие гена обычно квалифицируется как инструментальная переменная, подразумевая, что во многих случаях причинность может быть количественно оценена с помощью регрессии на наблюдательном исследовании.

Ассоциации[править]

Условия независимости[править]

Условия независимости - это правила для принятия решения о том, являются ли две переменные независимыми друг от друга. Переменные являются независимыми, если значения одного из них не влияют непосредственно на значения другого. Несколько причинных моделей могут совместно использовать условия независимости. Например, модели

  • A → B → C

и

  • A ← B → C A\левый угол B\правый угол C

имейте те же самые условия независимости, потому что обусловленность на в оставляет А и с независимыми. Однако эти две модели не имеют одинакового значения и могут быть сфальсифицированы на основе данных (то есть, если данные наблюдений показывают связь между А и С после обусловливания на B, то обе модели неверны). И наоборот, данные не могут показать, какая из этих двух моделей правильна, поскольку они имеют одинаковые условия независимости.

Обусловленность переменной-это механизм для проведения гипотетических экспериментов. Обусловленность переменной включает в себя анализ значений других переменных для данного значения обусловленной переменной. В первом примере условие на B подразумевает, что наблюдения для данного значения B не должны показывать корреляции между A и C. Если такая корреляция существует, то модель неверна. Не-причинные модели не могут проводить такие различия, потому что они не делают каузальных утверждений.

Confounder / deconfounder[править]

Важным элементом разработки корреляционных исследований является выявление потенциально противоречивых влияний на исследуемую переменную, таких как демографические показатели. Эти переменные управляются для устранения этих влияний. Однако правильный список смешивающих переменных не может быть определен априори . Таким образом, возможно, что исследование может контролировать для нерелевантных переменных или даже (косвенно) исследуемую переменную.[4]:139

Причинно-следственные модели предлагают надежный метод для идентификации соответствующих запутывающих переменных. Формально Z является конфаундером, если "Y связан с Z через пути, не проходящие через X". Они часто могут быть определены с использованием данных, собранных для других исследований. Математически, если

  • P ( Y | X ) ≠ P ( Y | d o ( X ) )

тогда X является конфаундером для Y.

Ранее предположительно неверные определения включали:

  • "Любая переменная, которая коррелирует как с X, так и с Y."
  • Y ассоциируется с Z среди неэкспонированных.
  • Неколлапсируемость: разница между "грубым относительным риском и относительным риском, возникающим в результате корректировки для потенциального конфаундера".
  • Эпидемиологическая: переменная, связанная с X в популяции в целом и связанная с Y среди людей, не подвергшихся воздействию X.

Последний имеет недостатки в том, что учитывая, что в модели:

  • X → Z → Y

Z соответствует определению, но является посредником, а не конфаундером, и является примером контроля за результатом.

В модели

  • X ← A → B ← C → Y

Традиционно Б считался конфаундером, потому что он связан с X и с Y, но не находится на каузальном пути и не является потомком чего-либо на каузальном пути. Управление для B приводит к тому, что он становится конфаундером. Это известно как М-смещение.

Регулировка бэкдора[править]

В каузальной модели метод идентификации всех соответствующих стран (деконфаундирование) заключается в блокировании каждого некаузального пути между X и Y без нарушения каких-либо каузальных путей.

Определение: бэкдор-путь между двумя переменными X и Y-это любой путь от X до Y, который начинается со стрелки, указывающей на X.

X и Y деконфаундируются, если каждый бэкдор-путь заблокирован и не контролируется-для переменной Z происходит от X. нет необходимости контролировать для любых переменных, кроме деконфаундеров.

Определение: критерий бэкдора выполняется, когда все пути бэкдора в модели блокируются.

Когда причинная модель является правдоподобным представлением реальности и выполняется критерий бэкдора, тогда коэффициенты частичной регрессии могут быть использованы в качестве (причинных) коэффициентов пути (для линейных отношений).

  • P ( Y | d o ( X ) ) = ∑ z P ( Y | X , Z = z ) P ( Z = z )

Регулировка передней двери[править]

Определение: входной путь-это прямой причинный путь, для которого данные доступны для всех переменных.

Следующее преобразование выражения do в выражение do-free выполняется путем обусловливания переменных вдоль пути входа.

  • P ( Y | d o ( X ) ) = ∑ z P ( Z = z , X ) ∑ x P ( Y | X = x , Z = z ) P ( X = x )

Предполагая, что данные для этих наблюдаемых вероятностей доступны, конечная вероятность может быть вычислена без эксперимента, независимо от существования других путевых путей и без скрытой корректировки.

Интервенции[править]

Запросы[править]

Запросы - это вопросы, задаваемые на основе определенной модели. На них обычно отвечают путем проведения экспериментов (вмешательств). Интервенции принимают форму фиксации значения одной переменной в модели и наблюдения за результатом. Математически такие запросы принимают вид (из примера):

  • P ( floss | d o ( toothpaste ) )

где оператор do указывает, что эксперимент явно изменил цену зубной пасты. Графически это блокирует любые причинные факторы, которые в противном случае повлияли бы на эту переменную. На диаграмме это стирает все причинные стрелки, указывающие на экспериментальную переменную.

Возможны более сложные запросы, в которых оператор do применяется (значение фиксировано) к нескольким переменным.

Do calculus[править]

Исчисление do-это набор манипуляций, доступных для преобразования одного выражения в другое, с общей целью преобразования выражений, содержащих оператор do, в выражения, которые этого не делают. Выражения, которые не включают оператор do, могут быть оценены только на основе данных наблюдений, без необходимости экспериментального вмешательства, которое может быть дорогостоящим, длительным или даже неэтичным (например, просить испытуемых начать курить). набор правил является полным (он может быть использован для получения каждого истинного утверждения в этой системе). Алгоритм может определить, является ли для данной модели решение вычислимым за полиномиальное время .

Правила[править]

Исчисление включает в себя три правила преобразования условных вероятностных выражений с участием оператора do. Правило 1

Правило 1 допускает добавление или исключение замечаний.[4]:235:

  • P ( Y | d o ( X ) , Z , W ) = P ( Y | d o ( X ) , Z )

в том случае, если переменная set Z блокирует все пути от W до Y и все стрелки, ведущие в X, были удалены. Правило 2

Правило 2 допускает замену вмешательства наблюдением или наоборот.[4]:235:

  • P ( Y | d o ( X ) , Z ) = P ( Y | X , Z )

в том случае, если Z удовлетворяет критерию задней двери .[4]:234 Правило 3

Правило 3 допускает исключение или добавление интервенций.[4]:

  • P ( Y | d o ( X ) ) = P ( Y )

в случае, когда никакие причинные пути не соединяют X и Y.

Расширения[править]

Правила не подразумевают, что любой запрос может иметь свои операторы do, удаленные. В этих случаях может быть возможно заменить переменную, которая подвергается манипуляции (например, диета) вместо одной, которая не является (например, холестерин крови), которая затем может быть преобразована, чтобы удалить do. Образец:

  • P ( Heart disease | d o

Контрфактические[править]

Контрфактические выражения рассматривают возможности, которые не встречаются в данных, например, развился ли бы у некурящего рак, если бы он был заядлым курильщиком. Они являются самой высокой ступенью на лестнице причинности Перл.

Потенциальный результат[править]

Определение: потенциальным результатом для переменной Y является "значение Y , которое было бы принято для отдельного [ необходимого разъяснения ] u, если бы X было присвоено значение x". Математически:

  • Y X = x ( u )

Потенциальный результат определяется на уровне индивида u. [4] : 270

Традиционный подход к потенциальным результатам основан на данных, а не на модели, что ограничивает его способность распутывать причинно-следственные связи. Он рассматривает причинные вопросы как проблемы отсутствующих данных и дает неправильные ответы даже на стандартные сценарии.

Причинно-следственный вывод[править]

В контексте причинно-следственных моделей потенциальные результаты интерпретируются причинно, а не статистически.

Первый закон причинного вывода гласит, что потенциальный результат

  • Y X ( u )

может быть вычислен путем изменения причинной модели M (путем удаления стрелок в X) и вычисления результата для некоторого x . Официально:

  • Y X ( u ) = Y M x ( u )

Проведение контрфактического анализа[править]

Изучение контрфактической модели с использованием причинно-следственной включает в себя три этапа. Этот подход является допустимым независимо от формы отношений модели (линейные или другие), когда отношения модели полностью определены, значения точек могут быть вычислены. В других случаях (например, когда доступны только вероятности) может быть вычислено вероятностно-интервальное утверждение (некурящий х будет иметь 10-20% вероятность рака).

Учитывая модель:

  • Y ← X → M → Y ← U

уравнения для вычисления значений A и C, полученные из регрессионного анализа или другой методики, могут быть применены, подставляя известные значения из наблюдения и фиксируя значения других переменных (контрфактические).

Похитить[править]

Примените похищающее рассуждение (логический вывод , который использует наблюдение, чтобы найти самое простое/наиболее вероятное объяснение) для оценки u, прокси для ненаблюдаемых переменных на конкретном наблюдении, которое поддерживает контрфактическое.

Act[править]

Для конкретного наблюдения используйте оператор do, чтобы установить контрфактический (например, m =0), изменяя уравнения соответственно.

Прогнозировать[править]

Вычислите значения выходного сигнала (y), используя модифицированные уравнения.

Посредничество[править]

Прямые и косвенные (опосредованные) причины можно различить только с помощью проводящих контрфактуалов. понимание медиации требует постоянного удержания медиатора при вмешательстве в прямую причину. В модели

Y ← M ← X → Y

M опосредует влияние X на Y, в то время как X также оказывает непосредованное влияние на Y. таким образом, M удерживается постоянным, а do(X) вычисляется.

Ошибка медиации вместо этого включает обусловливание медиатора, если медиатор и результат смешиваются, как это имеет место в приведенной выше модели.

Для линейных моделей косвенный эффект можно вычислить, взяв произведение всех коэффициентов пути вдоль опосредованного пути. Общий косвенный эффект рассчитывается как сумма отдельных косвенных эффектов. Для линейных моделей медиация показана тогда, когда коэффициенты уравнения, установленного без включения медиатора, существенно отличаются от уравнения, которое его включает.

Прямой эффект[править]

В экспериментах на такой модели контролируемое прямое воздействие (CDE) вычисляется путем форсирования значения медиатора M(do (M = 0)) и случайного присвоения некоторым субъектам каждого из значений X(do(X=0), do (X=1), ...) и наблюдая полученные значения Y.

  • C D E ( 0 ) = P ( Y = 1 | d o ( X = 1 ) , d o ( M = 0 ) ) − P ( Y = 1 | d o ( X = 0 ) , d o ( M = 0 ) )

Каждое значение медиатора имеет соответствующий CDE.

Однако лучший эксперимент-это вычисление естественного прямого эффекта. (NDE) это эффект, определяемый тем, что отношение между X и M остается нетронутым при вмешательстве в отношение между X и Y.

  • N D E = P ( Y M = M 0 = 1 | d o ( X = 1 ) ) − P ( Y M = M 0 = 1 | d o ( X = 0 ) )

Например, рассмотрим прямой эффект увеличения числа посещений стоматолога-гиганиста (X) с каждым вторым годом до каждого года, что стимулирует зубочистку (M). Десны (Y) становятся здоровее, либо из-за hygenist (прямой) или зубной нитью (медиатор/косвенный). Эксперимент заключается в том, чтобы продолжить чистку зубов зубной нитью, пропуская визит hygenist.

Косвенный эффект[править]

Косвенное влияние X на Y - это "увеличение, которое мы наблюдали бы в Y, сохраняя X постоянным и увеличивая M до любого значения, которое M достигло бы при единичном увеличении X".

Косвенные эффекты нельзя "контролировать", потому что прямой путь нельзя отключить, удерживая другую переменную константу. Естественный косвенный эффект (NIE) - это воздействие на здоровье десен (Y) от чистки зубов нитью (M). NIE вычисляется как сумма (случаев зубной нити и без зубной нити) разности между вероятностью зубной нити, заданной hygenist и без hygenist, или:

  • N I E = ∑ m [ P ( M = m | X = 1 ) − P ( M = m | X = 0 ) ] x x P ( Y = 1 | X = 0 , M = m )

Приведенный выше расчет NDE включает в себя контрфактические подстрочные индексы ( Y M = M 0 {\displaystyle Y_{M=M0}} {\displaystyle Y_{M=M0}}). Для нелинейных моделей, казалось бы, очевидная эквивалентность [4] : 322

  • T o t a l e f f e c t = D i r e c t e f f e c t + I n d i r e c t e f f e c t

не применяется из-за аномалий, таких как пороговые эффекты и двоичные значения. Однако,

  • T o t a l e f f e c t ( X = 0 → X = 1 ) = N D E ( X = 0 → X = 1 ) − N I E ( X = 1 → X = 0 )

работает для всех модельных связей (линейных и нелинейных). Это позволяет затем вычислять NDE непосредственно из данных наблюдений, без вмешательства или использования контрфактических индексов.

Транспортабельность[править]

Причинные модели предоставляют средство для интеграции данных между наборами данных, известное как транспорт, даже если причинные модели (и связанные с ними данные) отличаются. Например, данные обследования могут быть объединены с рандомизированными, контролируемыми экспериментальными данными. транспорт предлагает решение вопроса о внешней валидности , о том, может ли исследование применяться в ином контексте.

В тех случаях, когда две модели совпадают по всем соответствующим переменным и данные из одной модели, как известно, являются несмещенными, данные из одной популяции могут использоваться для получения выводов относительно другой. В других случаях, когда данные заведомо предвзяты, повторное взвешивание может позволить транспортировать набор данных. В третьем случае выводы могут быть сделаны из неполного набора данных. В некоторых случаях данные исследований нескольких популяций могут быть объединены (с помощью транспорта), чтобы сделать выводы о неизмеряемой популяции. В некоторых случаях объединение оценок(например, P (W|X)) из нескольких исследований может повысить точность вывода.

Do-исчисление обеспечивает общий критерий для переноса: целевая переменная может быть преобразована в другое выражение с помощью ряда do-операций, которые не включают никаких "производящих различия" переменных (тех, которые различают две популяции). аналогичное правило применяется к исследованиям, которые имеют существенно различных участников.

Байесовская сеть[править]

Основная статья: байесовская сеть

Любая причинная модель может быть реализована в виде байесовской сети. Байесовские сети могут быть использованы для обеспечения обратной вероятности события (учитывая результат, каковы вероятности конкретной причины). Это требует подготовки условной таблицы вероятностей, показывающей все возможные входные данные и исходы с соответствующими им вероятностями.

Например, с учетом двух переменных модели болезни и теста (для болезни) условная вероятностная таблица принимает вид:

Вероятность положительного теста на данное заболевание

Т Тест Тест
Заболевание Положительный Отрицательный
Отрицательный 12 88
Положительный 73 27

Согласно этой таблице, когда у пациента нет заболевания, вероятность положительного теста составляет 12%.

Хотя это легко выполнимо для небольших задач, по мере увеличения числа переменных и связанных с ними состояний таблица вероятностей (и связанное с ней время вычислений) увеличивается экспоненциально.

Байесовские сети используются коммерчески в таких приложениях, как беспроводная коррекция ошибок данных и анализ ДНК.

Смотрите также[править]

Пруф[править]

/academic.oup.com/ije/article/31/5/1030/745818