Принцип безразличия

Материал из wikixw
Перейти к навигации Перейти к поиску

Принцип безразличия (также называемый принципом недостаточного основания) - это правило для определения эпистемологических вероятностей. Принцип безразличия гласит, что в отсутствие каких-либо соответствующих доказательств агенты должны распределить свое доверие (или "степени веры") поровну между всеми возможными рассматриваемыми результатами.

В байесовской вероятности это самый простой неинформативный априор. Принцип безразличия не имеет смысла при частотной интерпретации вероятности,

в которой вероятности представляют собой относительные частоты, а не степени веры в неопределенные утверждения, зависящие от информации о состоянии.

Примеры[править]

Примерами из учебников для применения принципа безразличия являются монеты, кости и карты.

По крайней мере, в макроскопической системе следует предположить, что физические законы, управляющие системой, недостаточно известны, чтобы предсказать результат. Как заметил несколько столетий назад Джон Арбутнот (в предисловии к "Законам случая", 1692),

Невозможно, чтобы кубик с такой определенной силой и направлением не упал на такую определенную сторону, только я не знаю силу и направление, которые заставляют его падать на такую определенную сторону, и поэтому я называю это случайностью, которая есть не что иное, как недостаток искусства.... При наличии достаточного времени и ресурсов нет фундаментальных оснований полагать, что нельзя было бы провести достаточно точные измерения, которые позволили бы с высокой точностью предсказывать исход монет, костей и карт: практическим примером этого является работа Перси Диакониса с автоматами для подбрасывания монет.

Монеты[править]

Симметричная монета имеет две стороны, произвольно обозначенные орлом (на многих монетах на одной стороне изображена голова человека) и решкой. Предполагая, что монета должна упасть на одну или другую сторону, результаты подбрасывания монеты являются взаимоисключающими, исчерпывающими и взаимозаменяемыми. Согласно принципу безразличия, мы присваиваем каждому из возможных исходов вероятность 1/2.

В этом анализе подразумевается, что силы, действующие на монету, неизвестны с какой-либо точностью. Если бы импульс, передаваемый монете при ее запуске, был известен с достаточной точностью, полет монеты можно было бы предсказать в соответствии с законами механики. Таким образом, неопределенность в результате подбрасывания монеты выводится (по большей части) из неопределенности в отношении начальных условий. Этот момент более подробно обсуждается в статье о подбрасывании монет.

Игральные кости[править]

Симметричный кубик имеет n граней, произвольно помеченных от 1 до n. Обычный кубический кубик имеет n = 6 граней, хотя можно построить симметричный кубик с разным количеством граней; см. Кубик. Мы предполагаем, что кубик упадет той или иной стороной вверх, и других возможных исходов нет. Применяя принцип безразличия, мы присваиваем каждому из возможных исходов вероятность 1/n. Как и в случае с монетами, предполагается, что начальные условия броска кости неизвестны с достаточной точностью, чтобы предсказать результат в соответствии с законами механики. Кости обычно бросают так, чтобы они отскакивали от стола или другой поверхности (поверхностей). Это взаимодействие значительно затрудняет прогнозирование результата.

Предположение о симметрии здесь имеет решающее значение. Предположим, что нас просят сделать ставку за или против исхода "6". Мы могли бы предположить, что здесь есть два соответствующих результата "6" или "не 6", и что они являются взаимоисключающими и исчерпывающими. Это предполагает присвоение вероятности 1/2 каждому из двух исходов.

Карты[править]

Стандартная колода содержит 52 карты, каждой из которых присвоен уникальный ярлык произвольным образом, то есть в произвольном порядке. Мы берем карту из колоды; применяя принцип безразличия, мы присваиваем каждому из возможных исходов вероятность 1/52.

Этот пример больше, чем другие, показывает трудность фактического применения принципа безразличия в реальных ситуациях. Что мы на самом деле подразумеваем под фразой "произвольно упорядоченный", так это просто то, что у нас нет никакой информации, которая привела бы нас к предпочтению конкретной карты. На практике это случается редко: новая колода карт, конечно же, не в произвольном порядке, как и колода сразу после раздачи карт. Поэтому на практике мыперетасуйте карты; это не уничтожит имеющуюся у нас информацию, а вместо этого (будем надеяться) сделает нашу информацию практически непригодной для использования, хотя в принципе она все еще пригодна для использования. Фактически, некоторые опытные игроки в блэкджек могут отслеживать тузы по колоде; для них условие применения принципа безразличия не выполняется.

Применение к непрерывным переменным[править]

Неправильное применение принципа безразличия может легко привести к бессмысленным результатам, особенно в случае многомерных непрерывных переменных. Типичным случаем неправильного использования является следующий пример:

Предположим, что в коробке спрятан куб. На этикетке на коробке указано, что куб имеет длину стороны от 3 до 5 см.

Мы не знаем фактическую длину стороны, но мы могли бы предположить, что все значения одинаково вероятны, и просто выбрать среднее значение 4 см.
Информация на этикетке позволяет нам рассчитать, что площадь поверхности куба составляет от 54 до 150 см2. Мы не знаем фактической площади поверхности, но можем предположить, что все значения равновероятны, и просто выбрать среднее значение 102 см2.
Информация на этикетке позволяет нам рассчитать, что объем куба составляет от 27 до 125 см3. Мы не знаем фактического объема, но можем предположить, что все значения равновероятны, и просто выбрать среднее значение 76 см3.
Однако теперь мы пришли к невозможному выводу, что куб имеет длину стороны 4 см, площадь поверхности 102 см2 и объем 76 см3!
В этом примере взаимно противоречивые оценки длины, площади поверхности и объема куба возникают из-за того, что мы предположили три взаимно противоречивых распределения для этих параметров: равномерное распределение для любой из переменных подразумевает неравномерное распределение для двух других. В общем, принцип безразличия не указывает, какая переменная (например, в данном случае длина, площадь поверхности или объем) должна иметь равномерное эпистемологическое распределение вероятностей.

Другим классическим примером такого рода неправильного использования является парадокс Бертрана. Эдвин Т. Джейнс ввел принцип групп преобразований, который может дать эпистемологическое распределение вероятностей для этой проблемы. Это обобщает принцип безразличия, говоря, что безразлично между эквивалентными проблемами, а не безразлично между предложениями. Это все еще сводится к обычному принципу безразличия, когда рассматривается перестановка меток как порождающая эквивалентные проблемы (т. Е. С использованием группы преобразований перестановок). Чтобы применить это к приведенному выше примеру, у нас есть три случайные величины, связанные геометрическими уравнениями. Если у нас нет причин отдавать предпочтение одной тройке значений перед другой, то наши априорные вероятности должны быть связаны правилом изменения переменных в непрерывных распределениях. Пусть L - длина, а V - объем. Тогда мы должны иметь

f_{L}(L)=\left|{\partial V \over \partial L}\r f_{L}(L)=\left|{\partial V \over \partial L}\right|f_{V}(V)=3L^{2}f_{V}(L^{3})},
где f_{L},\,f_{V}}{\displaystyle f_{L},\,f_{V}}функции плотности вероятности (pdf) указанных переменных. Это уравнение имеет общее решение: f(L)={K \over L}}f(L)={K \over L}, где K - константа нормализации, определяемая диапазоном L, в данном случае равным:
K^{-1}=\int _{3}^{5}{dL \)}K^{-1}=\int_{3}^{5}{dL \over L} = \log\left({5 \over 3}\right)
Чтобы подвергнуть это "проверке", мы запрашиваем вероятность того, что длина меньше 4. Это имеет вероятность:

{\displaystyle Pr(L<4)=\int _{3}^{4}{dL \over L\log({5 \over 3})}={\log({4 \over 3}) \over \log({5 \over 3})}\approx 0.56}Pr(L<4)=\int _Устарел^Шаблон:4{ dL \over L\log({5 \over 3})}={\log({4 \over 3}) \over \log({5 \over 3})}\приблизительно 0.56. Для объема это должно быть равно вероятности того, что объем меньше 4 3 = 64. PDF-файл тома

f(V^{1 \over 3}){1 \over 3}V^{-{2 \over 3}}={1 \over 3V\log({5 \over 3})}}f(V ^{{{1 \ более 3}}}){1 \более 3}V^{{-{2 \более 3}}}={1 \ более 3V \ log({5 \ более 3})}.

И тогда вероятность объема меньше 64 равна
Pr(V<64)=\int _{27}^{64}{\более 3V\log({5 \более 3})}={\log({64 \более 27}) \более 3\log({5 \более 3})}={3\log({4 \ over 3}) \over 3\log({5 \over 3})}={\log({4 \over 3}) \over \log({5 \ over 3})}\приблизительно 0,56.

Таким образом, мы достигли инвариантности в отношении объема и длины. Можно также показать ту же инвариантность относительно площади поверхности, которая меньше 6 (42) = 96. Однако обратите внимание, что это распределение вероятности не обязательно является "правильным". Точное распределение длин, объема или площади поверхности будет зависеть от того, как проводится "эксперимент".

Фундаментальная гипотеза статистической физики о том, что любые два микросостояния системы с одинаковой полной энергией равновероятны при равновесии, в некотором смысле является примером принципа безразличия. Однако, когда микросостояния описываются непрерывными переменными (такими как положения и импульсы), требуется дополнительная физическая основа, чтобы объяснить, при какой параметризации плотность вероятности будет равномерной. Теорема Лиувилля оправдывает использование канонически сопряженных переменных, таких как положения и их сопряженные импульсы.

Парадокс вина / воды показывает дилемму со связанными переменными и какую из них выбрать.

История[править]

Этот принцип вытекает из принципа Эпикура "множественных объяснений" (плеонахос тропос), согласно которому "если более чем одна теория согласуется с данными, сохраните их все”. Эпикурейец Лукреций развил эту мысль, проведя аналогию с множественными причинами смерти трупа. Первоначальные авторы теории вероятности, в первую очередь Якоб Бернулли и Пьер Симон Лаплас, считали принцип безразличия интуитивно очевидным и даже не потрудились дать ему название. Лаплас писал:

Теория случайности заключается в сведении всех событий одного и того же рода к определенному числу случаев, одинаково возможных, то есть к таким, в отношении которых мы можем быть в равной степени не уверены в их существовании, и в определении числа случаев, благоприятных для события, вероятность которого ищется. Отношение этого числа ко всем возможным случаям является мерой этой вероятности, которая, таким образом, является просто дробью, числителем которой является число благоприятных случаев, а знаменателем - число всех возможных случаев. Эти более ранние авторы, в частности Лаплас, наивно обобщили принцип безразличия на случай непрерывных параметров, дав так называемое "равномерное априорное распределение вероятностей", функцию, которая постоянна для всех действительных чисел. Он использовал эту функцию, чтобы выразить полное отсутствие знаний о значении параметра. Согласно Стиглеру (стр. 135), предположение Лапласа о равномерных априорных вероятностях не было метафизическим предположением.[5]Это было неявное предположение, сделанное для простоты анализа.

Принцип недостаточного разума - это его первое название, данное ему Йоханнесом фон Крисом[6], возможно, как игра на принципе достаточного основания Лейбница. Эти более поздние авторы (Джордж Буль, Джон Венн и другие) возражали против использования единого приора по двум причинам. Первая причина заключается в том, что постоянная функция не нормализуема и, следовательно, не является правильным распределением вероятностей. Вторая причина заключается в его неприменимости к непрерывным переменным, как описано выше.

"Принцип недостаточного разума" был переименован в "принцип безразличия" Джоном Мейнардом Кейнсом (1921)[7], который тщательно отметил, что он применяется только тогда, когда нет знаний, указывающих на неравные вероятности.

Попытки поставить это понятие на более прочную философскую основу, как правило, начинались с концепции равновероятности и развивались от нее к равновероятности.

Принципу безразличия можно дать более глубокое логическое обоснование, отметив, что эквивалентным состояниям знания должны быть присвоены эквивалентные эпистемологические вероятности. Этот аргумент был выдвинут Эдвином Томпсоном Джейнсом: он приводит к двум обобщениям, а именно к принципу групп преобразований, как в приоре Джеффриса, и принципу максимальной энтропии.

В более общем плане говорят о неинформативных предшествующих судимостях.

Смотрите также[править]

Байесовская эпистемология

  • Правило последовательности: формула для оценки основных вероятностей при небольшом количестве наблюдений или для событий, которые вообще не наблюдались в (конечных) выборочных данных

Пруф[править]