P(A | B)と限界確率P(A)の違いは、AとBの分布に依存しますか? たとえば、Bが連続的で指数関数的であるか、離散的で均一であるかについて、通常はさらに学習しますか?


答え 1:

[編集:17:33 EST-申し訳ありませんが、急いでいたので、答えがずさんでした。厳密な意味ではない場合、KLメトリックを呼び出すなど、疑わしい瞬間をいくつか修正しました]

-免責事項-P(A)とP(A | B)の関係に興味があり、P(A)がP(A | B)に「近い」かどうかを確認しようとしています(質問の「違い」) )。 P(A | B)の形式はわかりませんが、P(A)とP(B)の形式は知っています

モデリングの前提として、P(B)は特定の形式の分布であり、P(A)は特定の形式の分布であると仮定しています。 次のことができるかどうか尋ねています:

1)任意のP(A)およびP(B)の条件付きP(A | B)を計算します。-一般に、辺縁の任意の分布形式では、条件式の形式についてあまり言及していないため、答えはノーです。

2)P(A | B)とP(A)の差を計算します。追加のモデリング仮定なしで、P(A)とP(B)のみを知っています。

分布の非類似性の適切なメトリック(まあ、真のメトリックではありませんが、とにかく有用です)はKLの発散であるため、計算するには、比較する両方の分布を知る必要があります。

P(A | B)がわからないため、発散を計算できません。