Frekanscı ve Bayesci İstatistiğin Karşılaştırılması

Hangi istatistiksel yaklaşım olduğundan bağımsız olarak, herhangi bir istatistiksel çıkarım paradigması aşağıdaki şeylerle ilgilenir:

  1. Öğrenmek veya test etmekle ilgilendiğimiz bazı bilinmeyen çokluklar (quantity). Bunlar parametre olarak adlandırılır.

  2. Gözlemlediğimiz ve bilgi içermesini ümit ettiğimiz bazı veriler.

  3. Veriler ve parametreler arasında ilişki kurmamıza yardım edecek modeller.

Frekansçı bakış açısına göre:

Bayesci bakış açısına göre:

Örnek 1. Bayesci bilardo oyunu olarak da bilinen oyun aşağıdaki gibi tanımlanır:

Alice ve Bob bir odaya girerler. Perdenin arkasında göremedikleri bir bilardo masası vardır. Arkadaşları Carol masaya bir top atar ve nereye indiğini işaretler. Daha sonra Carol masaya toplar atmaya başlar ve, eğer bir top işaretli noktanın soluna düşerse Alice 1 puan alır, sağına düşerse Bob 1 puan alır. Carol’un yansız olduğunu varsayalım. 6 puana ilk ulaşan kişi oyunu kazanır.

İşaretin konumu, sonraki atışların sonucunu belirleme de önemli bir unsurdur. Eğer ilk atış sağa doğru düşerse, sonraki atışlar Alice’in lehine olacaktır. Tersine, ilk atış sola doğru düşerse, sonraki atışlar Bob’un lehine olacaktır.

Bir oyunda, 8 atıştan sonra, Alice 5 ve Bob 3 puana sahip olsun. Bu oyunu Bob’un kazanma şansı nedir?

Çözüm

Bob’un 3 kere üst üste kazanma şansını hesaplayacağız.

0302

olur. Bunu ve binom dağılımını kullanırsak (Binom dağılımı, başarı olasılığı p, başarısızlık olasılığı 1-p olmak üzere, N denemede n tane başarı elde etme olasılığını verir),

0303

olarak bulunur. Yani Bob’un bu oyunda kazanma olasılığı %5’dir.

Frekansı ve Bayesci yaklaşımlar farklı sonuç verdi. Hangisinin doğru olduğuna nasıl karar vereceğiz?

Monte Carlo simülasyonundan daha sonra detaylı olarak bahsedeceğim. Basitçe açıklamak gerekirse; yüksek sayıda rasgele oyun üretip, kaç tanesinde Bob’un kazanacağını sayacağız.

Simülasyon için yazılmış Python kodu kaynaklar kısmındaki 4. linkte bulunabilir. Simülasyon sonucuna bakarsak Bob’un kazanma olasılığının 0.09 olduğunu gözüyoruz.

Örneğimizde frekanscı yaklaşım yanlış sonuç verdi, ancak bu frekanscı yaklaşımın yanlış olduğu anlamına gelmemektedir. Bu tip problemlerle uğraşmak için çeşitli frekanscı yöntemler mevcuttur, ancak Bayesci yaklaşım - Bayesci yaklaşımın daha zor olduğu düşünüldüğü halde - basit bir model ile daha doğru sonuç vermektedir.

Kaynaklar