Adım Adım Bayesci Çıkarım 3 - Model için Tanı Testleri ve Modellerin Karşılaştırılması

Tanı Testleri

Sonsal dağılımı hesapladıktan sonra MCMC algoritmalarının yapısı gereği bazı tanı testleri yapmamız gerekir:

0621

0622

Bu iki ortalama birbirlerinden anlamlı derecede farklı ise, örneklemimiz problemlidir.

0624

İlk grafikte herhangi bir anomali görünmemektedir.

İkinci grafikte, yaklaşık ilk 1500 örneklem, geri kalanlardan daha farklı görünmektedir. Büyük ihtimalle, başlangıç dağılımı, hedef dağılımdan oldukça farklıdır ancak zincir hedef dağılıma yakınsamayı başarmıştır.

Üçüncü grafikte ise, örneklemler arasında ciddi bir otokorelasyon bulunmaktadır. Büyük ihtimalle efektif örneklem büyüklüğü küçük olduğu için bu problem ile karşılaşılmıştır.

Bilgi Kriterleri

0601 olmak üzere T tane modeli karşılaştırmak istediğimizi düşünelim.

Akaike Bilgi Kriteri (AIC)

Amaç, gerçek 0603 ve tahmin edilen 0602 arasındaki Kullback-Leibler ıraksamasını minimum yapmaktır:

0607

Burada, 0608 bir sabit olduğundan,

0609

ifadesini maksimize etmek yeterli olacaktır. Akaike’ye göre en iyi model, maksimum 0610 değerini verir. Monte Carlo integrasyonu ile 0611 integralini hesaplarsak,

0612

Bu da bize 0604 tahmini için log-benzerlik 0613 değerini verir. Akaike, 0614 değerinin 0615 değerini modelin karmaşıklığına (0606: modeldeki parametre sayısı) bağlı olarak aşırı tahmin ettiğini göstermiştir:

0616

ve aşağıdaki kriteri önermiştir:

0617

Akaike bilgi kriteri, doğrusal regresyon, genelleştirilmiş doğrusal modeller, otoregresif modeller için uygun olsa da, derin sinir ağlar, mixture modeller için uygun değildir.

Watanabe–Akaike Bilgi Kriteri (WAIC)

Akaike bilgi kriterinin singüler istatistiksel modeller için genelleştirilmiş halidir ve Akaike bilgi kriterinin Bayesci versiyonudur.

Kaynaklar