Doğruluk Hesaplayıcı Nedir?
Bir doğruluk hesaplayıcı, tahminlerin veya deneysel sonuçların doğruluğunu, bunları bilinen değerler veya sonuçlarla karşılaştırarak belirlemek için kullanılan bir araçtır. İstatistik, makine öğrenmesi, tıbbi testler ve kalite kontrol gibi alanlarda yaygın olarak kullanılır. Doğruluk, ölçülen değerlerin gerçek değerlere ne kadar yakın olduğunu yansıtan bir yüzde veya oran olarak ifade edilir. Örneğin, tıbbi tanıda doğruluk, bir testin gerçek pozitifleri (hasta bireyler) ve gerçek negatifleri (sağlıklı bireyler) ne kadar iyi tanımladığını değerlendirmeye yardımcı olur.
Doğruluk Formülü
Doğruluğu hesaplama formülü şu şekildedir:
Burada:
- Gerçek Pozitifler (GP): Doğru şekilde tanımlanan pozitif vakalar.
- Gerçek Negatifler (GN): Doğru şekilde tanımlanan negatif vakalar.
- False Pozitifler (FP): Negatif vakaların yanlışlıkla pozitif olarak sınıflandırılması.
- False Negatifler (FN): Pozitif vakaların yanlışlıkla negatif olarak sınıflandırılması.
Doğruluk Hesaplama Örnekleri
Örnek 1: Tıbbi Test
Yeni bir COVID-19 testi 1 000 kişiye uygulandı. Sonuçlar:
- Gerçek Pozitifler (GP): 45 (enfekte ve doğru tanımlandı)
- Gerçek Negatifler (GN): 950 (enfekte değil ve doğru tanımlandı)
- False Pozitifler (FP): 0 (enfekte değil ancak yanlışlıkla işaretlendi)
- False Negatifler (FN): 5 (enfekte ancak kaçırıldı)
Formül kullanılarak:
Bu test, vakaların %99,5’ini doğru şekilde tanımlayarak olağanüstü bir doğruluk sergiliyor.
Örnek 2: Spam Tespiti
Bir e-posta filtresi 1 000 mesajı işledi:
- GP: 85 (spam doğru şekilde işaretlendi)
- GN: 900 (spam olmayan doğru şekilde geçirildi)
- FP: 15 (spam olmayan yanlışlıkla spam olarak işaretlendi)
- FN: 0 (spam kaçırıldı)
Doğruluk hesaplaması:
15 false pozitife rağmen filtre %98,5 doğruluk elde etti.
Doğruluk Ölçümünün Tarihsel Bağlamı
Doğruluk kavramı antik uygarlıklara kadar uzanır. Örneğin, Babil astronomları gök olaylarını doğru şekilde tahmin etmek için gezegen hareketlerini titizlikle kaydetti. 19. yüzyılda Francis Galton gibi istatistikçiler, modern doğruluk metriklerinin temelini oluşturan veri toplamada kesinliğe vurgu yaptı. Günümüzde doğruluk, tahminlerdeki hataları en aza indirmek için eğitilen makine öğrenmesi modellerinde temel bir unsurdur.
Doğruluk Yorumlama Notları
- Dengesiz Veri Uyarısı: Dengesiz veri setlerinde yüksek doğruluk yanıltıcı olabilir. Örneğin, bir kanser tarama testi, deneklerin %95’i sağlıklı olsa bile tüm kanser vakalarını kaçırsa bile %95 doğruluk gösterebilir.
- Tamamlayıcı Metrikler: Bütünsel bir değerlendirme için doğruluk yanında kesinlik (GP / (GP + FP)) ve duyarlılık (GP / (GP + FN)) kullanın.
- Bağlam Önemlidir: Bazı uygulamalarda (örneğin dolandırıcılık tespiti) false negatifleri azaltmak genel doğruluktan daha kritik olabilir.
Sıkça Sorulan Sorular
Bir Sınıflandırma Modeli için Doğruluk Nasıl Hesaplanır?
Bir modelin 200 görseli “kedi” veya “köpek” olarak sınıflandırdığını varsayalım:
- GP: 80 (kediler doğru tanımlandı)
- GN: 90 (köpekler doğru tanımlandı)
- FP: 10 (köpekler yanlışlıkla kedi olarak sınıflandırıldı)
- FN: 20 (kediler yanlışlıkla köpek olarak sınıflandırıldı)
Doğruluk ve Kesinlik Arasındaki Fark Nedir?
Doğruluk genel doğruluğu ölçerken, kesinlik tüm pozitif tahminler arasındaki gerçek pozitiflerin oranına odaklanır. Örneğin, %90 doğruluğa sahip bir hava durumu tahmini, sık sık yanlışlıkla yağmur tahmin ederse daha düşük kesinliğe sahip olabilir.
Doğruluk %100 Olabilir mi?
Evet, ancak yalnızca false pozitif veya negatif yoksa. Pratikte ölçüm hataları veya veri dağılımlarının örtüşmesi nedeniyle %100 doğruluk nadirdir.
Dolandırıcılık Tespitinde Doğruluk Neden Yanıltıcıdır?
Dolandırıcılık işlemleri nadirdir (örneğin tüm işlemlerin %0,1’i). Tüm vakalar için “dolandırıcılık yok” tahmini yapan bir model %99,9 doğruluk elde eder ancak dolandırıcılığı tespit edemez. Duyarlılık veya F1-skoru gibi metrikler burada daha bilgilendiricidir.
Örneklem Büyüklüğü Doğruluğu Nasıl Etkiler?
Daha büyük örneklemler rastgele hataları azaltır. Örneğin, 100 yerine 10 000 hastayı test etmek, bir tıbbi testin doğruluğu için daha güvenilir bir tahmin sağlar.
Doğruluk Hesaplayıcıların Uygulama Alanları
- Sağlık: Hastalık teşhis testlerinin değerlendirilmesi.
- Üretim: Ürün kalite kontrol süreçlerinin değerlendirilmesi.
- Makine Öğrenmesi: Model performansının eğitim sırasında doğrulanması.
- Çevre Bilimi: Kirletici tespit verimliliğinin ölçülmesi.