İstatistik Kavramı ve Büyük Sayılar Kanunu

Atakan Erdoğan
4 min readJun 20, 2021

İstatistik Kavramı

İstatistik, sayısal verilerin (veya günümüzde farklı türdeki olguların karşılığı olarak elde edilen verilerin) toplanması, düzenlenmesi, analiz ve yorumu sürecinden elde edilen sonuçtur. Yazının başında belirtmek isterim ki hiçbir istatistik, doğru sonuçların garantisini vermez. İstatistik ile birlikte çok iyi tercihler yapabilirsiniz ancak hiçbir istatistik tek başına mucizeler yaratmaz!

Yani istatistik, geçmişi ve şimdiki durumu çeşitli istatistiksel teknikler ile analiz ederek gelecek hakkında daha doğru kararlar vermemizi sağlayan bir sürecin aracıdır.

İstatistik ana düşünce olarak yığın olaylar üzerinde çalışmalar yapar. Yığın olaylar, ana olgusu aynı olan ama kendi içinde farklılıklar gösteren olaylardır.

Bir akaryakıt istasyonunda yığın olay nedir?

İstasyona gelen araçların yığın olayı araçların yakıt almasıdır. Fakat araçların tipi, markası, modeli, aldığı yakıt türü ve miktarı gibi özellikleri kendi içerisinde farklılık gösterir. Bu olaylar çok çeşitli olduğu için bu olayların bir tanesi üzerinden tümü için genelleme yapılamaz.

Yığın olayların karşılığı olarak tipik olaylar gösterilebilir. Tipik olaylar, aynı şartlar altında aynı sonuçları veren olaylara denir. İstatistiki açıdan tipik olaylarla uğraşmak zaman ve maliyet kaybıdır. Bu yüzden tipik olaylarla ilgilenilmez. Mesela bir insanın anatomisini düşünelim. Genel yapısı ile anormal bir durum (aykırılık) yoksa diğer bütün insanların anatomisiyle benzer yapıdadır. Bu tipik bir olaydır.

Yığın olaylarla çalışırken bilgi edinmek istediğimiz bütüne anakütle (population) adını veriyoruz. Bu bütünü analiz etmek maliyet ve zaman açısından külfetli olduğu için anakütleden belli bir kısım alınarak üzerinden çalışma yaparak çıkarım yapılmaya çalışılır. Bu süreçte anakütleden alınan parçalara da örneklem (sample) adı verilir. Bu parçaların seçilip, ayıklanmasıyla sürecindeki işlemler Örnekleme Yöntemleri ile yapılır. Yapılan işleme de örnekleme adı verilir. Örneklem istatistiğinden hareketle anakütle parametresi tahmin edilmeye çalışılır.

Büyük Sayılar Kanunu

Yığın olayların son kısmında “bu olayların bir tanesi üzerinden tümü için genelleme yapılamaz” demiştik. Olayların genelinde farklı şartlar ve durumlar mevcuttur. Bunlar geçici veya sürekli sebepler olabilir. Bu yüzden ortaya bir çıkarım yaparken genel yığının bağlı olduğu sebepleri çift taraflı düşünmek gerekir. Çünkü gözlenen bireylerin sayısını arttırdıkça, yığın olayların şart ve durumlarının daha fazla gerçeğe yaklaştığını göreceksiniz.

Bu ne demek?

Hepimizin biyoloji dersinden aşina olduğu Mendel İlkesi ve Çaprazlama konusunu ele alalım. Bir beyaz çiçek tohumu ile bir kırmızı çiçek tohumunu birleştirirsek meydana gelecek 50 tohumlardan yetişecek çiçeklerin hangi renkleri taşıyacağını bilmemiz mümkün değil. Fakat bu tek olayı bir olaylar tekrarı haline getirerek bir yığın (anakütle) oluşturursak işler değişir. Mesela kırmızı-beyaz birleşiminden doğan tohumlardan 50 tane yerine 1000, 5000 gibi daha fazla sayıda çiçek yetiştirerek bu sonuçları kaydedersek göreceğiz ki çiçeklerin %50'si pembe, %25'i beyaz ve %25'i kırmızı olarak dağılıyor. Yani gözlem ve deney sayısı arttıkça rastgele oluşabilecek etkenlerin tesiri ortadan kalkarak, yığının gerçek durumu ortaya çıkar.

Büyük Sayılar Kanunu kanıtlamak için, 20 siyah ve 20 beyaz fişi bir torbaya koyarak farklı sayılarda çekim yapalım. Çektiğimiz fişleri her seferinde kaydederek tekrar torbaya atalım.

Teorik olarak her çekişte çıkan siyah ve beyaz fişlerin sayısının eşit olması gerekir. Ancak düşük miktarda çekim yapıldığı zaman normal şartlarda olan eşitlik durumu, tesadüfi sebeplerden dolayı kestirilemez bir orana yaklaşmaktadır. Oysa fiş sayıları eşit olmasa bile çekiş miktarı fazla olduğu zaman birbirlerine oranın 1'e yaklaştığını görüyoruz.

Büyük sayılar kanunu istatistiki analizin temelini oluşturmaktadır. Bu yüzden Büyük Sayılar Kanunu önemlidir.

İstatistik ve Amaç

Tanımlayıcı İstatistik: Bütün hakkında verilerin elde edilmesiyle, sonuçları yorum yapmadan ortaya koyan evredir. Elde edilen verilerin sınıflandırması, dağılımlarının ortaya konulması, bu dağılımların ortalamalar, yüzdelikler ve standart sapma gibi ölçüler ile tanımlanıp grafik haline getirilmesi bu evrede yapılır.

Çıkarımsal İstatistik: Elde edilen kitle verisiyle genelleme yapılmasını sağlayan yöntemler evresidir. Elde edilen verilerle örneklemin belirlendiği, anakütle hakkında çıkarımlarda bulunulduğu, karşılaştırmaların yapıldığı ve bu değerler ışığında istatistiki açıdan mantıklı kararların verildiği evredir.

Amaç olarak istatistik disiplinler arası bir konumda, tüm bilimlerde kullanılabilir yöntemlere sahiptir.

Genel anlamda çalışma alanı olarak iki alana ayırabiliriz.

  1. Matematiksel İstatistik
  2. Uygulamalı İstatistik

Matematiksel İstatistik alanı, yeni teoriler geliştirerek bunu pratik problemlerle birleştirir.

Uygulamalı İstatistik alanı ise farklı alanlarda karşılaşılan problemlere uygun olan istatistiki yöntemi seçerek problemi en iyi şekilde çözmeye odaklanmıştır.

İstatistiği herhangi bir bilim dalı ile birleştirdiğinizde yeni bir İnterdisipliner Yaklaşım(Birliktelik) elde edersiniz.

İstatistik ve Ekonomi = Ekonometri
İstatistik ve Biyoloji = Biyoistatistik
İstatistik ve Psikoloji = Psikometri
İstatistik ve Sosyoloji = Sosyometri
İstatistik ve Aktüerya = Demografi, Sigorta

Günümüzde istatistiğin kullanıldığı ve en fazla ilgi gördüğü alanların başında Bilgisayar Bilimleri gelmekte. Veri Bilimi, Makine Öğrenmesi, Yapay Zeka, Derin Öğrenme, Risk Analizi gibi daha bir çok süreçte ciddi istatistik bilgisine ihtiyaç duyulmaktadır.

En çok sorgulanan konulardan biri olan İstatistik ile Matematiğin aynı disiplin olduğu iddiasını ele alarak yazımı sonlandırmak istiyorum. Böyle bir sorgulama çoğu kişinin kafasında var, biliyorum!

Bana göre iki disiplin arasında ince bir çizgi vardır. Bazı bilim dalları, farklı bilim dallarının içerisinden çıkar. Matematikte her şeyin sonucu nettir. Matematik kesinlik ile ilgilidir. İstatistikte ise en başta söylediğimiz gibi kesinlik bulunmaz. Zaten istatistiğin içerisinde en çok kullanılan “olasılıksal” kelimesidir. Olasılık belirsizlik unsuru içeren olay ve sonuçların çalışmasıdır. Olasılık, matematiğin altından gelse de bunu bir finansal sisteme uyguladığımızda değerler kesin olmayacaktır. Burada bir modelleme uygulayarak bir olasılıksal tahmin yaptığımızda sonuçları öngörmeye çalışırız.

Bu yüzden ben istatistiği bir bilim dalı olarak görüyorum.

--

--