İstatistik
İstatistik, popülasyonun bir örneğinden toplanan verilere dayalı olarak bir popülasyondaki sayı gruplarını karşılaştırmanın bir yoludur. Temel istatistik çalışması, çubuk grafiklerden histograflara kadar her şey dahil olmak üzere, bu tür örnekleri grafik olarak görüntülemenin farklı yollarının açıklamalarını içerir. Temel istatistikler, mod, medyan, ortalama ve aralık dahil olmak üzere popülasyon örnekleminin açıklayıcı öğelerinin nasıl bulunacağını ve yorumlanacağını da içerir.
Popülasyonların rastgele örnekleri, tüm popülasyonlar hakkında tahminlerde bulunmak için kullanılabilir ve bu kavram, bu kılavuzun kapsamı dışında kalan gelişmiş istatistik araştırmasının temelini oluşturur.
Buradaki temeller, bir örneklem üzerindeki bir deneyin tüm popülasyon için geçerli olup olmadığını ve gösterilen bir değişikliğin önemli olup olmadığını göstermek için tüm bilimsel çalışmalarda kullanılır.
Yani istatistikler, bir çalışmanın sonuçlarının bağlam içinde yorumlanmasına yardımcı olabilir. Psikoloji, sağlık bilimi, kimya, biyoloji ve diğer birçok fiziksel ve sosyal bilim dalı bu tür çalışmalara bağlıdır.
Bu kılavuz, verilerin nasıl toplanacağına ve düzenleneceğine ilişkin kaynakları içeren istatistiklere girişle başlar. Daha sonra, aralık, medyan, mod ve ortalama gibi tanımlayıcı istatistikler üzerine bir konu ve verilerin grafiksel görünümleri hakkında bir konu içerir. Bundan sonra, bu kılavuz, sıklığı ve kümülatif sıklığı daha iyi anlamak için kaynaklar sağlar.
Son olarak kılavuz, bilimsel çalışmalarda kullanılan gelişmiş istatistiklerin temelini oluşturan bazı kavramların açıklamalarıyla sona ermektedir.
Veri Toplama ve Özetleme
Veriler, yalnızca birlikte derlenen gerçeklerdir. Herhangi bir tanımlayıcı istatistik yapılmadan önce ve grafik gösterimler yapılmadan önce ve herhangi bir gelişmiş analiz yapılmadan önce, veriler toplanmalıdır. Verilerin kalitesinin, toplanma şeklinden etkilenebileceğini unutmamak önemlidir.
Örneğin, bir anketör yalnızca bir markete giren kişilerle konuşursa veya yalnızca bir ayakkabı mağazasına giren kişilerle konuşursa, alışveriş alışkanlıklarıyla ilgili veriler farklı olacaktır.
Bu bölüm istatistikteki en temel kavramları tanıtır. Frekans ve frekans tablolarının kavramlarını tanıtmadan ve açıklamadan önce verileri ve veri toplamayı tanımlayarak başlar.
- Veri
- Frekans ve Frekans Tabloları
Verileri Tanımlamanın Yaygın Yolları
Araştırmalar büyük veri kümeleri arasında nasıl ayrım yapar? Tanımlayıcı istatistikler kullanarak başlarlar! Bu bölüm veri setlerini karşılaştırmak için kullanılan en yaygın tanımlayıcılardan dördünü tanıtır.
Bir veri kümesinde en sık görünen nokta veya noktalar olan mode ile başlar. Daha sonra bir veri kümesindeki ortadaki sayı olan medyana geçer. Daha sonra konu, bir veri setinin aralığı olan aralık kavramını nihayet tanıtmadan önce ortalamanın veya ortalamanın nasıl bulunacağını açıklar.
- Mod
- Medyan
- Anlamına gelmek
- Aralık
Verileri Göstermenin Farklı Yolları
İstatistikçiler, bir örnekten alınan verilerin nasıl görüntüleneceğine karar vermek söz konusu olduğunda, aslında ellerinde birçok araç vardır. Veriler yalnızca sayılarla görüntülenebilir veya aralıklara göre gruplandırılabilir.
Bilim adamları, kutu ve bıyık grafiklerinde olduğu gibi, ekranlar oluşturmak için açıklayıcı istatistikleri de kullanabilir. Farklı amaçlar için farklı görüntüler kullanılır ve bazen istatistikçiler, bir veri kümesi için farklı anlam tonlarını iletmek için birden çok görüntü içerir.
Bu bölüm çizgi grafikleri, çubuk grafikler, çizgi grafikler ve daire grafikler dahil olmak üzere verileri görüntülemenin yaygın yollarıyla başlar. Daha sonra, grupları ve kutu ve bıyık grafikleri gibi tanımlayıcı istatistikleri kullanarak verileri görüntülemenin başka yollarına geçer.
Son olarak konu, çapraz sınıflandırma için açıklayıcı verileri görüntüleme yöntemlerini açıklayan alt konularla biter.
- Çizgi Grafikleri
- Piktogram/Piktogramlar
- Çubuk grafikler
- Çizgi grafikleri
- Pasta Grafikler, Pasta Grafikler ve Daire Grafikler
- Kutu ve Bıyık Grafikleri
- Kök-Yaprak Grafikleri
- Venn şemaları
- Carroll Diyagramları
Frekans Tabloları
Frekans tabloları ve bunlara karşılık gelen en yaygın grafik ekranı olan histogramlar, bir veri seti hakkında önemli bilgileri ortaya çıkarır. Tek tek sonuçları göstermek yerine, sıklık tabloları farklı sonuçların veya sonuç aralıklarının ne sıklıkla ortaya çıktığını gösterir.
Bir frekans tablosunun şekli, veri örneğinin alındığı popülasyon hakkında yeni bilgiler de ortaya çıkarabilir. Sıklık, bazen nicel verilerden ziyade nitel veriler içeren veri kümeleri için de kullanılabilir.
Bu konu, frekans tablolarıyla başlar ve ardından, frekans tabloları kullanılarak farklı tanımlayıcı istatistiklerin nasıl bulunacağını açıklar. Ayrıca frekans tablolarının bir histogram ile grafiksel olarak nasıl görüntüleneceği tartışılmaktadır.
- Frekans Tabloları
- Aralıklı Frekans Tablosu
- Frekans Tablolarından Mod ve Ortalama
- Aralıklı Frekans Tablolarından Ortalama
- Frekans tablolarından medyan
- Düzgün Genişliklerle Histogram
- Düzgün Olmayan Genişliklere Sahip Histogram
Kümülatif Frekans
Kümülatif frekans, normal frekansla kolayca karıştırılabildiği için kendi bölümünü hak eder. Sıklık, bir olayın veya olaylar dizisinin ne sıklıkta meydana geldiğini gösterirken, kümülatif sıklık, verilerin belirli bir değerden düşük veya ona eşit olma olasılığının ne kadar olduğunu gösterir.
Bu konu ilk olarak kümülatif sıklık için tablo ve grafik ekranları açıklamaktadır. Aynı zamanda hem gruplanmış hem de gruplanmamış veriler için medyan, çeyrekler ve yüzdeliklerin nasıl bulunacağını açıklar.
- Kümülatif Frekans Tablosu
- Kümülatif Frekans Grafiği
- Medyan, Çeyrekler ve Yüzdelikler (Gruplanmamış Veriler)
- Medyan, Çeyrekler ve Yüzdelikler (Gruplanmış Veriler)
Daha Gelişmiş İstatistikler
Karmaşık istatistiksel analiz bu kılavuzun kapsamı dışındadır. Bununla birlikte, bu tür analizler için kullanılan birçok kavram burada tanıtılmaktadır. Bu gerçekler ve özellikler, tıptan psikolojiye kadar birçok farklı konuda araştırma analizinin omurgasını oluşturur.
Örneğin, istatistikçiler, etkilerinin önemli olup olmadığını ve genel olarak kullanımlarının güvenli olup olmadığını görmek için yeni farmasötik ilaçların klinik deneylerinden elde edilen sonuçları analiz edeceklerdir.
Bu bölüm popülasyonların ve örneklemlerin ortalamaları ve varyansları arasındaki farkları açıklayarak başlar. Daha sonra standart sapma ve rastgele değişkenler kavramını tanıtıyor.
Konu ayrıca yoğunluk fonksiyonları, binom dağılımları ve beklenen değerler gibi bazı olasılık kavramlarını da tartışmaktadır. Daha sonra konu, hem Poisson hem de normal dağılımlar ve normal dağılımla bir z-skorunun nasıl kullanılacağı hakkında bilgi içerir.
Son olarak, bu bölüm, hem olasılık hem de istatistikte yararlı bir araç olan Bayes Teoreminin bir açıklamasıyla sona ermektedir.
- Popülasyon Ortalaması ve Örneklem Ortalaması
- Popülasyon Varyansı ve Örnek Varyansı
- Standart sapma
- Rastgele değişken
- Olasılık Yoğunluk Fonksiyonları
- Binom dağılımı
- Beklenen değer
- Poisson Dağılımı
- Normal dağılım
- Z Puanı
- Bayes teoremi