Temel İstatistik Kavramlar ve Olasılık
Değişken nedir?
Olayların gözleme dayalı yani kişiden kişiye değişiklik gösterebilen özelliklerine, durumlarına ya da objelerine ‘’değişken’’ denir.
Nicel ve nitel değişken ayrımını yapınız.
Kişiye göre değişiklik göstermeyen veya çok az değişiklik gösteren değişkenlere nicel değişken, gözlemden gözleme farklılık gösteren fakat bu farklılık sınıflandırma yönünden değil kalite veya çeşit yönünden ise buna da nitel değişken denir.
Ana kütle ve örnek kütle ayrımını yazınız.
Ana kütle tüm popülasyonu kapsarken, örnek kütle bizim ana kütle içerisinden belirlediğimiz daha küçük bir popülasyondan oluşur. Örneğin bir okulda bulunan öğrenci sayısı bizim ana kütlemiz ise, aynı okuldaki bir sınıftaki öğrenci sayısı da örnek kütle (örneklem) olarak kabul edilebilir.
Merkezi eğilim ve dağılım ölçülerini yazınız.
Merkezi eğilim ölçüleri bir olaya ilişkin değişkenlerin tümüne ait merkezi bir değeri gösterir. Dağılım ölçüleri ise değişkenin aldığı değerlerin birbirinden ne ölçüde farklı olduğunun ölçüsüdür.
Aritmetik ortalama nedir?
Aritmetik ortalama en sık kullanılan merkezi eğilim ölçüsüdür. Hesaplanmış bir değişken ile değişmiş tüm birimlerin toplam birim sayısına bölünmesi ile elde edilir.
Geometrik ortalama neden kullanılır?
Geometrik ortalama bir diğer merkezi eğilim ölçüsüdür. Gözlem verileri diğer gözlem verilerine bağlı olarak değişiyorsa ve bu değişim hızı belirlenmek isteniyorsa kullanılır.
Mod nedir?
Bir dağılımda ya da popülasyonda en çok tekrar edilen terime mod (tepe değer) denir.
Medyan nedir?
Medyan(ortanca), bir popülasyondaki veri serisi sayısal büyüklük olarak sıralandığında ortadaki sayıdır. Örneğin; 1, 1, 2, 4, 5, 2, 2, 3, 5 karışık serisi düzenlenirse 1, 1, 2, 2, 2, 3, 4, 5, 5 düzgün serisi elde edilir. Bu seri 9 elemanlı olduğundan ortadaki, yani 5. eleman (medyan) olacaktır. 5. sıradaki sayı 3 olduğundan bu örneklem için medyan 3’tür diyoruz.
Varyans nedir?
Önceden verilmiş olan aritmetik ortalama değerinin bulunmasının ardından bu değerden sapmanın ölçülmesini sağlayan bir dağılım ölçütüdür.
Standart sapma nedir?
Verilerin aritmetik ortalamaya göre nasıl bir yayılım gösterdiğini anlamamıza yardımcı olur. Standart sapmanın büyük değeri bize popülasyondaki değerlerin birbirine uzak olduğunu gösterir. Standart sapma değerinin küçük olması da popülasyondaki değerlerin birbirine yakın olduğunun ölçütüdür. Varyansın karekökünün alınması ile bulunur.
Deney, sonuç ve örnek uzay kavramlarını açıklayınız.
Bir firmanın üretim sırasında üretilen ürünlerin ne kadarlık kısmının hatalı olabileceği konusunda yapmış olduğu bir çalışma o firma için istatistiksel deneye örnektir. Deneyin, üretim çıktılarının hatalı ya da hatasız kısmına o deneyin çıktıları ya da sonuçları denebilir. Bu tüm sonuçların ele alındığı geniş tanıma da firma için deneyin örneklem uzayı denir. Birçok gözlemden bir tanesinin gerçekleşmesi sürecine deney, gözlemlere deneyin sonuçları ve bu sonuçların tümüne deneyin örneklem uzayı denmektedir.
Olay nedir?
Bir deneyin bir sonucu veya daha fazla sonucuna “olay’’ denir. Olay basit veya karmaşık olabilir. Literatürde basit veya karmaşık yerine farklı terimlerde kullanılabilmektedir.
Basit olay nedir?
Yapılmış olan bir deneyin nihai sonuçlarına basit olay denir. Basit olayın bir tek sonucu vardır.
Bileşik olay nedir?
Bir bileşik olay birden çok sonuçtan oluşmaktadır. Bir iş yerinde çalışan personel arasından rastgele seçim yapılması durumunda cinsiyetlerin kaydedilmesi biçimindeki olayın A olayı, en çok bir erkeğin seçilmiş olduğu durumu olarak tanımlansın. A olayında en çok bir erkek personel olabilir ya da hiç erkek personel olamaz.
Olasılığın özelliklerini yazınız.
Olasılığın iki önemli özelliği vardır diyebiliriz.
1. Bir olayın olasılığı daima sıfır ile bir aralığında olmak zorundadır. Bir olay ister bileşik ister basit olay olsun, olay gerçekleşmeden önce olasılığı sıfırdan
az ya da birden büyük olamaz. Bir olayın meydana gelme olasılığı sıfır ise olanaksız, olay bir ise kesin olay diyebiliriz.
2. Bir deneydeki tüm basit olayların olasılıkları toplamı Σ P(Ei) biçiminde gösterilir ve her zaman birdir. Bu sonuçtan hareketle oynanan bir futbol müsabakası için:
P(Galibiyet) + P(Beraberlik) + P(Mağlubiyet) = 1 şeklinde bir eşitlik yazılabilir.
Olasılığın klasik tanımını yazınız.
Olasılığın klasik tanımı; klasik olasılık tanımına göre bir deneydeki basit bir olayın olasılığı 1’in tüm sonuç sayısına bölünmesine eşittir. Öte yandan A bileşik olayının olasılığıysa A olayında içerilen sonuç sayısının toplam sonuç sayısına bölünmesiyle elde edilir.
Olasılığın oransal sıklık olarak tanımını yazınız.
Tüm olasılık hesaplamaları klasik olasılık tanımıyla açıklanamaz çünkü her zaman olasılıklar eşit olmayabilir. Bu gibi durumlarda örneğin para atma deneyinde paranın yazı ya da tura gelme olasılığı 0.5 iken hileli bir para söz konusu olduğunda bu oran değişim gösterir ve artık klasik olasılık tanımlamasının kullanılması mümkün olmaz. İşte bu gibi durumlarda olayın bir süre tekrarlanmasıyla birlikte yeni veriler elde edilmekte ve bu veriler ile bu olaya ilişkin yeni göreli sıklıklar bulunmaktadır. Bu yönteme olasılığın göreli sıklık tanımı adı verilmektedir. Çünkü yeni bulunan sıklıklar ile olaya ilişkin yeni olasılıklar saptanmaktadır.
Göreli sıklık kavramına göre olasılığın tanımını yazınız.
Eğer bir olay n kez tekrarlanmış ve f kez bir A olayı gözlenmiş ise olasılığın göreli sıklık kavramına göre olasılık,
P(A) = f / n biçiminde ifade edilir.
Olasılığın öznel tanımlanmasını yazınız.
Günlük hayatın içerisinde olasılıkların ne sonuçları eşit olasılıklı ne de göreli sıklık kuramını kullanabilecek veri üretmek için tekrarlanabilen türde deneylerle karşılaşabiliriz. Bu durumda artık klasik olasılık ya da göreli olasılık tanımlarından söz etmek mümkün değildir. Artık deneyimizin içinde birden fazla değişken ve kişi ortam veya koşullara bağlı değişimler söz konusudur. İşte bu gibi durumlarda öngörülen olasılığa öznel olasılık denilmektedir. Öznel olasılık keyfi bir değer olup öngörüde bulunan kişinin deneyiminden, yanlılığından ve beğenisinden etkilenebilmektedir.
Bileşen olasılık nedir?
Bileşen olasılık diğer bir değişle basit olasılık tek bir olay üzerine kurulan ve dış etkiler önemsenmeksizin yapılan olasılık hesabıdır. Örneğin üstteki firma örneğimizi ele alalım onaylayan erkekler için bileşen olasılık hesabı onaylayan erkeklerin sayısı bölü tüm çalışanlar olarak gösterilmelidir ve 12/100’den 0,12 bulunur. Diğer tüm olasılıklar içinde benzer hesap yapılırsa sonuç toplamı 100/100’den 1 gelecek veri olasılık hesabının doğrulanacağı görülür.
Koşullu olasılık nedir?
Koşullu olasılık bir olayın başka bir olaya bağlı olmasının bilinmesi durumunda diğer olayın gerçekleşme olasılığıdır. Örneğin A ve B iki olay olmak üzere A olayının koşullu olma olasılığı; P = (A | B) şeklinde gösterilir.
Ayrık olaylar nedir?
Birlikte olmayan olaylara karşılıklı ya da tamamıyla ayrık olaylar denir. Bu tür olaylar çıktıları birbirlerinden farklı iki durum üzerinedir. Bu olaylar birlikte ortaya çıkmazlar ve sonuçları bağdaşmaz.
Tamamlayıcı olaylar nedir?
İki farklı olay bir deneyin tüm sonuçlarını içeriyorsa bu olaylara, tamamlayıcı ya da bütünleyici olaylar denir. Tamamlayıcı olaylar her zaman ayrık olaylardır. A olayının tamamlayıcısı Ā ile gösterilmektedir. Ā olayı bir deneyde A olayının içermediği tüm sonuçları daima içermek zorundadır.
Kesikli rassal değişkenler nedir?
Sonuçları tam sayılar ile ifade edilen değişkenlere kesikli rassal değişkenler denilmektedir. Örneğin; bir aşçının birgün içinde kullandığı yumurta sayısı ya da bir hastaneye birgün içinde gelen hasta sayısı gibi. Bu değerler kesirlerle ifade edilememekte, bir, iki ve yüz gibi tam sayı değerleri almaktadırlar.
Normal dağılım modeli nedir?
Sürekli rassal değişkenlerin dağılımları ele alındığında normal dağılım modeli en sık karşılaşılan dağılım modelidir. Günlük hayatımızda karşılaşılan birçok değişken normal dağılım gösterir. Örneğin, insanların kan basıncı (tansiyon) ve kanındaki şeker miktarının dağılımı, öğrencilerin bir dersten aldıkları notların dağılımı, ilköğretimde okuyan çocukların boy ve kiloları, bir fabrikanın günlük üretim miktarlarının dağılımı, ampul ve pillerin ömürlerinin dağılımı genellikle normal kabul ve normal dağılım grafiği şekildeki gibi bir çan eğrisine benzemektedir. Normal dağılım grafiğinde en fazla karşılaşma sıklığına sahip (frekansı en büyük) değer, verilerin ortalamasına karşılık gelmektedir.