Verilerin Özetlenmesi, Sunumu ve Analizi
Nitel veri grafiklerinin taşıması gereken özellikler nelerdir?
Grafiklerin taşıması gereken özellikler şu şekilde özetlenebilir:
1. Grafikler tek bir değişkenin verilerini veya birden fazla değişkenin verilerini bir
arada özetlemek üzere hazırlanabilir.
2. Grafiğin hangi değişkenin ne verisini içerdiği başlıkta belirtilmelidir. Her grafiğin
bir başlığı olmalı ve bu başlık sade bir dille ifade edilmelidir.
3. Grafiklerde çubuklar kullanılmışsa her çubuğun, pasta dilimi kullanılmışsa her
dilimin neyi gösterdiği mutlaka belirtilmelidir. Nicel veri kullanılıyorsa ölçümün
birimleri mutlaka eksenlerde ifade edilmelidir. (Örneğin y ekseni hanehalkı gelir
düzeyi ise eksende 100, 500 gibi sayılar gösterip geçilemez, bunun TL mi dolar mı
ne olduğu belirtilmelidir).
4. Nicel bir verinin grafiği çiziliyorsa x ve/veya y eksenleri uygun şekilde ölçüme
ayrılmalıdır. Her bir cetvel aşaması 1,5,10,50,100…. Şeklinde veya 0,1; 0,05,.. vb.
şekilde çizilmelidir. Bu durumda eksen boyunca birim değişikliği yapmadan eşit
birime eşit mesafe tanınarak çizim yapılmalıdır. Grafikte birden çok eksen kullanılarak
(örneğin sol başta dikey bir y ekseni ve sağ başta dikey bir y ekseni ile) iki
ayrı birimin aynı grafikte gösterilmesi mümkündür.
5. Aynı grafikte birden çok değişkenin verisi sunulacaksa değişik renkler veya tarama
stilleri kullanmalıdır.
6. Grafiğin bilimsel olarak verileri doğru yansıtması kadar estetik özelliklerine de
özen göstermelidir.
Veri dağılımının normal dağılıma uyup uymadığına hangi koşullara bakılarak karar verilir?
Genel olarak aşağıdaki üç koşulu yerine getiriyorsa bir dağılımın
normal dağılıma uyduğu kanaatine varılır.
1. Gözlem sayısı 20’nin üzerine çıkan bir çoğunluğa ulaşmışsa,
2. Standart sapma aritmetik ortalamadan daha küçük bir matematiksel değerde kalmamışsa,
3. Aritmetik ortalama, ortanca ve tepe değeri birbirine eşit veya çok yakın değerlerde
ise dağılımın normal dağılım özellikleri gösterdiği düşünülerek aritmetik ortalama
ve standart sapma ile özetleme yolu seçilir. Aslında daha ince ayrıntıları gözeterek
analizler yapılacaksa normal dağılıma uygunluk testleri ile dağılımın sınanması
yoluna gidilebilir. Bu sınamalarda Tek Örnekte Kolmogorov-Smirnov Testi ve Lilliefors
Testi olarak iki test yaygın kullanılmaktadır.
Verilerin dağılımının normal dağılıma uymadığı, histogramda simetrik değil sağa veya sola yatık bir eğri elde edildiği durumlar nasıl yorumlanır?
Dağılımın histogramına Normal Dağılım eğrisinin bozulup bozulmadığı açısından bakıldıktan sonra, yukarıdaki üç özellik ile karara ulaşılabilir. Anlatılan üç özellikten herhangi biri bozulmuş olursa veya histogramda simetrik değil sağa veya sola yatık bir eğri elde edilirse dağılımın normal dağılıma uymadığını söylemek için yeterli olur. Eğrinin sağa doğru uzaması ve sol tarafının sıkışık olması aritmetik ortalamadan daha büyükler arasında beklenmedik büyüklükte (marjinal) değer alan birimlerin olması anlamına gelir.
Eğrinin sol taraf doğru uzaması ve sağ tarafın sıkışık olması aritmetik ortalamadan daha küçükler arasında beklenmedik küçüklükte (marjinal) değer alan birimlerin olması anlamına gelir.
Aritmetik ortalama nasıl hesaplanmaktadır?
Aritmetik Ortalama = Tüm Verilerin Toplamı / Veri Sayısı
Bir dağılımda tepe değeri nasıl bulunur?
Tanımlanması gereken üçüncü bir merkezî değer ölçütü de tepe değeridir. Tepe değeri dağılımda en çok kişinin aldığı değerdir. Sıklık inceleyen grafik (histogram) çizildiğinde grafiğin en tepe noktaya eriştiği yer olarak görünecektir. Yaygınlığı gösteren değişik ölçütler istatistikte karşımıza çıkar.
Varyans nasıl hesaplanır?
Varyansın hesaplanması da kolaydır. Aritmetik ortalama bulununca her bir kişinin değeri ile ortalama arasındaki fark alınıp bu farklar toplanır ve serbestlik derecesine (kişi sayısının bir eksiği) bölünür, yani varyans ortalamadan farkların averajıdır.
Standart sapma nasıl hesaplanır ve dağılımın aralığından nasıl etkilenir?
Standart sapma varyansın kare köküdür. Bir dağılımın dağılım aralığı ne kadar küçükse standart sapma da o kadar küçük olur.
Dağılımda çeyrekler nasıl hesaplanmaktadır?
Ortanca dağılımı ikiye bölmüş gibi düşünülünce her iki dağılım parçasının ayrı ayrı ortancalarını bulmak çeyrekleri bulmak demektir.
Bir dağılım yaklaşık olarak simetrikse hangi özellikleri taşımaktadır?
Bir dağılım aşağı yukarı simetrikse
• Ortalama merkezî değerdir
• Gözlemlerin kabaca % 70’i ortalamanın bir standart sapma mesafesi içinde sağ ve
solunda kalacak sınırların içine düşer.
• Gözlemlerin kabaca % 95’i ortalamanın iki standart sapma mesafesi içinde sağ ve
solunda kalacak sınırların içine düşer.
Çan eğrisi nedir?
İstatistikte y ekseninde kişi sayısı (frekans, sıklık) x ekseninde de incelenmekte olan nicel değişkenin ölçülerine göre oluşturulmuş bir cetvel konularak çizilen grafikte, grafiğin en yüksek değerine aritmetik ortalamada ve ona eşit/
yaklaşık eşit olan ortancada ulaşarak açıklığı aşağıya doğru bakan bir çan görüntüsü veren çizgisine Çan Eğrisi denir.
Veri özetlerini yayınlarken dikkat edilmesi gereken özellikler nelerdir?
Özetleri Yayımlarken Dikkat Edilmesi Gerekenler:
• Özetin dayandığı gözlem sayısını (n) her zaman belirtiniz.
• İkili seçeneklerde (ya A şıkkı ya B şıkkı şeklindeki durumlarda) A’nın veya B’nin
yüzdesini yayımlayınız ama ikisini birden yayımlamayınız. Çünkü okuyucu kalan
kısmın diğer seçeneğe ait kısım olduğunu kolayca düşünebilir ve boş yere yazı fazlalığı
ile uğraşmaya gerek yoktur.
• Eğer merkezî değeri vermede ortancayı kullanıyorsanız, aynı zamanda alt ve üst
çeyrekleri de vermeyi ihmal etmeyiniz.
• Eğer merkezî değeri vermede ortalamayı kullanıyorsanız, aynı zamanda standart
sapmayı da vermeyi ihmal etmeyiniz.
• Her zaman dağılımın en küçük ve en büyük değerlerini de yayımlayınız.
Örneklem neden oluşturulur?
Çalışmalarda ideal olanı inceleme konusunu taşıyan bütün birimleri (örneğin, diyabet hastalığını inceliyorsak bütün diyabet hastalarını) ele almaktır. Ancak evrendeki milyonlarca bazen milyarlarca birimi ele almaya zaman, emek ve finansal kaynak yetmez. Bu nedenle incelenmek istenen durumu taşıyan bir grup oluşturulur ve bu gruba örneklem denir. Yapılan işleme de örnekleme denir. Örneklemin incelenmek istenen evreni (o özelliği taşıyan bütün birimlerin toplamından oluşan büyük kütle) iyice temsil edebilmesi ve bizi yanıltmaması için iki özellik taşıması gerekir: Yeterli sayıda birimden oluşmak ve bu
birimlerin evreni iyi temsil edecek dağılımla seçilmiş olması.
Bilimsel bir araştırmada gruplar arasındaki farkın istatiksel olarak anlamlı olup olmadığı nasıl bulunmaktadır?
Bilimsel bir çalışmada, bir hipotez oluşturulur sonra veri toplanarak analiz edilir. Belirli
bir güven aralığı (genellikle % 95) hesaplanır, bu güven aralığında kalınması olasılığı
bulunur. Eğer bu olasılık kırmızıçizginin (genellikle 0,05 yani % 5)’in altına inmişse
gruplar arasında görülen fark anlamlıdır denir. İstatistiksel olarak anlamlı demek ortaya
çıkan farkın şans eseri olması olasılığının % 5’ten az olması demektir. Bu kadar küçük bir
olasılığa inanmayıp şans eseri ortaya çıkmama olasılığı olan % 95 veya daha üzeri olasılığa
inanırız. Bu durumda araştırma gruplarını temsil eden örneklemden elde edilen gruplara
göre farklar anlamlı bulundu demektir.
İki oranın (yüzdenin) karşılaştırılmasında sağlık bilimlerindeki araştırmalar kullanılan iki genel yaklaşım hangileridir?
İki oranın (yüzdenin) karşılaştırılması sağlık bilimlerindeki araştırmalarda çok yaygın ve
esas sorunlardan birisidir. Bugün için iki genel yaklaşım vardır:
1. İki oranın karşılaştırılmasında önemlilik testleri
2. İki oranın farklılığı için % 95 güven aralıkları
Ho hipotezi nasıl oluşturulur?
Herhangi bir istatistiksel önemlilik testinde, Ho hipotezini ortaya koymak, yani gruplar
arasında anlamlı bir farklılık olmadığını iddia etmek testin başlangıcıdır. Bu sebeple iki
oran (veya yüzde) karşılaştırılırken testi yapan önce olumsuz bir tavır alarak işe başlar ve
arada anlamlı bir fark olmadığını iddia eder.
"p" değeri nasıl yorumlanmaktdır?
"p” Değerlerinin Yorumlanması: Yerleşik uygulamaya göre, p<0,05 değeri hipotezin yanlış olduğunu söylemeye yeter. Yüzdeler arasındaki fark 0,05 düzeyinde istatistiksel olarak anlamlıdır. Birçok kişi Ho hipotezini reddederken veya kabul ederken p’nin 0,05’ten büyük veya küçük olduğunu temel alır. Aslında p<0,05 çizgisine bu kadar kesin bir rol yüklemek doğru olmayabilir. Ayrıca bunun bilimsel bir gelenek olma dışında matematiksel bir dayanağı yoktur. Sadece yayılmış olan genel bir tutum ve moda ile karşı karşıyayız.
Verilerin analizinde parametrik olmayan yöntemler ne zaman kullanılır?
Parametrik Olmayan Yöntemler: Nicel ve nitel değerlerin ölçümsel, sayısal yargılamalarında kullanılan, parametrik testlerden
yararlanılamayan veya bir parametrik değer göz önüne alınmaksızın varsayımların kurularak test edilmek istenmesinde yararlanılan testler.
Ki-Kare Testlerinin Geçerliliği olması için gereken şartlar nelerdir?
2x2 tabloları için geçerli şartlar:
• Eğer N > 40 ise, X² kullanılabilir.
• Eğer N 20 ile 40 arasında ise, beklenen değerlerden en küçük olanı bile 5’ten büyük
ise, X² kullanılabilir.
• Diğer durumlarda Fisher’in Kesin Ki-kare testi kullanılmalıdır.
Daha büyük tablolar için:
• Tüm beklenen değerlerin %20’den fazlası 5’ten küçük değilse X² kullanılabilir.
• Beklenen değerlerin hiçbiri 1’den küçük değilse X² kullanılabilir.
Korelasyon sonuçlarını yorumlamada p değerinin önemi nedir?
Korelasyon katsayısı analizden pozitif veya negatif güçlü veya zayıf bulunsa da dikkat edilmesi gereken bir husus örneklemde elde edilen bu korelasyon katsayılarını anlamlılık düzeyidir. Ne bulursak bulalım eğer p değeri 0,05’ten büyük çıkmışsa onu kullanmamalıyız. Çünkü bu bulunanın şans eseri öylece ortaya çıktığını iddia eden H0 hipotezinin doğru olma olasılığı % 5’ten fazla hâle gelmiştir. Böylelikle şans eseri elde edilmiş bir şeyi bilimsel maksatla kullanmak ve yayımlamak doğru olmaz. Demek ki
korelasyon analizlerinde elde edilen bulguları ancak p<0,05 şartı sağlandığında kullanmak doğru olacaktır.
Pozitif korelasyon nedir?
İki değişkenin özelliklerden birinin değeri arttıkça diğeri de artıyorsa azaldıkça da azalıyorsa bu iki değişken arasında pozitif korelasyon vardır denilir.