YBS404U
VERİ MADENCİLİĞİ - Deneme Sınavı - 16
Dönem Sonu Sınavı
68538
Soru 1
A nesne setini içeren işlem sayısı 12 ve A nesne setinin destek değeri 0,4 ise işlemler veritabanındaki toplam işlem sayısı kaçtır?
Soru 2
Bir markette o gün yapılan tüm alışlar içerisinde süt ve ekmeği birlikte alan kişi sayısı 18' dir. Süt ve ekmeği birlikte satın alan kişilerin yarısı yumurta da almıştır. Toplam alışveriş sayısı 36 olduğuna göre "süt ve ekmek alanlar yumurta da almıştır" kuralının destek değeri kaçtır?
Soru 3
Bir markette o gün yapılan tüm alışlar içerisinde süt ve ekmeği birlikte alan kişi sayısı 18' dir. Süt ve ekmeği birlikte satın alan kişilerin yarısı yumurta da almıştır. Toplam alışveriş sayısı 36 olduğuna göre "süt ve ekmek alanlar yumurta da almıştır" kuralının güven değeri kaçtır?
Soru 4
Bir markette o gün yapılan tüm alışlar içerisinde süt ve ekmeği birlikte alan kişi sayısı 18' dir. Süt ve ekmeği birlikte satın alan kişilerin yarısı yumurta da almıştır. Toplam alışveriş sayısı 36 ve yumurta alanların toplam sayısı 18 olduğuna göre "süt ve ekmek alanlar yumurta da almıştır" kuralının kaldıraç değeri kaçtır?
Soru 5
5 nesne içeren bir sık görülen nesne setinden kaç tane ilişki kuralı üretilebilir?
Soru 6
I. A
II. A,C
III. A, B, D
IV. D, B
V. ∅ A, B ve C elemanlarından oluşan küme sık görülen nesne kümesi olduğuna göre
II. A,C
III. A, B, D
IV. D, B
V. ∅ A, B ve C elemanlarından oluşan küme sık görülen nesne kümesi olduğuna göre
yukarıdakilerden hangisi sık görülen nesne kümesi olmayabilir?
Soru 7
Verilen değerler ışığında bir ilişki kuralının belirlenmesinin ilk adımı aşağıdakilerden hangisidir?
Soru 8
Öncül ve sonuç nesne setleri arasındaki korelasyonun belirlenmesine dayanarak hesaplanan değer aşağıdakilerden hangisidir?
Soru 9
İlişki kuralı oluşturulurken nesne sayısı hangi formül ile bulunur?
Soru 10
Karar vericinin içinde bulunduğu karar verme probleminde ortaya çıkabilecek tüm durumları ve karar vericinin karşılaşabileceği tüm senaryoları bir arada gösterebilen bir grafiksel yaklaşıma ne ad verilir?
Soru 11
Karar ağacının oluşturulmasında kök ve iç düğümlerde ayırma işlemini en iyi şekilde gerçekleştirecek olan niteliğin belirlenmesi işlemine ne ad verilir?
Soru 12
Bir kaydı, önceden tanımlanmış çeşitli sınıflardan birine atayan bir modelin uygulanması işlemi aşağıdakilerden hangisidir?
Soru 13
Bir banka müşteri veritabanında yer alan müşterilerin kredi riskleri kümesi R={iyi, kötü, kötü, iyi, iyi, kötü, iyi, iyi, kötü, iyi} olarak verilmiş olsun. Buna göre C1 iyi sonucunu, C2 kötü sonucunu temsil etmek üzere, risk niteliğinin olasılık dağılımı aşağıdakilerden hangisidir?
Soru 14
Bir banka müşteri veritabanında yer alan BORÇ, GELİR, STATÜ niteliklerine göre müşterinin RİSK durumu belirlenmek istenmektedir. H entropi değeri olmak üzere, BORÇ niteliği ile ayırma yapılması istendiğinde elde edilen kazanç aşağıdaki eşitliklerden hangisi ile hesaplanır?
Soru 15
Ayırma kritesi olarak kazanç ölçütünden yararlanan; durdurma kriteri olarak tüm kayıtların tek bir sınıfa ait olması veya kazanç ölçütünün sıfırdan büyük olmaması durumunu kullanan; karar ağacına herhangi bir budama uygulamayan; sayısal nitelikleri ve kayıp veriyi işleyemeyen; 1983 yılında Ross Quinlan tarafından önerilen karar ağacı oluşturma algoritması aşağıdakilerden hangisidir?
Soru 16
Bir karar ağacında bir ya da daha fazla dalı çıkartarak, karar ağacını daha basitleştirmek amacıyla, çıkartılmasına karar verilen dalın içerdiği kayıtların, bağlı olduğu üst düğüme dahil edilerek, düğümün yaprak düğüme dönüştürülmesi işlemine ne ad verilir?
Soru 17
İkili (binary) karar ağacı yapısından dolayı diğer algoritmalardan farklılık gösteren; ayırma kriteri için Entropi, Gini ve Twoing indekslerinden, karar ağacını budamak için ise maliyet-karmaşıklığı kriterinden faydalananan; yaprak düğümlerinde bir sınıf kestirimi yerine sayısal bir değer kestirimini içeren regresyon ağacını da oluşturulabilmesini sağlayan; 1984 yılında Breiman, Friedman, Olshen ve Stone tarafından önerilen sınıflandırma ve regresyon ağaçları algoritması aşağıdakilerden hangisidir?
Soru 18
Sınıflandırma ve regresyon ağacı oluşturabilmek için R’de yüklenmesi gereken paket aşağıdakilerden hangisidir?
Soru 19
>library(rpart)
>agac<-rpart(formula=RİSK~BORÇ+GELİR+STATÜ,data=veri[,2:5],method=“class”)
>agac
n= 45
node), split, n, loss, yval, (yprob)
* denotes terminal node
1) root 45 22 iyi (0.5111111 0.4888889)
2) STATÜ=ücretli 28 12 iyi (0.5714286 0.4285714)
4) GELİR=düşük 13 4 iyi (0.6923077 0.3076923) *
5) GELİR=yüksek 15 7 kötü (0.4666667 0.5333333) *
3) STATÜ=işveren 17 7 kötü (0.4117647 0.5882353) *
Yukarıda verilen, sınıflandırma ve regresyon ağacı oluşturmak amacıyla kullanılan R komutları kümesinde (*) ile işaretlenen düğümler aşağıdakilerden hangisidir?
Soru 20
Aşağıdakilerden hangisi veya hangileri nitel verilerde kullanılan ayırma kriteri belirleme metotlarından biridir?
I-Entropi indeksi
II-Twoing indeksi
III-En Küçük Kareler Sapması yöntemi