aofsorular.com
YBS404U

VERİ MADENCİLİĞİ

1. Ünite
Soru 1
MEB'in yönetim bilgi sisteminde sorgu yapan bir uzman, Türkiye'deki tüm 9. sınıf öğrencilerinin ilk dönem birinci matematik sınav notlarını raporlarken, 143 öğrencinin 100'ün üzerinde puan aldığını görmüştür. 

Bu 143 veriye ned verilir?

Soru 2
Değişkenler arasındaki yordayıcı ilişkiye dayalı olarak verideki gürültünün temizlenmesine dayalı yönteme ne ad verilir?
Soru 3
Bir araştırmacı yürüttüğü veri madenciliği sürecinde değişkenlerden bir kısmının 25-185, bir kısmının 5-12, kalan kısmının ise 0-50 arasında değerler aldığını görmüştür. 

Araştırmacı, analizlerinin değişkenlerin ölçek düzeylerinin farklılığından etkilenmemesi için aşağıdaki yöntemlerden hangisini uygulamalıdır?

Soru 4
Bir araştırmacı, belirlediği bir veri setinde yanıt aradığı sorusuna çözüm üretmek için bir algoritma eğitmiştir. Ancak bu algoritmanın aynı amaçla kullanılan başka bir veri setinde beklenen sonucu vermediği, öğrenmenin gerçekleştiği veri setinden çok daha kötü çıkarımlarda bulunduğu görülmüştür. 

Bu duruma ne ad verilir?

Soru 5
Ozan, telefonunun fotoğraflar bölümünde yeni bir klasör açıldığını ve en çok fotoğraf çektirdiği arkadaşlarının her biri için yeni bir klasör oluştuğunu görmüştür. 

Klasörler isimsiz olduğuna göre, kullanılan veri madenciliği modeli aşağıdakilerden hangisi olabilir?

Soru 6
"Öklid" ve "Manhattan" benzeri uzaklık ölçülerini temel alan denetimli öğrenme yöntemi aşağıdakilerden hangisidir?
Soru 7
"Kola alanlar %70 ihtimalle cips de alılar" biçiminde bir dönüt veren veri madenciliği yöntemi aşağıdakilerden hangisidir?
Soru 8
Bir çevrimiçi öğrenme platformu yöneticisi, platforma kayıt olan öğrencilerin büyük kısmının bir süre sonra derslere devam etmediğini görmüş ve gelecekte bu durumu engellemek adına bir çalışma başlatmıştır. Buna göre eldeki veri setinden yola çıkarak gelecekte bırakma potansiyeli olan öğrencilerin belirlenmesi ve bunlar üzerinde özel bir çalışma yürütülmesi amaçlanmaktadır. 

Yönetici bu amaçla aşağıdaki yöntemlerden hangisini kullanabilir?

Soru 9
........... , 1957 yılında Frank Rosenblatt tarafından geliştirilen ve tekrar eden, benzerlik gösteren özelliklerin bilgisayar tarafından algılanabilmesini sağlayan bir
algoritmadır. 

Yukarıdaki cümlede boş bırakılan yeri aşağıdakilerden hangisi doğru şekilde tamamlar? 

Soru 10
Veri madenciliği için ilk yazılım hangi tarihte gerçekleştirilmiştir?
Soru 11
........... , veritabanlarındaki kayıtlarda eksik olan verilerdir.

Yukarıdaki cümlede boş bırakılan yeri aşağıdakilerden hangisi doğru bir şekilde tamamlar?

Soru 12
.............. , istatistiksel ve matematiksel tekniklerle birlikte örüntü tanıma teknolojilerini kullanarak çeşitli depolama ortamlarında kayıtlı bulunan veri yığınları üzerinde gerçekleştirilen elemeler sonucunda anlamlı yeni korelasyon, örüntü ve eğilimlerin keşfedilmesi sürecidir. 

Yukarıdaki cümlede boş bırakılan yeri aşağıdakilerden hangisi doğru şekilde tamamlar? 

Soru 13
.......... (1), veritabanlarındaki kayıtlarda eksik olan verilerken; veritabanlarındaki doğru olmayacak kadar uç değerler, ......... (2) olarak tanımlanır. 

Yukarıdaki cümlede boş bırakılan yerlere aşağıdaki şıklardan hangisi doğru şekilde tamamlar?

Soru 14
Veri madenciliğinde kullanılan modeller iki başlık altında incelenebilmektedir. Bunlardan biri olan ................ modeller, eldeki verilerden hareketle bir model geliştirilmesi ve geliştirilen bu model kullanılarak önceden sonuçları bilinmeyen veri kümeleri için sonuçların tahmin edilmesini amaçlarken; ................ modeller ise  analiz edilen verilerin özelliklerini incelemek için kullanılır.  Yukarıdaki cümlede boş bırakılan yeri aşağıdakilerden hangisi doğru şekilde tamamlar?
Soru 15
I. Bilinenden yola çıkarak bilinmeyeni tahmin etme çabasıdır.

II. Özellikle karar verme süreci açısından büyük önem taşır.

III. Verilerdeki örüntü veya ilişkileri tanımlar.

IV. Analiz edilen verilerin özelliklerini incelemek için kullanılır.

Veri madenciliğinde kullanılan modeller; tahmin edici modeller ve tanımlayıcı modeller olmak üzere temelde iki başlık altında incelenebilmektedir.

Buna göre, yukarıdakilerden hangisi tahmin edici modelleri açıklarken kullanılabilecek doğru bir ifadedir?

Soru 16
Veri madenciliğinde kullanılan modeller, temelde iki başlık altında incelenebilir. Bunlardan biri ise, analiz edilen verilerin özelliklerini incelemek için kullanılır.

Bu modelin adı aşağıdaki şıkların hangisinde verilmiştir?

Soru 17
I. Yeni ilaçların geliştirilmesi

II. Hastalıkların önceden teşhis ve tedavi edilmesi

III. Müşterilerin satın alma örüntülerinin belirlenmesi

IV. Benzer özellikler gösteren müşterilerin bulunması

Veri madenciliği bir çok alanda yoğun bir şekilde kullanılmaktadır. Sağlık da bu alanlardan biridir. 

Yukarıdakilerden hangisi veri madenciliğinin sağlık alanındaki uygulamalarına örnek teşkil eder?

Soru 18
I. Üretim süreçlerinin kontrol edilmesi

II. Hisse senedi fiyatlarının tahmin edilmesi

III. Kalite kontrol analizlerinin gerçekleştirilmesi

IV. Sigorta dolandırıcılıklarının belirlenmesi

Veri madenciliği bir çok alanda yoğun bir şekilde kullanılmaktadır. Endüstri ve mühendislik alanı da bunlardan biridir. 

Yukarıdakilerden hangisi veri madenciliğinin endüstri ve mühendislik alanındaki uygulamalarına örnek teşkil edemez

Soru 19
".................., insan beyninde yer alan sinir hücrelerinin (nöronların) ilk yapay modeline verilen isim olup algılayıcı, fark edici anlamındadır. 1957 yılında Frank Rosenblatt tarafından geliştirilen ve tekrar eden, benzerlik gösteren özelliklerin bilgisayar tarafından algılanabilmesini sağlayan bir algoritmadır."

Metinde boş bırakılan yere aşağıdaki seçeneklerden hangisi getirilmelidir?

Soru 20
Yukarıdaki maddelerden hangileri istatistik ve veri madenciliği arasındaki ilişkilerdendir?