Bir önceki yazı hakkında yazdığı en iyi 10 veri madenciliği algoritmaları , Bilgi ve Bilgi Sistemleri yayımlanan bir kağıt. "Seçici" süreci, en önemli (Anket cevaplara göre) veri madenciliği problemleri tanımlamak için kullanılır olmuştur biri olarak aynıdır . Kağıt Yang ve Wu (2006), Bilgi Teknolojileri ve Karar Verme International Journal of yayımlandı . Kağıt aşağıdaki sorunları içerir (belirli bir sırayla):
Veri madenciliÄŸi birleÅŸtirici bir teori geliÅŸtirmek
Yüksek boyutlu veri ve yüksek hızda veri akışları için Ölçekleme
Madencilik sıralı veri ve zaman serisi verileri
Karmaşık veri madenciliği karmaşık bilgi
Veri madenciliği, ağ ayarı
Dağıtık veri madenciliği ve maden multi-agent veri
Biyolojik ve çevresel sorunlar için Veri madenciliği
Veri madenciliği süreci ile ilgili sorunlar
Güvenlik, gizlilik ve veri bütünlüğü
Statik olmayan, dengesiz ve maliyet-duyarlı veri ile başa çıkmak
Ben bazen master öğrencisi ya da veri madenciliği ile ilgilenen uygulayıcılar gelen e-postaları almak. Her zamanki soru "Ben veri madenciliği araştırma olarak neler yapabilirim?" Dir. Tabii ki, cevap ne gibi bağlıdır ve an fırsatlar. Ancak, bu kağıt belki olası yönde araştırma için bazı ipuçları verebilir.
Her zamanki gibi, "veri madenciliği otomasyon süreci" sorunu söz edilmektedir. Bu araştırmacılar, uygulayıcılar, onlar (bunu yapabilirler söylerken, veri madenciliği otomatikleştirmek için bir yol bulmalıyız iddia belirterek değer örnek KXEN için ). Son olarak, en önemli konu bir yazıda şu cümle ile işaret olduğunu düşünüyorum:
Benim düşünceme göre, üst düzey algoritmalar daha üst sorunları sıralamak için daha özneldir. Çoğu insan, seçilen veri madenciliği algoritmaları üzerinde kesinlikle katılıyorum. Soru, bazıları bu yana veri madenciliği problemleri ile ilgili sadece belirli araştırma alanları ile ilgili olabilir, daha özneldir.
Kaynak:http://www.dataminingblog.com/top-10-challenging-problems-in-data-mining/