Ma’lumotlar intellektual tahlili va dasturiy ta’minotlar

int_17_09_2013

Mа’lumotlarni intellektual tahlili (MIT) masalalarini yechish uchun mo‘ljallangan dasturiy ta’minotlarning tarixi qisqa, lekin shu qisqa davr mobaynida ko‘pgina ishlar nashr qilingan. MIT atamasining o‘zi o‘tgan asr 90-yillari o‘rtalarida paydo bo‘ldi.

Dastlab yaratilgan MIT dasturlarga DOS yoki UNIX tizimida ishlovchi, ma’lumotlarni matn fayldan o‘qib, S4.5 algoritmi bo‘yicha klassifikatsiya masalasini yechadigan dasturni keltirish mumkin.

Hozirgi kunga kelib, MIT masalalarini yechish uchun barcha dasturiy ta’minotlar quyidagicha umumiy vazifalarga ega:
• mа’lumotlarni dastlabki ko‘rib chiqish uchun statistik tahlil vositalari;
• ma’lumotlarni vizualizatsiya qilish uchun turli metodlar (Gistogrammalar, diagrammalar, parallel koordinatalar sistemasi, grafiklarni taqsimlash va boshqalar);
• ma’lumotlarga ishlov berish uchun standart komponentlar (ma’lumotlar bazasi bilan ulanish va unga turli xil so‘rovlar berish, diskretlash va tartiblash funksiyalari, qism, to‘plamlarni tanlash va boshqalar);
• ma’lumotlarni o‘quv tanlanmalarsiz tahlili metodlari (asosiy komponentli tahlil, turli klasterizatsiya algoritmlari, assotsiativ qoidalarni chiqarish, qism, guruhlar tahlili metodlari va boshqalar);
• ma’lumotlarni o‘quv tanlanmali tahlili metodlari (klassifikatsiya qoidalari va daraxtlar, tayanch vektorlar tizimi, navi Bayes klassifikatorlari va boshqalar);
• modelni baholash vositalari (klassifikatsiya aniqligi, sezuvchanlik, sonli tahlil natijalari va boshqalar);
• boshqariladigan va boshqarilmaydigan tahlil asosida ishlangan ma’lumotlarni bashoratlash modellari;
• modelni qandaydir standart formatda saqlash (masalan, PMML formati);
• olingan natijalar bo‘yicha turli xil hisobotlarni chiqarish.

int_17_09_2013_1

Yuqorida sanab o‘tilgan modullarning bir qanchalarini o‘zida jamlagan dasturlar va ularga pullik va ochiq kodli erkin dasturiy ta’minotlar mavjud. Jadvalda eng ko‘p foydalanuvchilar ishlatadigan, imkoniyatlari yuqori ochiq kodli va erkin MIT dasturiy ta’minotlarini keltirib o‘tilgan.

Xulosa qilib aytganda, bunday tipdagi erkin va ochiq kodli dasturiy ta’minotlardan foydalanish MIT masalalarini yechishni osonlashtiribgina qolmay, o‘zimiz yaratgan metodlarni ham unga kiritib yangi MIT dasturiy ta’minotlarni yaratish imkonini beradi. (Maqolani tayyorlashda Blaz Zupan, Janez Demsar.

Open-source tools for data mining. Clin lab Med (2008), P. E. Hoffman, G. G. Grinstein, K. E. Marx. DNA visual and analytic datamining. Phoenix (AZ): In Proc. IEEE Visualization; 1997, I. H. Witten, E. Frank. Datamining: practicalmachine learning tools and techniques with Java implementations. 2nd edition. San Francisco (CA): Morgan Kaufmann materiallaridan foydalanildi).

Orphus system