Saturday, 15 February 2014

Published 01:02 by with 0 comment

Mengenal Data Mining


Teknologi yang digunakan untuk pengumpulan data berkembang dengan pesat. Perkembangan teknologi meningkatkan jumlah cara atau pintu masuknya data. Contoh ‘pintu’ tersebut adalah PC/laptop woth keyboard + mouse, barcode /QR code scanner, satellite, GPS, POS, dll. Banyaknya jumlah ‘pintu’ ini meningkatkan jumlah data yang dapat dikumpulkan.  Suatu organisasi sering dikatakan mengalami ‘data explosion’ atau ledakan data, karena data-nya yang sangat banyak, tapi knowledge yang dapat diperoleh secara langsung hanya sedikit. Sebenarnya mungkin ada lagi knowledge yang dapat ditarik dari data tersebut, namun untuk memperolehnya, data tersebut harus diolah lebih lanjut. Data mining ini-lah salah satu pengolahan untuk mendapatkan knowledge yang tersembunyi tersebut.
Definisi Data Mining
  • JH: data mining digunakan untuk meng-extract interesting knowledge, mencari pattern, rules dan constraints yang tersembunyi
  • DO: data mining digunakan unuk menganalisa data dalam jumlah besar
Namun, knowledge yang diambil dengan data mining, sebaiknya perlu dilihat lagi dengan seksama, karena
  • asosiasi/hubungan yang terlihat dari beberapa kelompok data tidak semuanya adalah causality (sebab-akibat) atau trend
  • mungkin ada kelainan data yang disebabkan oleh manusia dengan sengaja
  • pola yang diperoleh berdasarkan data dari masa lalu (history), sehingga jangan langsung dipakai untuk mencari trend
Untuk mengimplementasikan data mining, ada beberapa hal yang harus dimiliki, yaitu
  • centralized data, data tersimpan di database terpusat. Hal ini memudahkan pengolahan, karena sekali mengakses database server, dapat mengakses semua data yang perlu diolah
  • business analytics tool, interface yang akan diakses untuk menganalisa proses bisnis yang berjalan. komponen ini juga sering disebut dengan dashboard atau business intelligence
  • mining non-obvious information, pada data yang ada, terdapat informasi tersembunyi yang ingin dicari
  • business process management (BPM). jika business intelligence biasanya diakses oleh pihak manajemen, BPM digunakan untuk melihat KPI (key process indicator, target yang harus dicapai) divisi atau pegawai.
knowledge yang berhasil diperoleh dengan data mining, dimanfaatkan lebih lanjut sebagai input dalam pembuatan keputusan (decision making) yang dibutuhkan dalam menentukan arah operasi organisasi. Untuk menghasilkan keputusan yang tepat, diperlukan knowledge yang tepat yang dapat diperoleh dengan cepat, pada waktu yang tepat, dan sesuai dengan konteks (right information at right time, right place, right person).
Penggunaan
Data mining biasanya digunakan untuk
  • customer segmentation, misalnya konsumen usia 20-30 lebih menyukai kopi instan dari pada kopi hitam
  • kemungkinan pembelian, misalnya konsumen yang membeli roti biasanya juga membeli selai
  • customer profitability, misalnya
  • mendeteksi penipuan/fraud
  • customer attrition
  • channel optimization
  • asosiasi
  • klasifikasi dan prediksi
  • cluster analysis
  • exception data analysis/outlier
  • time series analysis/trend
dengan diberlakukannya SOX (sarbannes oxley) data mining juga dapat digunakan untuk mengontrol keanehan pada data, sehingga anomali dapat dengan mudah dan cepat dideteksi
Sumber : http://databases.about.com/od/datamining/
      edit

0 komentar:

Post a Comment