A.Penjelasan
Data Mining dapat didefinisikan menjadi
berbagai pengertian, Data Mining
didefinisikan sebagai satu set teknik yang digunakan secara otomatis untuk
mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-relasi yang
kompleks pada set data yang sangat besar.
Data
Mining dapat juga
didefinisikan sebagai “pemodelan dan penemuan polapola yang tersembunyi dengan
memanfaatkan data dalam volume yang besar”1. Data mining menggunakan pendekatan
discovery-based dimana pencocokan pola (pattern-matching) dan algoritma-algoritma
yang lain digunakan untuk menentukan relasi-relasi kunci di dalam data yang
diekplorasi. Data mining merupakan komponen baru pada arsitektur sistem
pendukung keputusan (DSS) di perusahaan-perusahaan.
Definisi sederhana dari Data Mining adalah ekstraksi informasi
atau pola yang penting atau menarik dari data yang ada di database yang besar.
Dalam jurnal ilmiah, data mining juga dikenal dengan nama Knowledge Discovery
in Databases (KDD) digunakan secara otomatis untuk mengeksplorasi secara
menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data
yang sangat besar.
Set data yang dimaksud di sini adalah
set data yang berbentuk tabulasi, seperti yang banyak diimplementasikan dalam
teknologi manajemen basis data relasional. Akan tetapi, teknik-teknik data
mining dapat juga diaplikasikan pada representasi data yang lain, seperti
domain data spatial, berbasis text, dan multimedia (citra).
Data mining muncul sekitar tahun 90-an.
Data Mining memang salah satu cabang ilmu komputer yang relatif baru. Dan
sampai sekarang orang masih
memperdebatkan untuk menempatkan data mining di bidang ilmu mana, karena data
mining menyangkut database, kecerdasan buatan (artificial intelligence),
statistik, dsb.
Kehadiran data mining dilatarbelakangi
dengan problema data explosion yang dialami akhir-akhir ini dimana banyak
organisasi telah mengumpulkan data sekian tahun lamanya (data pembelian, data
penjualan, data nasabah, data transaksi
dsb.). Hampir semua data tersebut dimasukkan denganmenggunakan aplikasi
komputer yang digunakan untuk menangani
transaksi sehari-hari yang kebanyakan adalah OLTP (On Line Transaction
Processing).
Cara kerja data mining yaitu mencari
hal-hal penting yang belum diketahui sebelumnya atau memprediksi apa yang akan
terjadi ? Teknik yang digunakan untuk melaksanakan tugas ini disebut pemodelan.
Pemodelan di sini dimaksudkan sebagai kegiatan untuk membangun sebuah model
pada situasi yang telah diketahui “jawabannya” dan kemudian menerapkannya pada
situasi lain yang akan dicari jawabannya.
Terdapat langkah-langkah yang terdapat
dalam Data Mining, yaitu sebagai
berikut :
a. Pembersihan data : Biasanya terdapat data yang kurang bagus untuk
dimasukkan dalam kelengkapan data perusahaan karena hanya akan dianggap tidak
valid bahkan untuk data yang hilang. Sehingga data yang seperti itu lebih baik
dibuang.
b. Integrasi data
c. Transformasi
data : Beberapa teknik data
mining memerlukan format data yang khusus sebelum bisa digunakan dan
disebarluaskan. Dalam tahap ini, dilakukan pula pemilihan data yang dibutuhkan
oleh teknik data mining yang akan dipakai. Tahap inilah yang akan menentukan
kualitas dari data mining.
d. Aplikasi teknik
data mining : Ini merupakan salah
satu langkah dari proses data mining. Gunakan teknik data mining yang sesuai
dengan hasil yang dibutuhkan.
e. Evaluasi pola
yang ditemukan : Dalam tahap ini hasil
dari teknik data mining berupa pola pola yang khas maupun model prediksi
dievaluasi untuk menilai apakah hipotesis yang ada memang tercapai.
f. Presentasi pola : Tahap terakhir dari proses data mining adalah
bagaimana formulasi keputusan atau aksi dari hasil analisis dari data mining.
Dalam presentasi ini, visualisasi juga dapat membantu mengkomunikasikan hasil
data mining
B. Kelebihan
·
Kemampuan dalam
mengolah data dalam jumlah yang besar.
·
Pencarian Data
secara otomatis.
C.Kekurangan
·
Kendala Database
( Garbage in garbage out ).
·
Tidak bisa
melakukan analisa sendiri.
D.Kesimpulan
Data
Mining adalah ekstraksi
informasi atau pola yang penting atau menarik dari data yang ada di database
yang besar. Dalam jurnal ilmiah, data mining juga dikenal dengan nama Knowledge
Discovery in Databases (KDD) digunakan secara otomatis untuk mengeksplorasi
secara menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set
data yang sangat besar.
Cara kerja data mining yaitu mencari
hal-hal penting yang belum diketahui sebelumnya atau memprediksi apa yang akan
terjadi ? Teknik yang digunakan untuk melaksanakan tugas ini disebut pemodelan.
Pemodelan di sini dimaksudkan sebagai kegiatan untuk membangun sebuah model
pada situasi yang telah diketahui “jawabannya” dan kemudian menerapkannya pada
situasi lain yang akan dicari jawabannya.
E. Saran
Setelah saya membaca artikel mengenai Data Mining, dari kelebihan yang
dimiliki oleh Data Mining ini sangat
membantu dalam proses pengolahan data. Selain memiliki kemampuan menyimpan data
dalam jumlah yang besar, Data Mining
juga memiliki kemampuan dalam system pencarian data yang dapat dilakukan secara
otomatis.
Akan tetapi, jika ingin menganalisa
suatu data mungkin dapat menggunakan cara atau metode lain. Dikarenakan dalam Data Mining tidak dapat melakukan
analisa data sendiri atau tidak dapat mengalaisa data secara otomatis.
Sumber :
Tidak ada komentar:
Posting Komentar