Big data dan data mining adalah dua hal yang berbeda.
Keduanya berhubungan dengan penggunaan set data besar untuk menangani
pengumpulan atau pelaporan data yang melayani bisnis atau penerima lainnya.
Namun, kedua istilah tersebut digunakan untuk dua elemen berbeda dari jenis
operasi ini. Data besar adalah istilah untuk
kumpulan data besar. Kumpulan data besar adalah mereka yang melampaui jenis
sederhana dari database dan arsitektur penanganan data yang digunakan pada masa
sebelumnya, ketika data besar lebih mahal dan kurang layak. Misalnya, kumpulan
data yang terlalu besar untuk ditangani dengan mudah dalam spreadsheet
Microsoft Excel dapat disebut sebagai kumpulan data besar. Penambangan data
mengacu pada aktivitas melalui kumpulan data besar untuk mencari informasi yang
relevan atau relevan. Jenis kegiatan ini benar-benar contoh yang baik dari
aksioma lama "mencari jarum di tumpukan jerami." Idenya adalah bahwa
bisnis mengumpulkan kumpulan data besar yang mungkin homogen atau secara
otomatis dikumpulkan. Pembuat keputusan membutuhkan akses ke data yang lebih
kecil dan lebih spesifik dari perangkat besar itu. Mereka menggunakan
penambangan data untuk mengungkap informasi yang akan menginformasikan
kepemimpinan dan membantu memetakan arah untuk bisnis. Penambangan data
dapat melibatkan penggunaan berbagai jenis paket perangkat lunak seperti alat
analisis. Ini dapat diotomatisasi, atau sebagian besar padat karya, di mana
pekerja individu mengirimkan pertanyaan spesifik untuk informasi ke arsip atau
database. Umumnya, penambangan data mengacu pada operasi yang melibatkan
operasi pencarian yang relatif canggih yang mengembalikan hasil yang
ditargetkan dan spesifik. Misalnya, alat penambangan data dapat melihat melalui
puluhan tahun informasi akuntansi untuk menemukan kolom pengeluaran atau
piutang yang spesifik untuk tahun operasi tertentu. Singkatnya, big data
adalah aset dan data mining adalah "penangan" yang digunakan untuk
memberikan hasil yang bermanfaat. Saat ini di dunia teknologi sedang diramaikan oleh machine
learning dan kecerdasan buatan atau dalam bahasa Inggrisnya Artificial
Intelligence (AI), teknologi machine learning dan artificial intelligent ini
dapat membantu perkembangan bisnis dan menentukan arah bisnis di masa yang akan
datang. Irisan ilmu pengetahuan dari artificial intelligent dan machine
learning salah satunya adalah data mining. Data mining pada dasarnya memiliki
keterkaitan yang panjang dari bidang ilmu seperti kecerdasan buatan, machine
learning, statistika dan juga basis data. Data mining adalah istilah
ataupun konsep yang digunakan untuk menemukan informasi baru yang tersembunyi
di dalam suatu data yang besar, dalam proses ekstraksi dan mengidentifikasi
informasi potensial dan bermanfaat yang tersimpan di dalam suatu data yang besar
data mining menggunakan teknik statistika, matematika, kecerdasan buatan dan
juga machine learning. 1. Classification Klasifikasi
merupakan teknik data mining dengan meninjau pada kelakuan dan atribut dari
kelompok data yang telah didefinisikan. Teknik ini bisa memperoleh klasifikasi
pada data baru dengan memanipulasi data yang ada dan menggunakan hasilnya untuk
memberikan sejumlah aturan klasifikasi. Salah satu contoh metode klasifikasi
yang cukup populer adalah Decision Tree dikarenakan mudah untuk diinterpretasi. 2. Association Asosiasi
merupakan teknik data mining yang digunakan dalam mengenali pola dari
kejadian-kejadian atau peristiwa dimana hubungan asosiasi muncul pada setiap
kejadian. Salah satu contoh metode asosiasi yang cukup populer adalah Apriori
karena dapat menganalisa kemungkinan seseorang untuk membeli item atau produk
secara bersamaan apabila dalam sebuah perniagaan. 3. Clustering
Pengklusteran merupaka teknik data mining yang digunakan
dalam menganalisa pengelompokan terhadap data sehingga item bisa dibagi menjadi
beberapa kelompok berdasarkan aturan yang ditemukan pada proses mining, mungkin
terkesan mirip dengan klasifikasi, hanya saja pada pengklusteran pengelompokan
belum didefinisikan. Salah satu contoh metode ckustering yang cukup populer
seperti metode neural network, K-Means dan lain sebagainya. |