Data Mining adalah serangkaian proses untuk menggali nilai tambah dari
suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui
secara manual. Patut diingat bahwa kata mining sendiri berarti usaha
untuk mendapatkan sedikit barang berharga dari sejumlah besar material
dasar. Karena itu Data Mining sebenarnya memiliki akar yang panjang dari
bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine
learning, statistik dan database. Data mining adalah proses menerapkan
metode ini untuk data dengan maksud untuk mengungkap pola-pola
tersembunyi. Dengan arti lain Data mining adalah proses untuk penggalian
pola-pola dari data. Data mining menjadi alat yang semakin penting
untuk mengubah data tersebut menjadi informasi. Hal ini sering digunakan
dalam berbagai praktek profil, seperti pemasaran, pengawasan, penipuan
deteksi dan penemuan ilmiah. Telah digunakan selama bertahun-tahun oleh
bisnis, ilmuwan dan pemerintah untuk menyaring volume data seperti
catatan perjalanan penumpang penerbangan, data sensus dan supermarket
scanner data untuk menghasilkan laporan riset pasar.
Alasan utama untuk menggunakan data mining adalah untuk membantu dalam analisis koleksi pengamatan perilaku. Data tersebut rentan terhadap collinearity karena diketahui keterkaitan. Fakta yang tak terelakkan data mining adalah bahwa subset/set data yang dianalisis mungkin tidak mewakili seluruh domain, dan karenanya tidak boleh berisi contoh-contoh hubungan kritis tertentu dan perilaku yang ada di bagian lain dari domain . Untuk mengatasi masalah semacam ini, analisis dapat ditambah menggunakan berbasis percobaan dan pendekatan lain, seperti Choice Modelling untuk data yang dihasilkan manusia. Dalam situasi ini, yang melekat dapat berupa korelasi dikontrol untuk, atau dihapus sama sekali, selama konstruksi desain eksperimental.
Beberapa teknik yang sering disebut-sebut dalam literatur Data Mining dalam penerapannya antara lain: clustering, classification, association rule mining, neural network, genetic algorithm dan lain-lain. Yang membedakan persepsi terhadap Data Mining adalah perkembangan teknik-teknik Data Mining untuk aplikasi pada database skala besar. Sebelum populernya Data Mining, teknik-teknik tersebut hanya dapat dipakai untuk data skala kecil saja.