Jumat, 13 Juni 2025

Proses Data Mining & Data Analytics

Data mining adalah pengolahan data dengan metode data analytics tertentu untuk mendapatkan Insight dari data banyak yang ditambang dari berbagai sumber.  Hasil data mining yang sudah menjadi Insight akan disajikan dalam bentuk Business Intelligence untuk alat bantu pengambilan keputusan dalam rangka menentukan kebijakan perusahaan / organisasi.


Tahapan dalam standar data mining seperti gambar di atas:

  1. Business Understanding, yaitu bagaimana memahami sistem yang ada dalam bisnis sehingga mendapatkan gambaran komponen apa saja, dan bagaimana komponen itu berinteraksi.
  2. Data Understanding, yaitu bagaimana memahami data terkait dengan komponen dalam sistem bisnis, data apa saja yang harus disiapkan, dari mana mendapatkan data, bentuk  data yang seharusnya. Dalam tahap ini memungkinkan ada perbaikan komponen dalam business understanding yang kelewat berdasarkan temuan data understanding.
  3. Data Preparation, menyiapkan data sesuai yang dibutuhkan dalam tahap data understanding, mengolah data, mengurangi yang redudansi, memperbaiki data, menyiapkan data untuk kebutuhan modeling seperti menyiapkan format datanya.
  4. Modeling, melakukan data analytics dari data dengan menggunakan algoritma tertentu, menggunakan tools siap pakai seperti Orange, RapidMiner atau menggunakan Python untuk yang lebih kompleks.  Di sini digunakan machine learning sesuai keperluan, misalnya untuk clustering bisa menggunakan K-Means, untuk klasifikasi bisa menggunakan Naive Bayes, dst.
  5. Evaluation, menentukan hasil pemodelan yang mempunyai kinerja paling bagus dengan metode tertentu seperti Bouldin Index.  Maksudnya, dalam pemodelan biasanya akan menggunakan beberapa algoritma seperti pada klasifikasi membandingkan Naive Bayes, KNN dan SVM, maka akan digunakan algoritma yang mempunyai mendekati 0 jika dengan Bouldin Index.
  6. Deployment, yaitu menyajikan hasil pemodelan setelah dilakukan evaluasi, seperti menggunakan Microsoft Power BI.
Contoh kasus untuk mencari cluster yang potensial untuk melakukan pemasaran untuk efesiensi biaya, sehingga targetnya hanya akan memasang reklame di tempat yang potensial saja.

  1. BusinessUnderstandingnya, lokasi tersebut banyak dilalui oleh pelajar, dekat perumahan atau dekat sekolah.
  2. Data Understandingnya, menyiapkan data titik sekolah, perumahan, dan jalan.
  3. Data Preparationnya, mengumpulkan data titik sekolah, perumahan, dan jalan.
  4. Modelingnya, menggunakan algoritma clustering seperti K-Means, DBSCAN dan GMM, dengan Python.
  5. Evaluasinya, menentukan DBI untuk setiap algoritma yang digunakan dan dicari yang paling kecil mendekati 0.
  6. Deploymentnya, dapat dalam bentuk layout peta atau dalam software Power BI.  Gambar dibawah, yang berwarna hijau adalah lokasi paling potensial untuk memasang reklame.


Data mining ini dapat digunakan untuk mencari Insight segala hal, seperti konflik pertanahan, bisnis properti, penjualan kendaraan, penempatan toko baru, dan segala jenis yang terkait dengan lokasi bisnis terbaik.

Jika membutuhkan jasa pengolahan data mining seperti penjelasan singkat di atas dapat menghubungi: WA 081219166875.

Tidak ada komentar:

Posting Komentar

Lelang Data Analytics di Kemenkeu

Pengadaan Penyusunan Grand Design Pusat Data Analitik Pemberantasan Korupsi Ruang Lingkup: 1. Asesmen Kondisi Eksisting Decision Support ...