Ketika kita akan berjualan informasi atau insight dalam bentuk aplikasi atau lainnya, hasil data mining atau data analytics, kita akan menjelaskan kepada client dengan percaya diri bahwa di cluster 1 sangat sesuai untuk toko makanan, cluster 2 cocok untuk toko bahan mentah, yang semisal kebetulan client mempunyai usaha di kedua bidang tersebut.
Bagaimana kalau ketuker? tentu client akan rugi dan merasa ditipu, dikasih informasi yang salah.
Bagaimana solusinya? padahal data sudah lengkap, valid dan terkini.
Misalnya: algoritma yang digunakan clustering, algoritma clustering sendiri banyak sekali, mulai dari K-Means, C-Means, X-Means, K-Medoid, DBSCAN, HDBSCAN, Diana, Clarans, GMM dan lain-lainnya.
Dalam standard data mining, untuk mengatasi ini hal ini dapat dilakukan dengan evaluasi model dari banyak algoritma yang digunakan atau dibandingkan, dapat ditentukan algoritma mana dengan kinerja yang paling baik.
Hasil pengamatan, masih banyak penjual informasi / insight hanya menggunakan satu algoritma saja. So informasi yang dihasilkan masih blunder.
Sumber:
Tidak ada komentar:
Posting Komentar