Must Read

Kenalan Lebih Dekat dengan Data Mining

Hai semua, kali ini kita akan membahas mengenai salah satu teknologi basis data, yaitu data mining. Pernah gak sih ketika kita sedang mencari sesuatu di google lalu kemudian kita membuka salah satu situs dan menemukan iklan yang sesuai dengan apa yang sebelumnya kita ketikkan di mesin pencari ? hmm apa jangan jangan selama ini ada mata-mata ya yang mengincar kita ?

Contoh diatas merupakan salah satu penerapan data mining yang mungkin tanpa kita sadari selama ini sudah ada didekat kita. Data mining sendiri adalah suatu proses pengerukan atau pengumpulan informasi penting dari suatu data yang besar. Proses data mining seringkali menggunakan metode statistika, matematika, hingga memanfaatkan teknoogi artificial intelligence.

Fungsi Data Mining

Dalam kesehariannya manusia memproduksi banyak data, misalkan dalam bidang pendidikan pastinya terdapat data siswa, nilai dll. Dalam dunia kedokteran ada data rekam medis dimana setiap hari bisa bertambah ribuan bahkan jutaan, dalam bidang ekonomi dan bisnis kita pasti mengenal data saham yang mencatat kenaikan dan penurunan setiap jam bahkan setiap menit, dan masih banyak lagi data yang kita hasilkan dibidang lainnya. Data-data tersebut seringkali kita abaikan, padahal jika kita gali lebih dalam data tersebut bisa bermanfaat bagi kehidupan. Disinilah data mining berperan penting untuk menggali dan mengolah data yang sangat besar nanti menjadi sebuah pengetahuan yang berguna bagi manusia untuk masa depan.

Adapun fungsi dari data mining dikelompokkan lagi menjadi :

  • Descriptive

    Descriptive merupakan suatu fungsi yang bertujuan memahami lebih jauh mengenai data yang diamati sehingga dapat diketahui perilaku dari sebuah data.

  • Predictive

    Fungsi ini adalah sebuah fungsi yang menjelaskan suatu proses dalam menemukan pola tertentu dari sebuah data. Pola-pola yang digunakan diketahui dari beragam variabel yang terdapat pada data.

  • Classification

    Fungsi ini bertujuan untuk menyimpulkan beberapa definisi karakteristik dari sebuah grup. Misalnya, pelanggan perusahaan yang sudah berpindah karena tersaingin oleh perusahaan lain.

  • Clustering

    Clustering adalah identifikasi kelompok dari produk-produk atau barang-barang yang memiliki karakteristik khusus.

  • Association

    Association merupakan identifikasi hubungan dari kejadian-kejadian yang sudah terjadi di suatu waktu.

  • Sequencing

    Sequencing sebetulnya hampir sama dengan association tetapi untuk sequencing berfungsi untuk identifikasi hubungan-hubunga berbeda di sebuah periode waktu tertentu. Contohnya, para pelanggan yang berkunjung di supermarket secara berulang.

  • Forecasting

    Fungsi ini bertujuan untuk memperkirakan nilai di suatu masa di masa mendatang sesuai dengan pola-pola dengan kumpula data dalam jumlah besar. Contohnya, peralaman permintaan pasar.

Supervised vs Unsupervised

Algoritma data mining sendiri dibagi menjadi dua bagian besar, yaiatu supervised dan unsupervised. Apasih perbedaan dari kedua cara tersebut ?

Perbedaan kedua algorima tersebut terletak pada bagaimana mereka belajar untuk membuat suatu prediksi maupun klasifikasi. Dalam supervised learning, algoritma tersebut seolah-olah dilatih terlebih dahulu agar dapat melakukan prediksi maupun klasifikasi.

Tugas kita sebagai Data Scientist seolah-olah bertindak sebagai seorang supervisor untuk melatih algoritma tersebut. Sedangkan pada unsupervised learning, untuk melakukan prediksi maupun klasifikasi mereka tidak perlu dilatih terlebih dahulu. Sehingga dapat dikatakan bahwa supervised learning membutuhkan data training agar mampu melakukan prediksi maupun klasifikasi.

Contoh algoritma supervised learning adalah :

  • Lienear Regression
  • Decision Tree dan Random Forest
  • Naive Bayes Classifier
  • Nearest Neighbor Classifier
  • Artificial Neural Network
  • Support Vector Machine

Unsupervised learning tidak memerlukan data latih untuk melakukan tugasnya. Salah satu tujuan dari algoritma ini adalah mengelompokkan objek yang hampir sama dalam suatu area tertentu. Contoh dari penerapan metode ini adalah ketika seorang data analyst ingin mengelompokkan customer salah satu pelanggan toko online berdasarkan kemiripan sifat dalam hal pendapatan, umur, hobi, dan jenis pekerjaan.

Contoh algoritma yang bisa kita gunakan dalam hal unsupervied learning diantaranya adalah :

  • K-Means
  • Hierarchical Clustering
  • DBSCAN
  • Fuzzy C-Means
  • Self-Organizing Ma

Metode yang digunakan

Banyak metode yang bisa kita gunakan untuk memulai penelitian data mining, namun metodologi yang paling sering digunakan dalam penelitan adalah Crisp-dm dan KDD. CRISP-DM merupakan singkatan dari Cross-Industry Standard Process for Data Mining dan memiliki 6 tahapan yaitu Business UnderstandingData UnderstandingData PreparationModelingEvaluation, dan Deployment.

Knowledge discovery in databases (KDD) adalah keseluruhan proses non-trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data, dimana pola yang ditemukan bersifat sah, baru, dapat bermanfaat dan dapat dimengerti. Tahapan dalam KDD meliputi Data Selection, Pre-processing/ Cleanning, Transformation, Data Mining, Evaluation.

Bahasa yang digunakan

Banyak tools yang bisa kita pakai untuk membuat program data mining, mulai dari tools analisa yang tidak memerlukan keterampilan koding seperti Weka, Rapidminer, Azure Machine Learning, dll, hingga beragam library yang akan mempermudahkan kita dalam pengembangan. Bahasa pemrograman yang sering digunakan dalam proses datamining adalah R dan Python. Keduanya sudah memiliki banyak library dan fungsi yang mempermudah kita, namun menurut saya R lebih cocok untuk kita yang memliki background matematika, karena pendekatannya yang lebih ke statistika, sedangkan bagi kita yang berangkat dari background IT akan lebih nyaman menggunakan Python dibanding R.

Mungkin sampai disini dulu pembahasannya, selanjutnya mari kita bahas lebih dalam lagi dengan studi kasus, stay tune ya

Related posts

Lebih Dekat Dengan DevOps

Rio Jurezky

Teknologi Virtual Reality dalam Dunia Kesehatan

Darryl Elgiva

React Native 101 – #2 Cara Kerja

Rochman Ramadhani

Leave a Comment