Halo semua para pembaca di web codekop, kali ini saya ingin membagikan sebuah tulisan tentang Data Mining, dikala waktu itu saya juga masih belajar tentang salah satu konsep Data Mining yang sekarang sering dipakai untuk judul-judul skripsi mahasiswa informatika, seperti saya juga mengangkat salah satu judul dengan konsep Data Mining.
Seperti judul diatas saya akan lebih ke spesifik menulis Penerapan Algoritma Apriori : Contoh dan Implementasi menggunakan Python dalam lingkup aturan asosiasi ( Association Rule Learning )
Algoritma Apriori
Bicara soal Algoritma, Algoritma adalah urutan atau langkah-langkah yang logis dan sistematis untuk memecahkan dan menyelesaikan suatu masalah. Algoritma tidak selalu identik dengan ilmu komputer saja, dalam kehidupan sehari-hari pun banyak terdapat proses yang dinyatakan dalam suatu algoritma, dan algoritma pun juga merupakan kumpulan perintah untuk menyelesaikan suatu masalah.
Lalu membahas Algoritma Apriori, Apriori yaitu termasuk jenis aturan asosiasi atau association rule dalam data mining. Aturan yang menyatakan asosiasi antara beberapa atribut sering disebut affinity analysis atau market basket analysis.
Association Rule
Analisis asosiasi atau Association Rule adalah teknik data mining untuk menemukan aturan asosiatif antara suatu kombinasi item . Association Rule didefinisikan suatu proses untuk menemukan semua aturan asosiatif yang memenuhi syarat minimum support dan syarat minimum confidence.
Contoh Penerapan :
Menganalisis transaksi penjualan di suatu toko / warung, disetiap pembelian yang dilakukan oleh konsumen, akan tercatat ID transaksi dan pada setiap transaksi dan memungkinkan ada satu atau lebih barang (item) yang dibeli, jika ada 100 transaksi setiap harinya, maka sudah ada 3000 transaksi dalam 1 bulan, nah dari transaksi inilah terbentuk pola-pola kombinasi pembelian item barang, seperti misal Konsumen A membeli { beras, telur dan minyak }, Konsumen B membeli { telur dan minyak } dan seterusnya.
Lalu peran Association Rule pada Algoritma Apriori disini diterapkan untuk membaca pola atau kecendrungan pembelian konsumen dengan melakukan perhitungan dari pembentukan suatu pola asosiasi produk pada data transaksi penjualan, untuk menampilkan informasi tentang hasil informasi berupa pembentukan suatu pola asosiasi produk yang paling sering dibeli konsumen.
contoh : seberapa besar kemungkinan seorang pelanggan beli { beras, telur dan minyak } berupa persentase kepercayaan (confidence), berdasarkan data transaksi yang sudah hitung.
Dengan pengetahuan tersebut, data yang dihasilkan akan digunakan untuk sebagai pendukung pengambilan keputusan dalam membuat solusi bisnis pemilik di suatu toko / warung ataupun pengusaha lainnya yang dapat mengatur penempatan barangnya atau merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu.
Tahapan proses perhitungan Algoritma Apriori
Association rule dengan menentukan minimum support dan confidence untuk dapat menunjukan seberapa besar suatu rule yang dapat dipercaya dengan penjelasan sebagai berikut:
Berikut adalah tahapan-tahapan proses algoritma apriori, untuk mencari kombinasi item yang memenuhi syarat minimum dari nilai support
Percobaan dengan perhitungan Pemrograman Python
Pada percobaan dengan perhitungan apriori pada pemrograman python menggunakan data transaksi sebanyak 102 transaksi dengan ketentuan nilai :
Data Transaksi Penjualan xlsx
Berikut tahapan-tahapan dari perhitungan menggunakan pemrograman python untuk mengesekusi perhitungan pada program :
# Menginstall Library !pip install pandas !pip install numpy !pip install apyori
# Memanggil library yang dibutuhkan import pandas as pd import numpy as np from apyori import apriori
# Load data Google Colab ( File Excel pada Google Drive) df= pd.read_excel('drive/MyDrive/Skripsi/dataset_2021-06-10.xlsx') df.head()
Proses ini membaca file excel mengunakan library pandas. Dimana nama file excel yang di gunakan adalah dataset_2021-06-10.xlsx, file ini di simpan 1 folder dengan lokasi script yang sedang kita jalankan, jika sudah berhasil maka akan muncul tabel dari data tersebut.
# Membuang kolom Tanggal, ID Transaksi data=df.drop(['Tanggal','ID Transaksi'],axis=1)
# Membuat list dalam list dari transaksi pembelian barang records = [] for i in range(data.shape[0]): records.append([str(data.values[i,j]).split(',') for j in range(data.shape[1])]) trx = [[] for trx in range(len(records))] for i in range(len(records)): for j in records[i][0]: trx[i].append(j) trx
Hasil Screenshoot :
# Menggunakan fungsi apriori untuk membuat asosiasi association_rules = apriori(trx, min_support=0.14, min_confidence=0.80,min_lift=1) # Membuat list hasil dari algoritma apriori association_results = association_rules
Dimana perintah yang di gunakan adalah apriori, dengan data dari data training berbentuk array dengan minimum nilai support 0.14 / 14%, dan minimum confidence 0.80 / 80%.
# Menampilkan hasil asosiasi dari item pd.set_option('max_colwidth', 1000) Result=pd.DataFrame(columns=['Rule','Support','Confidence']) for item in association_results: pair = item[2] for i in pair: items = str([x for x in i[0]]) if i[3]!=1: Result=Result.append({ 'Rule':str([x for x in i[0]])+ " -> " +str([x for x in i[1]]), 'Support':str(round(item[1]*100,2))+'%', 'Confidence':str(round(i[2] *100,2))+'%' },ignore_index=True) Result
Source Code :
File Github
Akhir Kata
Pembahasan ini sebatas sharing atau berbagi untuk artikel data mining yaitu Penerapan Association Rule menggunakan Algoritma Apriori, contoh dan perhitungan menggunakan python, Terima kasih sudah berkunjung, semoga tutorial ini bermanfaat, mohon maaf bila ada kesalahan informasi, sumber data, kata-kata, dan kekurangan pada tulisan kali ini. salam koding.
Sumber :
* Temukan berbagai postingan dan produk yang kamu cari