Pengelompokan Dokumen Tugas Akhir Mahasiswa S1 Ilmu Komputer IPB Berdasarkan Frequent Term Sets
Abstrak
Pengelompokan dokumen tugas akhir mahasiswa perlu dilakukan karena dokumen tugas akhir mahasiswa bertambah setiap tahunnya. Pengelompokan dokumen dilakukan agar dokumen yang memiliki kesamaan konteks dapat dikelompokkan ke dalam suatu kategori. Tujuan dari penelitian ini menerapkan teknik association rule mining (ARM) untuk menentukan frequent term sets dengan menggunakan algoritme ECLAT. Data yang digunakan dalam penelitian ini adalah data abstrak dokumen tugas akhir mahasiswa Ilmu Komputer IPB dalam bahasa Inggris. Penelitian ini menggunakan algoritme ECLAT dengan minimum support sebesar 0.1, 0.15, 0.20, 0.25, 0.30, dan 0.35. Penelitian ini menggunakan metode hierarchical frequent term based clustering untuk menentukan cluster. Frequent term sets hasil algoritme ECLAT masih terlalu umum untuk digunakan sebagai penciri dokumen. Pada penelitian ini hasil clustering dengan minimum support 0.35 terbentuk 3 tingkat hirarki term. Term yang sering muncul pada minimum support 0.35 adalah ‘result’, ‘base’, ‘use’, ‘one’, ‘data’. Sedangkan asosiasi dua term yang sering muncul pada minimum support 0.35 adalah ‘result-use’, ‘base-use’, ‘one-use’, ‘data-use’. Hasil clustering dapat mempermudah pencarian dokumen berdasarkan kata kunci tertentu.
Kata Kunci: association rule mining, ECLAT, frequent term sets, clustering hirarki