PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
KEAKURATAN METODE K-MEANS CLUSTERING DALAM PENGELOMPOKAN LAGU DAERAH BERDASARKAN PULAU ASAL DI INDONESIA
SKRIPSI
Diajukan Untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika
Oleh
Theodorus Cahyo Adi Nugroho
105314109
PROGRAM STUDI JURUSAN TEKNIK INFORMATIKA
JURUSAN TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2015
i
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
THE ACCURACY OF K-MEANS CLUSTERING METHOD TO
CLUSTERING FOLK SONGS BASED ISLAND IN INDONESIA
A THESIS
Presented as Partial Fulfillment of Requirements
To Obtain Sarjana Komputer Degree
In Informatics Engineering Department
By
Theodorus Cahyo Adi Nugroho
105314109
INFORMATICS ENGINEERING STUDY PROGRAM
INFORMATICS ENGINEERING DEPARTMENT
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2015
ii
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
iii
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
iv
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
HALAMAN PERSEMBAHAN
This thesis belongs to :
My Lord Jesus Christ, thank you so much for everything that He given to me until now…
My parent, thank you so much for all supports and guiding me…
My friends, thank you so much for all supports…
v
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa di dalam skripsi yang saya tulis ini tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.
Yogyakarta, 26 Januari 2015
Penulis
Theodorus Cahyo Adi Nugroho
vi
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH
UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma:
Nama : Theodorus Cahyo Adi Nugroho
NIM : 105314109
Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan
Universitas Sanata Dharma karya ilmiah yang berjudul:
KEAKURATAN METODE K-MEANS CLUSTERING DALAM
PENGELOMPOKAN LAGU DAERAH BERDASARKAN PULAU ASAL DI
INDONESIA
Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan kepada perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data mendistribusikan secara terbatas, dan mempublikasikannya di Internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun memberikan royalti kepada saya selama tetap mencamtumkan nama saya sebagai penulis.
Demikian pernyataan ini saya buat dengan sebenarnya.
Yogyakarta, 26 Januari 2015
Penulis
Theodorus Cahyo Adi Nugroho
vii
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
ABSTRAK
Di Indonesia, terdapat berbagai macam daerah dan setiap daerah memiliki karakteristik yang berbeda - beda, antara lain adalah baju daerah, bahasa daerah, dan yang sering kita dengar adalah lagu daerah. Terdapat 34 propinsi dengan 190 lagu daerah. Akan tetapi, masyarakat di Indonesia masih banyak yang tidak mengetahui asal lagu daerah tersebut karena jumlah lagu daerah yang sangatlah banyak dan beragam karakteristiknya.
Dari latar belakang tersebut, maka pengelompokkan lagu daerah dilakukan menggunakan algoritma K-Means. Proses ekstraksi ciri dilakukan dengan menggunakan metode MFCC yang terdapat pada jAudio.
Hasil akhir yang diperoleh adalah tingkat akurasi algoritma K-Means dalam pengelompokkan lagu daerah berdasarkan pulau asalnya. Hasil akurasi rata
– rata dari pengujian adalah 50.44% dengan tingkat akurasi paling tinggi 53.33% dan paling rendah 46.67%. Hal ini dikarenakan data yang digunakan karakteristiknya sangat rendah dan hasil MFCC menjadi kurang baik, dibuktikan dengan percobaan pengelompokan lagu berdasarkan genre.
Kata Kunci : K-Means, MFCC, jAudio, Lagu Daerah, WAV
viii
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
ABSTRACT
In Indonesia, there are many regions and each region has different characteristics, example : the local clothes, the local languages, and that we often hear is a local song. There are 34 provinces with 190 folk songs. However, people in Indonesia are still do not know the origin of the song because the number of folk songs are so numerous and diverse characteristics.
From this background, the grouping of folk songs performed by using the
K-Means algorithm. The process of feature extraction is performed by using the method contained in jAudio, MFCC.
The final result obtained is the accuracy of the K-Means algorithm in clustering folk song based on the island of origin. The results of average accuration of the test is 50.44% with the highest level of accuration is 53.33% and lowest level of accuration is 46.67%. This is because the characteristics of the data used is very low and MFCC be less good results, it proved by experiment clustering songs by genre.
Keywords : K-Means, MFCC, jAudio, Folk Songs, WAV
ix
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus, sehingga penulis dapat menyelesaikan tugas akhir sebagai salah satu mata kuliah wajib dan merupakan syarat akademik pada jurusan Teknik Informatika Universitas Sanata
Dharma Yogyakarta.
Pada kesempatan ini, penulis ingin mengucapkan terima kasih kepada pihak-pihak yang telah membantu penulis baik selama penelitian maupun saat pengerjaan skripsi ini. Ucapan terima kasih penulis sampaikan di antaranya kepada :
1. Ibu Sri Hartati Wijono, S.Si., M.Kom., selaku dosen pembimbing
tugas akhir. Terima kasih atas bimbingan, kesabaran, waktu, dukungan
dan ilmu yang sudah diberikan kepada penulis selama mengerjakan
tugas akhir.
2. Ibu Ridowati Gunawan, S.Kom., M.T., dan Bapak Alb. Agung
Hadhiatma, S.T., M.T., selaku dosen penguji. Terima kasih atas saran
dan kritik yang telah diberikan.
3. Ibu Paulina Heruningsih Prima Rosa S.Si., M.Sc., selaku Dekan
Fakultas Sains dan Teknologi dan dosen pembimbing akademik
Teknik Informatika kelas c. Terima kasih atas dukungan, bimbingan
dan kesabarannya dalam menghadapi mahasiswa.
4. Seluruh Dosen Teknik Informatika atas ilmu yang telah diberikan
selama masa kuliah dan sangat membantu penulis dalam mengerjakan
tugas akhir. x
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
5. Orang tua, Laurentius Suwondo dan Laurentia Endang Pratiwi atas
dukungan moral, spiritual dan finansial dalam penyusunan skripsi.
6. Om Sutadi, Mas Andi, Mbak Vita, Mbak Rina, Mas Anton dan seluruh
keluarga besar Sugeng Hutomo dan Eyang Muntilan atas semangat,
dukungan dan doanya.
7. Mr. Cory McKay for the dissertation about jAudio. Thank you so
much for all the answers and helping me to understanding about
jAudio.
8. Mas Audris, Mbak Petra, Fa Febrian, Edo, Agus, Yhoga, Dita dan
Teddy atas bantuan dan semangat serta doanya selama penulis
mengerjakan tugas akhir.
9. Ougi, Ronny, Ardy, Renny, Andhini, Festi, Maria, Ria, Sepen, Novi,
Amel, Felisitas, Erlita dan Ayu atas semua dukungan dan semangat
serta doanya.
10. Seluruh teman-teman Teknik Informatika 2010 dan 2011, atas
dukungan dan doanya.
11. Semua pihak yang tidak dapat disebutkan satu per satu yang telah
membantu penulis dalam pengerjaan skripsi ini.
xi
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
Penulis menyadari masih banyak kekurangan yang terdapat
dalam laporan tugas akhir ini. Saran dan kritik sangat diharapkan
untuk hasil yang lebih baik di masa depan.
Penulis,
Theodorus Cahyo Adi Nugroho
xii
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
DAFTAR ISI
HALAMAN JUDUL BAHASA INDONESIA ...... I HALAMAN JUDUL BAHASA INGGRIS ...... II HALAMAN PERSETUJUAN ...... ERROR! BOOKMARK NOT DEFINED. HALAMAN PENGESAHAN ...... ERROR! BOOKMARK NOT DEFINED. HALAMAN PERSEMBAHAN ...... V PERNYATAAN KEASLIAN KARYA ...... VI LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ...... VII ABSTRAK ...... VIII ABSTRACT ...... IX KATA PENGANTAR ...... X DAFTAR ISI ...... XIII DAFTAR GAMBAR ...... XV DAFTAR TABEL ...... XVI BAB I PENDAHULUAN ...... 1
1.1. LATAR BELAKANG ...... 1 1.2. RUMUSAN MASALAH ...... 3 1.3. TUJUAN PENELITIAN ...... 3 1.4. BATASAN MASALAH ...... 3 1.5. MANFAAT PENELITIAN ...... 4 1.6. METODOLOGI PENELITIAN ...... 4 1.7. SISTEMATIKA PENULISAN ...... 5 BAB II LANDASAN TEORI ...... 7
2.1. MUSIK TRADISIONAL / LAGU DAERAH ...... 7 2.2. PENGENALAN POLA ...... 11 2.3. AUDIO FEATURE EXTRACTION ...... 13 2.3.1. Aplikasi jAudio ...... 13 2.3.2. Mel-frequency Cepstral Coefficients (MFCC) ...... 14 2.4. CLUSTERING ...... 17 2.5. ALGORITMA K-MEANS ...... 18 BAB III ANALISIS DAN PERANCANGAN PENELITIAN ...... 22
3.1. PERANCANGAN PENELITIAN SECARA UMUM ...... 22 3.2. DATA PREPROCESSING ATAU PEMBUATAN DATA ...... 24 3.3. PROSES CLUSTERING ...... 25 3.4. PROSES PENGUJIAN ...... 26 3.5. SPESIFIKASI HARDWARE DAN SOFTWARE ...... 28 3.5.1. Hardware ...... 28 xiii
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
3.5.2. Software ...... 28 BAB IV ANALISIS DAN IMPLEMENTASI PENELITIAN ...... 29
4.1. IMPLEMENTASI MENENTUKAN CENTROID AWAL ...... 29 4.2. IMPLEMENTASI CLUSTERING DENGAN METODE K-MEANS ...... 30 4.3. IMPLEMENTASI PENGUJIAN AKURASI BERDASARKAN NILAI PRECISION TERTINGGI...... 34 BAB V HASIL DAN PEMBAHASAN ...... 39
5.1. HASIL PENGUKURAN ...... 39 5.2. SKENARIO PENGUJIAN ...... 41 5.3. ANALISA HASIL ...... 47 5.3.1. Kesalahan Pengelompokkan Lagu Daerah ...... 49 5.3.2. Penentuan Centroid Awal ...... 52 5.3.3. Karakteristik Lagu dan MFCC ...... 55 BAB VI KESIMPULAN DAN SARAN ...... 59
6.1. KESIMPULAN ...... 59 6.2. SARAN ...... 60 DAFTAR PUSTAKA ...... 61
xiv
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
DAFTAR GAMBAR
GAMBAR 2. 1 DIAGRAM BLOK MEL - FREKUENSI KOEFISIEN CEPSTRAL ...... 15 GAMBAR 2. 2 DIAGRAM ALGORITMA K-MEANS ...... 20
GAMBAR 3. 1 DIAGRAM BLOK PENELITIAN SECARA UMUM ...... 23 GAMBAR 3. 2 OUTPUT JAUDIO ...... 24 GAMBAR 3. 3 DATABASE HASIL JAUDIO ...... 25 GAMBAR 3. 4 DIAGRAM BLOK PROSES CLUSTERING DENGAN ALGORITMA K-MEANS ...... 26
GAMBAR 4. 1 MENENTUKAN CENTROID AWAL ...... 30 GAMBAR 4. 2 CLUSTERING DENGAN K-MEANS ...... 34 GAMBAR 4. 3 PENGUJIAN AKURASI ...... 38
xv
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI
DAFTAR TABEL
TABEL 5. 1 INISIALISASI CLUSTER TIAP PULAU ...... 39 TABEL 5. 2 LAGU DAERAH DENGAN ACTUAL CLUSTER 1 ...... 40 TABEL 5. 3 LAGU DAERAH DENGAN ACTUAL CLUSTER 2 ...... 40 TABEL 5. 4 LAGU DAERAH DENGAN ACTUAL CLUSTER 3 ...... 40 TABEL 5. 5 PERBANDINGAN CLUSTER...... 41 TABEL 5. 6 BOBOT PERBANDINGAN PREDICTED CLUSTER DENGAN ACTUAL CLUSTER ...... 42 TABEL 5. 7 PRECISION PERBANDINGAN PREDICTED CLUSTER DENGAN ACTUAL CLUSTER ...... 43 TABEL 5. 8 PRECISION TERTINGGI PERBANDINGAN PREDICTED DENGAN ACTUAL CLUSTER ...... 45 TABEL 5. 9 TOTAL BOBOT PERBANDINGAN PREDICTED CLUSTER DENGAN ACTUAL CLUSTER BERDASARKAN PRECISION TERTINGGI ...... 46 TABEL 5. 10 AKURASI BERDASARKAN PRECISION TERTINGGI ...... 46 TABEL 5. 11 HASIL PENGUJIAN AKURASI ...... 47 TABEL 5. 12 TABEL PERSENTASE LAGU ...... 50 TABEL 5. 13 TABEL PERSENTASE KESALAHAN ...... 51 TABEL 5. 14 AKURASI TIAP PULAU ...... 52 TABEL 5. 15 TABEL INISIALISASI GENRE LAGU ...... 57 TABEL 5. 16 TABEL AKURASI BERDASARKAN GENRE ...... 58
xvi
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 1
BAB I
PENDAHULUAN
1.1. Latar Belakang
Di Indonesia, terdapat berbagai macam daerah dan setiap daerah
memiliki karakteristik yang berbeda - beda, antara lain adalah baju daerah,
bahasa daerah, dan yang sering kita dengar adalah lagu daerah. Terdapat
34 propinsi dengan 190 lagu daerah. Akan tetapi, masyarakat di Indonesia
masih banyak yang tidak mengetahui asal lagu daerah tersebut karena
jumlah lagu daerah yang sangatlah banyak dan beragam karakteristiknya.
Karakteristik lagu suatu pulau jelas sangat berbeda dengan pulau lain,
misal: karakter satu lagu di pulau Jawa berbeda dengan karakter lagu di
pulau Sumatera. Akan tetapi, sebelum lagu daerah dikelompokkan
berdasarkan pulau asalnya, data tersebut harus dapat disimpan
karakteristiknya agar pengelompokkan menghasilkan hasil yang optimum.
Pengolahan lagu daerah tersebut dapat dilakukan dengan metode MFCC.
MFCC merupakan salah satu metode dalam fiture extraction
berbasis timbral. Pada penelitian Genre Classification and The Variance of
MFCC to Key And Tempo (Tom LH. Li and Antoni B. Chan, 2011)
MFCC mengkodekan baik timbral maupun kunci pada musik. Penelitian
tersebut menghasilkan akurasi 68,9% menggunakan klasifikasi Aug-Both
dengan 13 koefisien MFCC. Selain itu, genre musik klasik menghasilkan
akurasi 90% untuk semua data.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 2
Dalam kasus ini, pengelompokkan lagu daerah dapat dilakukan
dengan metode Data Clustering. Data Clustering merupakan salah satu
metode Data Mining yang bersifat tanpa arahan (unsupervised). Ada dua
jenis data clustering yang sering dipergunakan dalam proses
pengelompokan data yaitu hierarchical (hirarki) data clustering dan non-
hierarchical (non hirarki) data clustering. K-Means merupakan salah satu
metode data clustering non hirarki yang berusaha mempartisi data yang
ada ke dalam bentuk satu atau lebih cluster/kelompok.
Metode ini mempartisi data ke dalam cluster/kelompok sehingga
data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu
cluster yang sama dan data yang mempunyai karakteristik yang berbeda
dikelompokkan ke dalam kelompok yang lain.
Adapun tujuan dari mengelompokkan data ini adalah untuk
meminimalisasikan objective function yang diset dalam proses clustering,
yang pada umumnya berusaha meminimalisasikan variasi di dalam suatu
cluster dan memaksimalisasikan variasi antar cluster (MacQueen, J. B.
1967).
Kelebihan metode k-means adalah dapat memecahkan berbagai
macam permasalahan. Salah satunya adalah permasalahan dalam bidang
musik, yaitu : mengelompokkan lagu daerah berdasarkan pulau asalnya.
Dalam penelitian ini, hasil tingkat akurasi dari clustering bisa
beragam karena penelitian itu dilakukan untuk mencari keakurasian
metode K-Means dalam menangani pengelompokkan lagu daerah
berdasarkan pulau asalnya di Indonesia.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 3
1.2. Rumusan Masalah
Seberapa besar tingkat akurasi metode K-Means Clustering dalam
mengelompokkan lagu daerah berdasarkan pulau asalnya di Indonesia.
1.3. Tujuan Penelitian
Penelitian ini bertujuan untuk mengetahui tingkat akurasi metode
K-Means Clustering dalam mengelompokkan lagu daerah berdasarkan
pulau asalnya di Indonesia.
1.4. Batasan Masalah
Batasan penelitian ini, antara lain :
1. Mengetahui keakuratan metode K-mean Clustering dalam
mengelompokkan lagu daerah berdasarkan pulau asalnya di
Indonesia.
2. Pengujian akurasi menggunakan metode precision.
3. Format lagu daerah adalah wave (.wav).
4. Proses extract feature menggunakan metode Mel-frequency
Cepstral Coefficient (MFCC) yang terdapat dalam aplikasi
jAudio.
5. MFCC menghasilkan banyak koefisien yang dapat dijadikan
fitur untuk penelitian. Penelitian ini menggunakan 13 koefisien
karena koefisien lebih dari 13 dianggap tidak berpengaruh
banyak.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 4
6. Hanya menggunakan 10 lagu daerah untuk mewakili setiap
pulau. Pulau yang dipakai untuk penelitian ini adalah pulau
Jawa, Sumatera dan Maluku.
7. Penelitian menggunakan software Netbeans IDE 8.0.1 dengan
bahasa pemrograman Java.
1.5. Manfaat Penelitian
Manfaat dari penelitian ini untuk mengetahui akurasi metode K-
Means Clustering dalam mengelompokkan lagu daerah berdasarkan pulau
asalnya di Indonesia.
1.6. Metodologi Penelitian
Tahapan yang dilakukan dalam pembuatan tugas akhir adalah :
1. Studi Pustaka
Pada tahap ini mempelajari informasi yang berhubungan
dengan skripsi ini. Informasi dapat diperoleh dari buku - buku
referensi atau sumber - sumber yang berkaitan dengan skripsi
ini, baik dari text book maupun internet.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 5
2. Analisis dan Perancangan Penelitian
Pada tahap ini dilakukan analisis terhadap masalah, proses,
cara kerja, dan solusi. Selain itu, dilakukan perancangan
terhadap data dan penelitian secara keseluruhan.
3. Implementasi Program
Pada tahap ini dilakukan penerapan implementasi dengan
pengkodean program perangkat lunak pengujian akurasi
dengan menggunakan bahasa pemrograman Java.
4. Pengujian dan Analisa Penelitian
Pengujian dilakukan untuk memastikan akurasi metode k-
means clustering dalam clustering lagu daerah berdasarkan
pulau asal di Indonesia. Lalu melakukan analisa tentang hasil
yang diperoleh dari pengujian penelitian.
1.7. Sistematika Penulisan
Dalam tulisan ini ada enam buah bab, sebagai berikut :
BAB I PENDAHULUAN
Berisi pendahuluan yang akan dibahas meliputi latar belakang
masalah, rumusan masalah, tujuan penelitian, batasan masalah, manfaat
penelitian, metodologi penelitian dan sistematika penulisan.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 6
BAB II LANDASAN TEORI
Berisi konsep - konsep yang akan digunakan sebagai acuan dalam
penelitian.
BAB III ANALISIS DAN PERANCANGAN PENELITIAN
Berisi analisis dan perancangan yang akan digunakan dalam
penelitian keakuratan metode k-means clustering untuk mengelompokkan
lagu daerah berdasarkan pulau asalnya di Indonesia.
BAB IV IMPLEMENTASI
Berisi implementasi dan penjelasan fungsi program dari penelitian
yang dibuat.
BAB V ANALISIS HASIL
Berisi analisis dan hasil dari pengujian yang dilakukan.
BAB VI KESIMPULAN DAN SARAN
Berisi kesimpulan dan saran dari analisis pengujian yang
dilakukan.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 7
BAB II
LANDASAN TEORI
Pada bab ini akan dijelaskan mengenai teori - teori yang menjadi landasan untuk mengembangkan penelitian beserta perangkatnya. Teori - teori yang akan dibahas antara lain musik traditional/lagu daerah, pengenalan pola, Audio Feature
Extraction, Mel-frequency Cepstral Coefficients (MFCC), Clustering, algoritma
K-Means Clustering dan aplikasi jAudio.
2.1. Musik Tradisional / Lagu Daerah
Musik tradisional adalah musik atau seni suara yang berasal dari
berbagai daerah, dalam hal ini di Indonesia. Musik tradisional adalah
musik yang lahir dan berkembang di suatu daerah tertentu dan diwariskan
secara turun temurun dari satu generasi ke generasi berikutnya. Musik ini
menggunakan bahasa, gaya, dan tradisi khas daerah setempat. Secara
umum, musik tradisional memiliki ciri khas sebagai berikut :
a) Dipelajari Secara Lisan
Sebagai bagian dari kebudayaan, musik daerah diwariskan secara
turun temurun. Proses pewarisan musik ini biasanya dilakukan secara
lisan. Generasi tua mengajarkan komposisi musik daerah kepada generasi
muda. Anak-anak itu akan meneruskannya pula kepada anak-anak mereka.
Demikian seterusnya, sehingga tradisi musik tersebut tetap dikenal oleh
masyarakat. Atau orang yang telah mahir memainkan instrumen musiknya
atau terampil menyanyikan lagu-lagu daerah akan memberikan contoh
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 8
kepada pengikutnya untuk kemudian ditirukan. Orang yang belajar harus
menghapalkannya tanpa ada catatan. Dengan terus berlatih, ia akan
menguasai semakin banyak lagu dan teknik.
b) Tidak Memiliki Notasi
Proses pembelajaran yang berlangsung secara lisan membuat
partitur (naskah musik) menjadi suatu hal yang tidak terlalu penting. Oleh
karena itu, sangat lazim jika musik tradisional daerah tidak memiliki
partitur notasi tertentu. Walau demikian, ada beberapa daerah yang
memiliki notasi musik seperti di Pulau Jawa dan Bali. Namun, notasi ini
tetap tidak memiliki partitur, tapi dipelajari secara lisan. Sebenarnya, hal
ini dikemudian hari dapat menimbulkan masalah. Jika orang-orang yang
belajar tentang kesenian itu semakin sedikit atau malah tidak ada, kesenian
tersebut bisa punah. Tanpa catatan tertulis, orang lain tidak bisa
melestarikannya.
c) Bersifat Informal
Musik Tradisional sangat lazim digunakan sebagai suatu bentuk
ekspresi masyarakat. Musik ini banyak digunakan dalam kegiatan rakyat
biasa sehingga bersifat lebih sederhana dan informal / santai. Hanya jika
digunakan di kalangan istana saja jenis musik ini menjadi lebih kompleks
dan formal / serius.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 9
d) Pemainnya Tidak Terspesialisasi
Sistem yang dikembangkan dalam proses belajar instrumen musik
daerah biasanya bersifat generalisasi. Pemain musik tradisional belajar
untuk dapat memainkan setiap instrumen yang ada dalam suatu jenis
musik daerah. Mereka akan belajar memainkan instrumen mulai dari yang
termudah sampai yang terumit. Jadi, pemain musik daerah yang sudah
mahir mempunyai kemampuan untuk memainkan semua instrumen musik
tersebut.
e) Syair Lagu Berbahasa Daerah
Selain syair yang menggunakan bahasa daerah, musik tradisional
juga menggunakan alunan melodi dan irama yang menunjukkan ciri khas
kedaerahan. Misalnya, syair lagu dari daerah Jawa . Alunan melodinya pun
menggunakan nada-nada dari tangga nada pelog dan slendro. Contoh
lainnya, syair lagu dari daerah Jakarta umumnya berbahasa Betawi dan
alunan melodinya tersusun atas tangga-tangga nada diatonis.
f) Lebih Melibatkan Alat Musik Daerah
Umumnya, permainan musik dalam lagu-lagu daerah di Indonesia
dibawakan dengan alat-alat musik khas dari daerah-daerah itu sendiri.
Contoh, lagu -lagu daerah Jawa umumnya diiringi oleh alat musik khas
Jawa, yaitu gamelan. Contoh lainnya, lagu-lagu daerah Sulawesi Utara
umumnya diiringi alat musik khas Sulawesi Utara, yaitu Kulintang.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 10
g) Merupakan Bagian dari Budaya Masyarakat
Musik tradisional merupakan salah satu bentuk kebudayaan yang
berkembang di dalam kehidupan masyarakat. Oleh karena itu, setiap ciri
kebudayaan masyarakat Sang Penciptanya pasti sudah melekat erat
didalamnya. Musik daerah merupakan salah satu bentuk gambaran
kebudayaan suatu daerah, selain tarian, pakaian, dan adat kebiasaan
lainnya. Melalui musik daerah, kita dapat mengenali daerah asal musik itu
dan ciri budaya masyarakatnya. Misalnya : ketika kita mendengarkan
permainan gamelan Jawa kita akan langsung mengetahui kalau itu adalah
musik daerah Jawa Tengah, bukan Sunda. Kita dapat mengenalinya lewat
karakter permainan gamelan terutama lewat suara, irama, dan lagunya.
Karakter inilah yang menggambarkan ciri khas adat Jawa. Salah satu
contohnya adalah irama musik gamelan Jawa yang umumnya terdengar
melantun halus dan lembut. Hal ini menunjukkan budaya orang Jawa yang
menekankan tutur kata yang halus, ramah, dan sopan.
Dari pengertian dan ciri-ciri musik tradisional tersebut, peneliti
dapat mengambil kesimpulan bahwa musik tradisi cenderung bersifat
eksklusif. Artinya, musik ini tidak dapat dinikmati secara luas oleh
masyarakat di luar kebudayaan yang melahirkan musik tersebut.
Komposisi, fungsi, nilai, dan karakteristik syair musik tradisi suatu
masyarakat sangatlah khas sehingga tidak mudah untuk dinikmati atau
diterima sebagai bagian dari kebudayaan masyarakat lain. Oleh karena itu,
musik tradisi cenderung kurang dapat berkembang sehingga musik ini
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 11
sering disebut sebagai musik tradisional. (Matius Ali, 2006 dan Hartaris
A.T., 2007)
2.2. Pengenalan Pola
Pengenalan pola bertujuan menentukan kelompok atau kategori
pola berdasarkan ciri-ciri yang dimiliki oleh pola tersebut. Dengan kata
lain, pengenalan pola membedakan suatu objek dengan objek yang lain.
Pengenalan pola sendiri merupakan cabang dari kecerdasan buatan
(Artificial Inteligence). Beberapa definisi tentang pengenalan pola, di
antaranya:
Suatu ilmu untuk mengklasifikasikan atau menggambarkan sesuatu
berdasarkan pengukuran kuantitatif fitur (ciri) atau sifat utama dari suatu
obyek. (Putra, Darma, 2010).
Penentuan suatu objek fisik atau kejadian ke dalam salah satu atau
beberapa kategori. (Duda dan Hart dalam Al Fatta, Hanif, 2009).
Berdasarkan definisi di atas, pengenalan pola dapat didefinisikan
sebagai cabang kecerdasan buatan yang menitikberatkan pada metode
pengklasifikasian objek ke dalam kelas-kelas tertentu untuk
menyelesaikan masalah tertentu.
Pengenalan pola merupakan cabang dari kecerdasan buatan yang
saat ini berkembang pesat untuk mendukung aspek keamanan suatu
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 12
sistem. Saat ini, aplikasi-aplikasi pengenalan pola juga sudah sangat
beragam, di antaranya:
a) Voice recognition yang menggunakan pengenalan suara sebagai kunci bagi
pengguna sistem.
b) Fingerprint identification yang menggunakan pengenalan sidik jari sebagai
kunci telah dipakai secara luas sebagai pengganti password atau pin untuk
mengakses sistem tertentu.
c) Face identification yang menggunakan pengenalan wajah sebagai kunci
bagi pengguna sistem, bahkan saat ini badan penegak hukum sedang
mengembangkan sistem untuk mengidenfikasi para buronan dengan
melakukan scanning pada wajah para pelaku kejahatan yang sudah di-
database-kan berdasarkan foto pelaku kejahatan tersebut.
d) Handwriting identification yang menggunakan pengenalan tulisan yang
telah secara luas digunakan oleh sistem perbankan untuk membuktikan
pelaku transaksi adalah orang yang benar-benar berhak.
e) Optical Character Recognition (OCR) yang secara luas digunakan pada
counter pengecekan barang.
f) Robot vision yang digunakan oleh aplikasi robotik dalam mengenali objek
tertentu pada lingkungan yang unik.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 13
2.3. Audio Feature Extraction
Ekstraksi fitur audio adalah proses otomatis penggalian informasi
tentang karakteristik file audio yang kemudian dapat digunakan untuk
tujuan seperti mengklasifikasikan dan menganalisis audio. Ekstraksi fitur
audio melibatkan sejumlah langkah, termasuk parsing dan berpotensi
dekompresi sampel audio dari file di mana mereka disimpan, pra
pengolahan sampel sehingga mereka secara tepat dipersiapkan untuk fitur
tertentu yang akan diekstraksi dan akhirnya, penggalian fitur sendiri, yang
dapat dihitung berdasarkan sampel dasar, fitur lain yang telah diekstraksi,
atau keduanya. Salah satu aplikasi untuk ekstraksi fitur audio adalah
jAudio (McEnnis, Daniel, Ichiro Fujinaga, Cory McKay, Philippe DePalle.
2005).
2.3.1. Aplikasi jAudio
jAudio adalah komponen jMIR dikhususkan untuk
penggalian fitur dari data audio dan melakukan semua langkah
diatas. Hal ini dirancang untuk digunakan secara langsung sebagai
audio ekstraksi fitur aplikasi perangkat lunak sederhana serta
platform iteratif untuk mengembangkan fitur baru yang kemudian
dapat dibagi di antara para peneliti. Ekstraktor fitur audio yang
meliputi implementasi dari 26 fitur inti, termasuk fitur yang terbukti
dalam penelitian MIR dan lebih eksperimental fitur bermakna
perseptual. jAudio menempatkan penekanan lebih besar pada
perpanjangan dari komponen jMIR lainnya, dan termasuk
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 14
implementasi metafeatures dan agregator yang dapat digunakan
untuk secara otomatis menghasilkan lebih banyak fitur dari fitur inti
(misalnya, standar deviasi, turunan, dan lain-lain). Sejumlah alat
untuk memfasilitasi pengembangan dan pengujian fitur baru juga
disertakan, seperti waktu dan frekuensi domain visualisasi alat;
fungsi perekaman audio; sintesis data uji; Audio konversi format
file; dan MIDI ke fungsi konversi audio. Parameter ekstraksi fitur
seperti ukuran jendela, tumpang tindih, downsampling dan
normalisasi juga dapat diatur oleh pengguna. (McEnnis, Daniel,
Ichiro Fujinaga, Cory McKay, Philippe DePalle. 2005).
2.3.2. Mel-frequency Cepstral Coefficients (MFCC)
Mel frekuensi koefisien cepstral fitur adalah spektral
berbasis jangka pendek yang digunakan oleh banyak peneliti untuk
pengenalan suara (W. Walker, P. Lamere, P. Kwok, B. Raj, E.
Gouvea, P. Wolf, and J. Woelfel, 2004), sistem pencarian (J. T.
Foote, 1997), musik summarization (B. Logan and S. Chu, 2000),
diskriminasi pidato / musik (B. Logan, 2000). Kekuatan MFCC
terletak pada kemampuannya untuk perwakilan kompak spektrum
amplitudo. Langkah-langkah untuk menghitung MFCC
sebagaimana diuraikan dalam (L. R. Rabiner and B. H. Juang,
1993) telah ditunjukkan pada gambar 2.1 dibawah ini.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 15
Gambar 2. 1 Diagram Blok Mel - Frekuensi Koefisien Cepstral
Sinyal audio pertama dibagi menjadi beberapa frame durasi
tetap. Frame dapat terdiri dari sampel yang tumpang tindih dengan
frame sebelumnya. Untuk meminimalkan diskontinuitas pada awal
dan akhir frame fungsi windowing (window Hamming adalah salah
satu yang paling banyak digunakan) yang juga diterapkan pada
frame. Spektrum amplitudo untuk masing-masing (windowed)
frame diperoleh dengan menerapkan Discrete Fourier Transform
(DFT). Sebagai hubungan antara kenyaringan yang dirasakan dan
spektrum amplitudo lebih logaritmik linear, logaritma dari
amplitudo diambil. Dengan demikian, spektrum dimensi N
diperoleh di mana N adalah ukuran frame. Spektrum ini dihaluskan
untuk membuatnya bermakna perseptual. Cara termudah untuk
melakukan hal ini untuk mempertimbangkan spektrum rata-rata
selama frekuensi bin. Tapi ditempatkan terpisah pada jarak yang
sama atas skala frekuensi tidak sesuai sistem pendengaran manusia
sebagai frekuensi dirasakan dan frekuensi sinyal tidak berhubungan
linier. Hal ini menyebabkan perkembangan frekuensi Mel. Relasi
dapat dinyatakan sebagai berikut.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 16
di mana, f dan fm adalah frekuensi sinyal dan frekuensi yang sesuai
Mel masing-masing. Pemetaan adalah sekitar linier bawah 1kHz
dan logaritma di atas. Dengan demikian, logaritma dari spektrum
amplitudo yang diperoleh setelah DFT dipetakan ke skala Mel-
frekuensi dan dihaluskan dengan mempertimbangkan sampah
selama Mel skala. Unsur-unsur di vektor Mel-spektrum yang
dihaluskan sangat berkorelasi. Untuk decorrelate dan untuk
mengurangi jumlah parameter DCT dilakukan untuk memperoleh
Mel frekuensi koefisien cepstral dan pertama 13 koefisien diambil
sebagai fitur untuk frame. Dengan demikian, koefisien c [n] dapat
direpresentasikan sebagai
di mana, 0 < n < L-1, X [k] menjadi Mel-spektrum yang dihaluskan
sinyal input x [n] dan L adalah jumlah elemen dalam vektor Mel-
spektrum yang dihaluskan.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 17
2.4. Clustering
Tujuan utama dari metode cluster adalah pengelompokan sejumlah
data/obyek ke dalam cluster (group) sehingga dalam setiap cluster akan
berisi data semirip mungkin (Santoso, 2007). Dalam clustering kita
berusaha untuk menempatkan obyek yang mirip satu sama lain dan sangat
berbeda dengan obyek dalam cluster - cluster yang lain. K-means
clustering adalah salah satu teknik unsupervised learning dimana tidak
memiliki 'label' untuk fase learning.
Clustering terbagi menjadi beberapa, yaitu (Zaiane, 1999) :
1. Partitioning Clustering
Partitioning clustering disebut juga exclusive clustering dimana
setiap data harus termasuk dalam cluster tertentu dan memungkinkan bagi
setiap data yang termasuk cluster tertentu pada suatu tahapan proses, pada
tahapan berikutnya berpindah ke cluster yang lain.
2. Hierarchical Clustering
Pada Hierarchical Clustering setiap data harus masuk ke dalam
cluster tertentu, namun suatu data yang masuk ke dalam cluster tertentu
pada suatu tahapan proses tidak dapat berpindah ke cluster lain pada
proses berikutnya.
Contoh : Single Linkage, Centroid Linkage, Complete Linkage, Average
Linkage
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 18
3. Overlapping Clustering
Overlapping Clustering mengijinkan setiap data masuk ke
beberapa cluster berbeda dan data mempunyai nilai keanggotaan pada
beberapa cluster.
Contoh : Fuzzy C-means, Gaussian Mixture
4. Hybrid
Hybrid merupakan kombinasi dari karakteristik partitioning,
overlapping dan hierarchical.
2.5. Algoritma K-Means
Ada dua jenis clustering yang sering digunakan dalam proses
pengelompokkan data, yaitu hierarchical data clustering dan non-
hierarchical data clustering. K-means clustering merupakan salah satu
metode data clustering non hirarki yang berusaha memisahkan data yang
ada ke dalam bentuk satu atau lebih cluster. Metode ini mempartisi data ke
dalam cluster sehingga data yang memiliki karakteristik yang berbeda
dikelompokkan ke dalam kelompok yang lain.
Tujuan dari data clustering ini adalah untuk meminimalisasi
objective function yang diatur dalam proses clustering, yang pada
umumnya berusaha meminimalisasikan variasi di dalam suatu cluster dan
memaksimalisasikan variasi antar cluster. Data clustering menggunakan
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 19
metode K-Means ini secara umum dilakukan dengan algoritma dasar
sebagai berikut.
1. Tentukan jumlah cluster.
2. Alokasikan data ke dalam cluster secara random.
3. Hitung centroid / rata- rata dari data yang ada di masing - masing cluster.
4. Alokasikan masing - masing data ke centroid / rata - rata terdekat.
5. Kembali ke langkah 3, apabila masih ada data yang berpindah cluster atau
apabila perubahan nilai centroid, ada yang di atas nilai threshold yang
ditentukan atau apabila perubahan nilai pada objective function yang
digunakan di atas nilai threshold yang ditentukan.
Gambar 2.2 merupakan diagram algoritma K-Means secara umum.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 20
START
Inisialisasi jumlah K
Tentukan centroid
Hitung jarak dengan centroid
Kelompokkan dengan centroid terdekat
Hitung centroid baru
F Centroid tetap?
T
FINISH
Gambar 2. 2 Diagram Algoritma K-Means
Ada beberapa kelebihan pada algoritma K-Means, yaitu (S. Russell
and P. Norvig, 2010) :
1. Mudah untuk diimplementasikan dan dijalankan.
2. Waktu yang dibutuhkan untuk menjalankan pembelajaran ini relatif cepat.
3. Mudah untuk diadaptasi.
4. Umum digunakan.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 21
Algoritma k-means memiliki beberapa kelebihan, namun ada
kekurangannya juga. Kekurangan dari algoritma tersebut yaitu :
1. Sebelum algoritma dijalankan, k buah titik diinisialisasi
secara random sehingga pengelompokkan data yang dihasilkan dapat
berbeda-beda (X. Wu and V. Kumar, eds., 2009). Jika nilai random untuk
inisialisasi kurang baik, maka pengelompokkan yang dihasilkan pun
menjadi kurang optimal.
2. Dapat terjebak dalam masalah yang disebut curse of dimensionality. Hal
ini dapat terjadi jika data pelatihan memiliki dimensi yang sangat tinggi
(Contoh jika data pelatihan terdiri dari 2 atribut maka dimensinya adalah 2
dimensi. Namun jika ada 20 atribut, maka akan ada 20 dimensi). Salah
satu cara kerja algoritma ini adalah mencari jarak terdekat antara k buah
titik dengan titik lainnya. Jika mencari jarak antar titik pada 2 dimensi,
masih mudah dilakukan. Namun bagaimana mencari jarak antar titik jika
terdapat 20 dimensi. Hal ini akan menjadi sulit.
3. Jika hanya terdapat beberapa titik sampel data, maka cukup mudah untuk
menghitung dan mencari titik terdekat dengan k titik yang diinisialisasi
secara random. Namun jika terdapat banyak sekali titik data (misalnya satu
milyar buah data), maka perhitungan dan pencarian titik terdekat akan
membutuhkan waktu yang lama. Proses tersebut dapat dipercepat, namun
dibutuhkan struktur data yang lebih rumit seperti kD-Tree atau hashing.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 22
BAB III
ANALISIS DAN PERANCANGAN PENELITIAN
Bab ini akan menjelaskan tentang rancangan penelitian yang akan dilakukan penulis. Penelitian ini berfungsi untuk menganalisa tingkat akurasi metode K-Means Clustering dalam mengelompokkan lagu daerah berdasarkan pulau asalnya di Indonesia.
3.1. Perancangan Penelitian Secara Umum
Penelitian ini digunakan untuk menganalisa tingkat akurasi metode
K-Means Clustering dalam mengelompokkan lagu daerah berdasarkan
pulau asalnya yang terdapat di Indonesia. Ekstraksi fitur lagu daerah
dilakukan dengan menggunakan aplikasi jAudio dan hasil dari ekstraksi
fitur yang berupa data numerik disimpan ke dalam database sebelum
diproses lagi. Data yang sudah disimpan di dalam database, kemudian
diproses dengan algoritma K-Means Clustering untuk mencari cluster
prediksi dari tiap - tiap lagu daerah tersebut. Setelah cluster prediksi tiap
lagu sudah didapatkan, kemudian hasil cluster prediksi tersebut
dicocokkan dengan actual cluster yang sesuai dengan pulau asal dari lagu
tersebut. Kemudian dihitung total bobot perbandingan antara cluster
prediksi dengan actual cluster. Dalam penelitian ini, pengujian dilakukan
berdasarkan precision tertinggi.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 23
Langkah - langkah penelitian secara umum dapat dilihat pada
gambar 3.1 dibawah ini.
Data lagu Data disimpan di Feature Extraction berekstensi .wav dalam database
Inisialisasi jumlah K
Tentukan centroid
Hitung jarak dengan centroid
Kelompokkan dengan centroid terdekat
Hitung centroid baru
F Centroid tetap?
T
Menghitung akurasi
Gambar 3. 1 Diagram Blok Penelitian Secara Umum
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 24
3.2. Data Preprocessing atau Pembuatan Data
Dalam penelitian ini, format lagu daerah yang digunakan adalah
MIDI yang berformat .wav dengan jumlah lagu daerah sebanyak 30 lagu
dari 3 pulau di Indonesia yaitu Sumatera, Jawa dan Maluku. Panjang data
maksimal 60s, sampling rate 44000Hz, 16 bits. Data diproses dengan
menggunakan algoritma MFCC (Mel - Frekuensi Cepstral Coefisien)
dengan menggunakan aplikasi jAudio. MFCC merupakan algoritma yang
banyak digunakan untuk speech processing dan music retrieval berbasis
timbral. Output dari aplikasi jAudio adalah merupakan data numerik
berformat .txt. jAudio memproses semua lagu daerah dengan
menggunakan algoritma MFCC dan menghasilkan 13 koefisien pada setiap
lagu daerah tersebut. Gambar 3.2 ini merupakan output dari jAudio.
Gambar 3. 2 Output jAudio
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 25
Setelah output dari jAudio didapatkan, kemudian data tersebut disimpan
dalam Microsoft Excel untuk disimpan lagi dalam database. Gambar 3.3
merupakan tabel database hasil preprocessing menggunakan jAudio.
Gambar 3. 3 Database Hasil jAudio
3.3. Proses Clustering
Pada tahap clustering akan menggunakan algoritma K-Means.
Setelah data di proses ekstraksi fitur, maka data yang siap diolah
dimasukan ke dalam database. Kemudian data tersebut dihitung
menggunakan algoritma K-Means untuk mendapatkan cluster dari setiap
lagu daerah. Gambar 3.4 di bawah menunjukkan proses dari clustering
menggunakan algoritma K-Means.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 26
Data siap diolah
Tentukan 3 centroid awal
Hitung jarak semua data dengan centroid
Kelompokkan data dengan centroid terdekat
Hitung centroid baru
F Centroid tetap?
T
Cluster Final
Gambar 3. 4 Diagram Blok Proses Clustering dengan Algoritma K-Means
3.4. Proses Pengujian
Dalam penelitian ini, pengujian akurasi dilakukan berdasarkan nilai
precision tertinggi dari perbandingan cluster prediksi dengan actual
cluster. Precision adalah jumlah kelompok dokumen relevan dari total
jumlah dokumen yang ditemukan oleh sistem (Hardi, 2006: 22). Precision
juga merupakan cara mengukur tingkat efektivitas sistem information
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 27
retrieval. Pengukuran tingkat ketepatan (precision) dalam kegiatan
penelusuran menurut Hasugian (2006: 5):
Jumlah dokumen relevan yang terambil Precision = Jumlah dokumen yang terambil dalam pencarian
Langkah - langkah dalam pengujian akurasi adalah sebagai berikut
1. Bandingkan cluster prediksi dengan actual cluster semua lagu daerah.
2. Hitung bobot dari semua perbandingan cluster prediksi dengan actual
cluster.
3. Hitung nilai precision setiap perbandingan cluster berdasarkan bobot
dari perbandingan cluster prediksi dengan actual cluster.
4. Pilih cluster berdasarkan nilai precision yang tertinggi.
5. Hitung bobot cluster yang dipilih berdasarkan nilai precision
tertinggi.
6. Hitung akurasi berdasarkan jumlah bobot cluster.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 28
3.5. Spesifikasi Hardware dan Software
Berikut adalah spesifikasi hardware dan software yang digunakan
dalam penelitian ini.
3.5.1. Hardware
1. Processor : Intel(R) Core(TM) i7-2630QM CPU @ 2.00 GHz
2. Memory (RAM) : 8.00 GB
3. System type : 64-bit Operating System
3.5.2. Software
1. Windows 7 Home Premium
2. jAudio (McEnnis, Daniel, Ichiro Fujinaga, Cory McKay,
Philippe DePalle. 2005)
3. Netbeans IDE 8.0.1
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 29
BAB IV
ANALISIS DAN IMPLEMENTASI PENELITIAN
Pada bab ini akan dijelaskan tentang implementasi penelitian.
4.1. Implementasi menentukan centroid awal
Pada langkah menentukan centroid awal, centroid diambil
berdasarkan id dari lagu daerah. Setelah id dari lagu daerah dipilih, maka
data fitur diambil berdasarkan id dari lagu daerah tersebut. Berikut ini
merupakan list code untuk menentukan centroid awal.
void setCentroidAwal(int[] idCentroid) { //method yang
digunakan untuk menentukan centroid awal berdasarkan id
centroid
centroid = new double[idCentroid.length][fitur.size()];
for (int i = 0; i < idCentroid.length; i++) {
for (int j = 0; j < fitur.size(); j++) {
centroid[i][j] = ((Double[])
fitur.get(j))[idCentroid[i]];
}
}
cluster = new int[((Double[]) fitur.get(0)).length];
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 30
System.out.println("");
}
Gambar 4. 1 Menentukan Centroid Awal
4.2. Implementasi clustering dengan metode K-Means
Program akan memproses algoritma K-Means dengan metode
proses. Data yang akan diolah dalam metode proses diambil dari database.
Berikut ini merupakan list code algortma K-Means.
void proses() throws SQLException {
int[] clusterLama = new int[((Double[])
fitur.get(0)).length];
int iterasi = 0;
List
DatabaseControl.getDatabaseControl().getJudulMusik();
String[] judul = judul_musik.toArray(new
String[judul_musik.size()]);
do {
iterasi++;
System.out.println("Iterasi ke - " + iterasi);
System.out.println("");
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 31
for (int i = 0; i < centroid.length; i++) {
for (int j = 0; j < centroid[i].length; j++) {
System.out.print(centroid[i][j] + " ");
}
System.out.println("");
}
System.out.println("");
System.arraycopy(cluster, 0, clusterLama, 0,
clusterLama.length);
for (int i = 0; i < ((Double[]) fitur.get(0)).length;
i++) {
double[] distance = new double[centroid.length];
for (int j = 0; j < distance.length; j++) {
distance[j] = 0.0;
for (int k = 0; k < fitur.size(); k++) {
distance[j] +=
Math.pow(((Double[])fitur.get(k))[i] - centroid[j][k],
2);//euclidian distance
//distance[j] += Math.abs(((Double[])
fitur.get(k))[i] - centroid[j][k]);//manhattan
}
distance[j] = Math.sqrt(distance[j]);
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 32
System.out.print(distance[j]+" ");
}
System.out.println("");
int indexMin = 0;
for (int j = 1; j < distance.length; j++) {
if (distance[j] < distance[indexMin]) {
indexMin = j;
}
}
cluster[i] = indexMin + 1;
}
System.out.println("");
System.out.println("CLUSTER");
System.out.println("------
------");
for (int i = 0; i < centroid.length; i++) {
int jumData = 0;
double[] newCentroid = new double[fitur.size()];
for (int j = 0; j < ((Double[]) fitur.get(0)).length;
j++) {
if (cluster[j] == i + 1) {
jumData++;
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 33
for (int k = 0; k < newCentroid.length; k++)
{
newCentroid[k] += ((Double[])
fitur.get(k))[j];
}
}
}
for (int j = 0; j < newCentroid.length; j++) {
newCentroid[j] = newCentroid[j] / jumData;
}
centroid[i] = newCentroid;
}
for (int i = 0; i < cluster.length; i++) {
System.out.println(judul[i] +" = "+ cluster[i]);
}
System.out.println("");
} while (!checkCluster(clusterLama));
}
boolean checkCluster(int[] clusterLama) {
boolean sama = true;
for (int i = 0; i < clusterLama.length; i++) {
if (cluster[i] != clusterLama[i]) {
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 34
sama = false;
break;
}
}
return sama;
}
public int[] getCluster() {
return cluster;
}
}
Gambar 4. 2 Clustering dengan K-Means
4.3. Implementasi pengujian akurasi berdasarkan nilai precision tertinggi.
Langkah terakhir dalam penelitian ini adalah pengujian akurasi.
Pengujian akurasi dalam penelitian ini menggunakan nilai precision
tertinggi dari perbandingan predicted cluster dengan actual cluster.
Berikut ini merupakan list code untuk pengujian akurasi berdasarkan nilai
precision tertinggi.
public void Uji_Precision(int[] pred, int[] act, int centroid) {
int[][] precision = new int[centroid][centroid];
int[] totBaris = new int[centroid];
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 35
for (int i = 0; i < pred.length; i++) {
precision[pred[i] - 1][act[i] - 1]++;
totBaris[pred[i] - 1]++;
}
float[][] prec = new float[centroid][centroid];
for (int i = 0; i < prec.length; i++) {
float[] persen1 = prec[i];
for (int j = 0; j < persen1.length; j++) {
prec[i][j] = ((float) precision[i][j]) / totBaris[i];
}
}
System.out.println("Precision Setiap Perbandingan
Cluster");
for (int i = 0; i < precision.length; i++) {
int[] cm1 = precision[i];
for (int j = 0; j < cm1.length; j++) {
int d = cm1[j];
// System.out.print(d+" ");
System.out.print(prec[i][j] + " ");
}
// System.out.println(totBaris[i]);
System.out.println(" ");
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 36
}
ArrayList
ArrayList
for (int i = 0; i < centroid; i++) {
int indexMax1 = 0;
int indexMax2 = 0;
float max = -1;
for (int j = 0; j < centroid; j++) {
if (arr1.contains(j)) {
continue;
}
for (int k = 0; k < centroid; k++) {
if (arr2.contains(k)) {
continue;
}
if (prec[j][k] > max) {
indexMax1 = j;
indexMax2 = k;
max = prec[j][k];
}
}
}
arr1.add(indexMax1);
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 37
arr2.add(indexMax2);
}
int jumBenar = 0;
float akurasi = 0;
System.out.println(" ");
System.out.println("Cluster yang diambil berdasarkan
precision tertinggi");
for (int i = 0; i < arr1.size(); i++) {
System.out.println((arr1.get(i) + 1) + " -> " +
(arr2.get(i) + 1 + " "));
jumBenar += precision[arr1.get(i)][arr2.get(i)];
}
int tot = 0;
for (int i = 0; i < totBaris.length; i++) {
tot += totBaris[i];
}
System.out.println("");
System.out.println("Jumlah Benar = " + jumBenar);
System.out.println("Akurasi = " + ((float)
jumBenar) / tot * 100 + "%");
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 38
}
Gambar 4. 3 Pengujian Akurasi
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 39
BAB V
HASIL DAN PEMBAHASAN
Hal yang utama dalam pembahasan bab ini adalah analisa hasil tingkat akurasi dari pengujian algoritma k-means clustering dalam mengelompokkan lagu daerah berdasarkan pulau asalnya. Pengujian tingkat akurasi dilakukan dengan melibatkan centroid yang dipilih, banyaknya iterasi, nilai precision tertinggi dan bobot cluster yang diambil berdasarkan nilai precision tertinggi.
5.1. Hasil Pengukuran
Hasil pengukuran didapatkan dengan mencocokan hasil cluster
prediksi yang dilakukan oleh sistem dengan actual cluster yang telah
ditetapkan oleh penguji berdasarkan manual book dengan cara inisialisasi.
Inisialisasi dilakukan untuk mempermudah peneliti dalam
membandingkan cluster prediksi dengan actual cluster. Dibawah ini
merupakan tabel inisialisasi cluster tiap pulau.
Tabel 5. 1 Inisialisasi Cluster Tiap Pulau
Pulau Inisialisasi Cluster Sumatra 1 Jawa 2 Maluku 3
Pada pengujian yang dilakukan, jumlah data lagu daerah terdapat 30 lagu
dari 3 pulau. Setiap pulau diwakili oleh 10 lagu daerah. Dibawah ini
merupakan tabel lagu daerah yang digunakan dalam penelitian ini
beserta inisialisasi pulau.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 40
Tabel 5. 2 Lagu Daerah dengan Actual Cluster 1
JUDUL Actual Bungong Jeumpa.wav 1 Dodoi Si Dodoi.wav 1 Gelang Sipaku Gelang.wav 1 Kampuang Nan Jauh Dimato.wav 1
Lancang Kuning.wav 1 Lisoi.wav 1 Na Sonang Do Hita Nadua.wav 1 Opio.wav 1 Sinanggar Tulo.wav 1 Soleram.wav 1
Tabel 5. 3 Lagu Daerah dengan Actual Cluster 2
JUDUL Actual Bubuy Bulan.wav 2 Cublak - Cublak Suweng.wav 2 Es Lilin.wav 2 Gambang Suling.wav 2 Gundul - Gundul Pacul.wav 2 Jaranan.wav 2 Peuyeum Bandung.wav 2 Suwe Ora Jamu.wav 2 Tokecang.wav 2 Warung Pojok.wav 2
Tabel 5. 4 Lagu Daerah dengan Actual Cluster 3
JUDUL Actual Ayo Mama.wav 3 Buka Pintu.wav 3 Burung Kakak Tua.wav 3 Burung Tantina.wav 3 Hela Rotan.wav 3 Naik - Naik Ke Puncak Gunung.wav 3 Nona Manis Siapa Yang Punya.wav 3 Rasa Sayange.wav 3 Sari Nande.wav 3 Waktu Hujan Sore - Sore.wav 3
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 41
5.2. Skenario Pengujian
Di bawah ini merupakan langkah - langkah pengujian
menggunakan centroid awal lagu Bungong Jeumpa, Gundul – Gundul
Pacul dan Waktu Hujan Sore - Sore :
1. Bandingkan predicted cluster dengan actual cluster semua lagu daerah.
Tabel dibawah merupakan tabel perbandingan antara predicted cluster
dengan actual cluster dari semua lagu daerah.
Tabel 5. 5 Perbandingan Cluster
JUDUL Predicted Actual Ayo Mama.wav 3 3 Bubuy Bulan.wav 2 2 Buka Pintu.wav 1 3 Bungong Jeumpa.wav 1 1 Burung Kakak Tua.wav 1 3 Burung Tantina.wav 3 3 Cublak - Cublak Suweng.wav 3 2 Dodoi Si Dodoi.wav 1 1 Es Lilin.wav 2 2 Gambang Suling.wav 1 2 Gelang Sipaku Gelang.wav 3 1 Gundul - Gundul Pacul.wav 2 2 Hela Rotan.wav 3 3 Jaranan.wav 2 2 Kampuang Nan Jauh Dimato.wav 1 1 Lancang Kuning.wav 2 1 Lisoi.wav 3 1 Na Sonang Do Hita Nadua.wav 1 1 Naik - Naik Ke Puncak Gunung.wav 1 3 Nona Manis Siapa Yang Punya.wav 3 3 Opio.wav 1 1 Peuyeum Bandung.wav 3 2 Rasa Sayange.wav 1 3 Sari Nande.wav 3 3
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 42
Sinanggar Tulo.wav 2 1 Soleram.wav 1 1 Suwe Ora Jamu.wav 1 2 Tokecang.wav 3 2 Waktu Hujan Sore - Sore.wav 3 3 Warung Pojok.wav 1 2
Dalam tabel perbandingan diatas, lagu Ayo Mama.wav diprediksi oleh
algoritma K-Means masuk ke dalam cluster 3 dan menurut sumbernya
(actual cluster) lagu tersebut masuk ke dalam cluster 3. Lagu Buka
Pintu.wav diprediksi oleh algoritma K-Means masuk ke dalam cluster 1,
sedangkan menurut sumbernya (actual cluster) lagu tersebut masuk ke
dalam cluster 3.
2. Hitung bobot dari semua perbandingan predicted cluster dengan actual
cluster. Tabel dibawah ini merupakan tabel pembobotan dari hasil
perbandingan cluster.
Tabel 5. 6 Bobot Perbandingan Predicted Cluster dengan Actual Cluster
Cluster Bobot Actual Predicted 1 1 6 2 1 3 3 1 4
Cluster Bobot Actual Predicted 1 2 2 2 2 4 3 2 0
Cluster Bobot Actual Predicted
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 43
1 3 2 2 3 3 3 3 6
Dari tabel pembobotan diatas, actual cluster 1 yang diprediksi oleh
algoritma K-Means sebagai cluster 1 berbobot 6. Actual cluster 2 yang
diprediksi oleh algoritma K-Means sebagai cluster 1 berbobot 3.
Actual cluster 3 yang diprediksi oleh algoritma K-Means
3. Hitung nilai precision setiap perbandingan cluster berdasarkan bobot
dari perbandingan predicted cluster dengan actual cluster. Tabel di
bawah merupakan tabel nilai precision.
Tabel 5. 7 Precision Perbandingan Predicted Cluster dengan Actual Cluster
Cluster Bobot Precision Actual Predicted 1 1 6 0.4615 2 1 3 0.2308 3 1 4 0.3077
Cluster Bobot Precision Actual Predicted 1 2 2 0.3333 2 2 4 0.6667 3 2 0 0
Cluster Bobot Precision Actual Predicted 1 3 2 0.1818 2 3 3 0.2727 3 3 6 0.5455
Pada tabel diatas nilai precision dihitung dengan menggunakan
persamaan:
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 44
Bobot tiap cluster Precision = Jumlah total bobot cluster
Actual cluster 1 yang diprediksi oleh algoritma K-Means sebagai
cluster 1 berbobot 6 dengan nilai precision 0.4615.
Actual cluster 2 yang diprediksi oleh algoritma K-Means sebagai
cluster 1 berbobot 3 dengan nilai precision 0.2308.
Actual cluster 3 yang diprediksi oleh algoritma K-Means sebagai
cluster 1 berbobot 4 dengan nilai precision 0.3077.
Actual cluster 1 yang diprediksi oleh algoritma K-Means sebagai
cluster 2 berbobot 2 dengan nilai precision 0.3333.
Actual cluster 2 yang diprediksi oleh algoritma K-Means sebagai
cluster 2 berbobot 4 dengan nilai precision 0.6667.
Actual cluster 3 yang diprediksi oleh algoritma K-Means sebagai
cluster 2 berbobot 0 dengan nilai precision 0.
Actual cluster 1 yang diprediksi oleh algoritma K-Means sebagai
cluster 3 berbobot 2 dengan nilai precision 0.1818.
Actual cluster 2 yang diprediksi oleh algoritma K-Means sebagai
cluster 3 berbobot 3 dengan nilai precision 0.2727.
Actual cluster 3 yang diprediksi oleh algoritma K-Means sebagai
cluster 3 berbobot 6 dengan nilai precision 0.5455.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 45
4. Pilih cluster berdasarkan nilai precision yang tertinggi.
Tabel 5. 8 Precision Tertinggi Perbandingan Predicted dengan Actual Cluster
Cluster Bobot Precision Actual Predicted 2 2 4 0.6667 3 3 6 0.5455 1 1 6 0.4615
Berdasarkan tabel diatas cluster dengan precision tertinggi
yang pertama terdapat pada actual cluster 2 dan predicted cluster 2
dengan bobot 4 dan precision 0.6667. Cluster dengan precision
tertinggi yang kedua terdapat pada actual cluster 3 dan predicted
cluster 3 dengan bobot 6 dan precision 0.5455. Dan cluster dengan
precision tertinggi yang terakhir terdapat pada actual cluster 1 dan
predicted cluster 1 dengan bobot 6 dan precision 0.4615.
5. Hitung total bobot cluster yang dipilih berdasarkan nilai precision
tertinggi. Total bobot cluster merupakan jumlah dari ketiga bobot yang
diambil berdasarkan precision tertinggi. Total bobot cluster dapat
dilihat pada tabel 5.9.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 46
Tabel 5. 9 Total Bobot Perbandingan Predicted Cluster dengan Actual Cluster berdasarkan Precision Tertinggi
Cluster Precision Bobot Actual Predicted 2 2 0.6667 4 3 3 0.5455 6 1 1 0.4615 6 Total Bobot Cluster 16
6. Hitung akurasi berdasarkan jumlah bobot cluster. Akurasi didapatkan
dengan rumus :
Total Bobot Akurasi = x 100 % Total Data
Jadi, pada percobaan pertama ini akurasi yang didapatkan adalah
53.33%. Dengan perhitungannya sebagai berikut
16 Akurasi = x 100 % 30
Hasil dapat dilihat pada tabel 5.10 dibawah ini.
Tabel 5. 10 Akurasi berdasarkan Precision Tertinggi
Cluster Precision Bobot Actual Predicted 2 2 0.6667 4 3 3 0.5455 6 1 1 0.4615 6 Total Bobot Cluster 16 Akurasi 53.33333
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 47
5.3. Analisa Hasil
Berdasarkan pengujian yang telah dilakukan sebanyak 30 kali,
tingkat akurasi dari berbagai centroid awal menghasilkan tingkat akurasi
terendah yaitu 46.67% dan akurasi tertinggi adalah 53.33%. Hasil
pengujian akurasi dapat dilihat pada tabel 5.11 dibawah ini.
Tabel 5. 11 Hasil Pengujian Akurasi
Tingkat Pengujian Centroid Awal Akurasi Bungong Jeumpa 1 Gundul - Gundul Pacul 53.33% Waktu Hujan Sore - Sore Bungong Jeumpa 2 Cublak - Cublak Suweng 53.33% Naik - Naik Ke Puncak Gunung Burung Kakak Tua 3 Gundul - Gundul Pacul 46.67% Soleram Kampuang Nan Jauh Dimato 4 Bubuy Bulan 46.67% Ayo Mama Dodoi Si Dodoi 5 Gambang Suling 46.67% Naik - Naik Ke Puncak Gunung Bungong Jeumpa 6 Bubuy Bulan 53.33% Ayo Mama Bungong Jeumpa 7 Cublak - Cublak Suweng 53.33% Buka Pintu Bungong Jeumpa 8 Es Lilin 46.67% Burung Kakak Tua Bungong Jeumpa 9 Gambang Suling 53.33% Burung Tantina Bungong Jeumpa 10 53.33% Gundul - Gundul Pacul
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 48
Hela Rotan Bungong Jeumpa 11 Jaranan 46.67% Naik - Naik Ke Puncak Gunung Bungong Jeumpa 12 Peuyeum Bandung 53.33% Nona Manis Siapa Yang Punya Bungong Jeumpa 13 Suwe Ora Jamu 53.33% Rasa Sayange Bungong Jeumpa 14 Tokecang 53.33% Sari Nande Bungong Jeumpa 15 Warung Pojok 53.33% Waktu Hujan Sore - Sore Dodoi Si Dodoi 16 Bubuy Bulan 46.67% Ayo Mama Dodoi Si Dodoi 17 Cublak - Cublak suweng 53.33% Buka Pintu Gelang Sipaku Gilang 18 Es Lilin 53.33% Burung Kakak Tua Gelang Sipaku Gilang 19 Gambang Suling 53.33% Burung Tantina Kampuang Nan Jauh Dimato 20 Gundul - Gundul Pacul 53.33% Hela Rotan Kampuang Nan Jauh Dimato 21 Jaranan 46.67% Naik - Naik Ke Puncak Gunung Lancang Kuning 22 Peuyeum Bandung 46.67% Nona Manis Siapa Yang Punya Lancang Kuning 23 Suwe Ora Jamu 46.67% Rasa Sayange Lisoi 24 Tokecang 53.33% Sari Nande
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 49
Lisoi 25 Warung Pojok 53.33% Waktu Hujan Sore - Sore Na Sonang Do Hita Nadua 26 Bubuy Bulan 46.67% Ayo Mama Na Sonang Do Hita Nadua 27 Cublak - Cublak Suweng 53.33% Buka Pintu Opio 28 Es lilin 46.67% Burung Kakak Tua Opio 29 Gambang Suling 46.67% Burung Tantina Sinagar Tulo 30 Gundul - Gundul Pacul 46.67% Hela Rotan
Dari tabel 5.11 diatas menghasilkan akurasi rata - rata, yaitu
sebesar 50.44%.
5.3.1. Kesalahan Pengelompokkan Lagu Daerah
Dalam penelitian ini, pengelompokkan lagu daerah menjadi
hal yang diutamakan. Kesesuaian lagu daerah berdasarkan pulau
asal diteliti dengan menggunakan metode K-Means. Dengan kata
lain, akan ada beberapa lagu daerah yang masuk ke dalam cluster
yang sesuai atau bahkan tidak sesuai.
Dalam 30 pengujian terdapat lagu daerah dengan tingkat
akurasi kebenaran yang sangat rendah. Hal ini dibuktikan dalam
tabel 5.12
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 50
Tabel 5. 12 Tabel Persentase Lagu
Jumlah Persentase JUDUL Benar Salah Benar Salah Ayo Mama 19 11 63% 37% Bubuy Bulan 21 9 70% 30% Buka Pintu 9 21 30% 70% Bungong Jeumpa 14 16 47% 53% Burung Kakak Tua 9 21 30% 70% Burung Tantina 19 11 63% 37% Cublak - Cublak Suweng 4 26 13% 87% Dodoi Si Dodoi 16 14 53% 47% Es Lilin 14 16 47% 53% Gambang Suling 5 25 17% 83% Gelang Sipaku Gelang 7 23 23% 77% Gundul - Gundul Pacul 14 16 47% 53% Hela Rotan 19 11 63% 37% Jaranan 14 16 47% 53% Kampuang Nan Jauh Dimato 16 14 53% 47% Lancang Kuning 7 23 23% 77% Lisoi 7 23 23% 77% Na Sonang Do Hita Nadua 16 14 53% 47% Naik - Naik Ke Puncak Gunung 9 21 30% 70% Nona Manis Siapa Yang Punya 19 11 63% 37% Opio 16 14 53% 47% Peuyeum Bandung 4 26 13% 87% Rasa Sayange 9 21 30% 70% Sari Nande 19 11 63% 37% Sinanggar Tulo 7 23 23% 77% Soleram 16 14 53% 47% Suwe Ora Jamu 5 25 17% 83% Tokecang 4 26 13% 87% Waktu Hujan Sore - Sore 19 11 63% 37% Warung Pojok 5 25 17% 83%
Berdasarkan tabel 5.12 maka dihasilkan tabel lagu daerah
dengan tingkat persentase kesalahan, yaitu tabel 5.13 dibawah ini.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 51
Tabel 5. 13 Tabel Persentase Kesalahan
Persentase JUDUL Kesalahan Cublak - Cublak Suweng 87% Peuyeum Bandung 87% Tokecang 87% Gambang Suling 83% Suwe Ora Jamu 83% Warung Pojok 83% Gelang Sipaku Gelang 77% Lancang Kuning 77% Lisoi 77% Sinanggar Tulo 77% Buka Pintu 70% Burung Kakak Tua 70% Naik - Naik Ke Puncak Gunung 70% Rasa Sayange 70% Bungong Jeumpa 53% Es Lilin 53% Gundul - Gundul Pacul 53% Jaranan 53% Dodoi Si Dodoi 47% Kampuang Nan Jauh Dimato 47% Na Sonang Do Hita Nadua 47% Opio 47% Soleram 47% Ayo Mama 37% Burung Tantina 37% Hela Rotan 37% Nona Manis Siapa Yang Punya 37% Sari Nande 37% Waktu Hujan Sore - Sore 37% Bubuy Bulan 30%
Pada tabel 5.13 lagu daerah Pulau Jawa yaitu Cublak –
Cublek Suweng termasuk dalam lagu daerah dengan tingkat
persentase kesalahan paling tinggi. Dalam 30 percobaan, lagu
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 52
Cublak – Cublak Suweng 26 kali tidak sesuai dengan cluster yang
seharusnya, dengan persentase kesalahan mencapai 87%.
5.3.2. Penentuan Centroid Awal
Dalam algoritma K-Means pengambilan centroid awal
sangat berpengaruh dalam pengelompokkan lagu - lagu daerah.
Dalam penelitian ini, pengambilan centroid awal dilakukan secara
random. Kelemahan dari metode penentuan centroid awal secara
random adalah hasil yang dapat berubah - ubah dan sulit untuk
mencapai global optimum. Berdasarkan tabel 5.11 salah satu
pengaruh tinggi rendahnya tingkat akurasi adalah pengambilan
centroid awal. Tabel 5.14 dibawah ini merupakan tabel tingkat
akurasi tiap pulau.
Tabel 5. 14 Akurasi Tiap Pulau
Tingkat Akurasi Pengujian Centroid Awal Sumatera Jawa Maluku Bungong Jeumpa 1 Gundul - Gundul Pacul 46.15% 66.66% 54.55% Waktu Hujan Sore - Sore Bungong Jeumpa 2 Cublak - Cublak Suweng 46.15% 27.27% 0.00% Naik - Naik Ke Puncak Gunung Burung Kakak Tua 3 Gundul - Gundul Pacul 37.50% 33.33% 54.54% Soleram Kampuang Nan Jauh Dimato 4 Bubuy Bulan 37.50% 33.33% 54.54% Ayo Mama Dodoi Si Dodoi 5 33.33% 33.33% 50.00% Gambang Suling
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 53
Naik - Naik Ke Puncak Gunung Bungong Jeumpa 6 Bubuy Bulan 46.15% 66.66% 54.54% Ayo Mama Bungong Jeumpa 7 Cublak - Cublak Suweng 46.15% 27.27% 0.00% Buka Pintu Bungong Jeumpa 8 Es Lilin 18.18% 33.33% 25.00% Burung Kakak Tua Bungong Jeumpa 9 Gambang Suling 46.15% 66.66% 54.54% Burung Tantina Bungong Jeumpa 10 Gundul - Gundul Pacul 46.15% 66.66% 54.54% Hela Rotan Bungong Jeumpa 11 Jaranan 18.18% 33.33% 25.00% Naik - Naik Ke Puncak Gunung Bungong Jeumpa 12 Peuyeum Bandung 33.33% 23.07% 54.54% Nona Manis Siapa Yang Punya Bungong Jeumpa 13 Suwe Ora Jamu 18.18% 66.66% 30.76% Rasa Sayange Bungong Jeumpa 14 Tokecang 33.33% 23.07% 54.54% Sari Nande Bungong Jeumpa 15 Warung Pojok 46.15% 66.66% 54.54% Waktu Hujan Sore - Sore Dodoi Si Dodoi 16 Bubuy Bulan 37.50% 33.33% 54.54% Ayo Mama Dodoi Si Dodoi 17 Cublak - Cublak suweng 33.33% 27.27% 30.76% Buka Pintu Gelang Sipaku Gilang 18 Es Lilin 18.18% 66.66% 30.76% Burung Kakak Tua
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 54
Gelang Sipaku Gilang 19 Gambang Suling 46.15% 66.66% 54.54% Burung Tantina Kampuang Nan Jauh Dimato 20 Gundul - Gundul Pacul 46.15% 66.66% 54.54% Hela Rotan Kampuang Nan Jauh Dimato 21 Jaranan 18.18% 33.33% 25.00% Naik - Naik Ke Puncak Gunung Lancang Kuning 22 Peuyeum Bandung 66.66% 37.50% 54.54% Nona Manis Siapa Yang Punya Lancang Kuning 23 Suwe Ora Jamu 66.66% 40.00% 50.00% Rasa Sayange Lisoi 24 Tokecang 18.18% 66.66% 30.76% Sari Nande Lisoi 25 Warung Pojok 18.18% 66.66% 30.76% Waktu Hujan Sore - Sore Na Sonang Do Hita Nadua 26 Bubuy Bulan 37.50% 33.33% 54.54% Ayo Mama Na Sonang Do Hita Nadua 27 Cublak - Cublak Suweng 33.33% 27.27% 30.76% Buka Pintu Opio 28 Es lilin 33.33% 33.33% 50.00% Burung Kakak Tua Opio 29 Gambang Suling 37.50% 33.33% 54.54% Burung Tantina Sinagar Tulo 30 Gundul - Gundul Pacul 66.66% 40.00% 50.00% Hela Rotan
Rata - Rata 37.67% 44.64% 42.59%
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 55
Berdasarkan Tabel 5.12 centroid awal yang digunakan sangat
berpengaruh terhadap tingkat akurasi. Pada percobaan 1, lagu Gundul –
Gundul Pacul merupakan centroid awal yang akurasinya tinggi, yaitu
66.66% dibandingkan 2 centroid lainnya. Pada percobaan 3, lagu Gundul –
Gundul Pacul merupakan centroid awal yang akurasi paling rendah, yaitu
33.33% dibandingkan 2 centroid lainnya. Dari 30 percobaan diatas, kita
biasa mengetahui bahwa pengambilan centroid awal sangat berpengaruh
terhadap akurasi, dan tidak ada jaminan bahwa hasil yang diperoleh akan
selalu optimal.
Berdasarkan dari data tersebut, maka penelitian ini menghasilkan
tingkat akurasi rata – rata tiap pulau :
1. Pulau Sumatera akurasi rata – ratanya adalah 37.67%.
2. Pulau Jawa akurasi rata – ratanya adalah 44.64%.
3. Pulau Maluku akurasi rata – ratanya adalah 42.59%.
5.3.3. Karakteristik Lagu dan MFCC
Dalam MFCC, terdapat beberapa hal yang perlu diperhatikan,
antara lain adalah: kunci yang digunakan beserta perpindahannya dan
tempo lagu (Tom LH. Li and Antoni B. Chan, 2011). Kedua hal tersebut
sangat berpengaruh terhadap hasil akurasi. Apabila hal tersebut tidak
diperhatikan, maka kita akan kehilangan beberapa informasi dari sumber
data tersebut.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 56
Fitur yang dihasilkan oleh MFCC adalah fitur yang berbasis
timbral, dengan kata lain untuk membedakan lagu daerah tersebut adalah
berdasarkan instrumennya atau alat musik yang digunakan (Tom LH. Li
and Antoni B. Chan, 2011). Instrumen yang digunakan dalam membuat
lagu daerah tiap daerah berbeda – beda. Berikut ini adalah instrumen yang
paling banyak digunakan dalam pembuatan lagu daerah :
1. Lagu daerah yang berasal dari pulau Sumatera sebagian besar
menggunakan instrumen biola, rebana, seruling dan gendang.
2. Lagu daerah yang berasal dari pulau Jawa sebagian besar
menggunakan instrumen berbagai macam jenis gamelan.
3. Lagu daerah yang berasal dari pulau Maluku sebagian besar
menggunakan instrumen berbagai macam jenis tifa dan gong.
Dalam penelitian ini, instrumen lagu daerah banyak tidak
menggunakan alat musik tradisional sehingga karakter lagu daerah kurang
akurat. Selain itu, lagu daerah yang digunakan rata – rata menggunakan
kunci dan perpindahan kunci yang hampir sama pada semua lagu daerah.
Rata- rata tempo yang digunakan pada setiap lagu daerah dalam penelitian
ini juga hampir sama dan seharusnya tempo lagu daerah dari tiap pulau
sangatlah berbeda. Hal tersebut menyebabkan MFCC kesulitan untuk
mencari karakter lagu daerah yang sesuai dengan pulau asalnya.
Untuk membuktikan bahwa perpindahan kunci, tempo dan
instrumen yang digunakan sangat penting, peneliti juga melakukan
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 57
percobaan dengan menggunakan program yang sama untuk
pengelompokkan lagu berdasarkan genre dengan inisialisasi genre lagu
seperti pada tabel 5.15 berikut ini.
Tabel 5. 15 Tabel Inisialisasi Genre Lagu
Genre Inisialisasi Lagu Cluster Pop 1 Rock 2 Dangdut 3
Contoh lagu dan genre yang digunakan dalam percobaan, terdapat
pada tabel 5.16 dibawah ini.
Tabel 5. 16 Tabel Judul dan Genre Lagu
Genre Judul Lagu Lagu Sewindu Pop Gajah Pop Teman Hidup Pop Almost Easy Rock Critical Acclaim Rock Bat Country Rock Bahtera Cinta Dangdut Judi Dangdut Puing - Puing Dangdut
Genre pop memiliki karakter musik yang perpindahan kunci
konsisten, musik ringan dan tempo sedang. Genre rock memiliki karakter
musik yang perpindahan kunci cepat, musik dan tempo cepat. Genre
dangdut memiliki karakter musik yang perpindahan kunci cepat, musik
mendayu – dayu dan tempo lumayan cepat.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 58
Dalam percobaan ini, peneliti melakukan 3 kali percobaan dengan
menggunakan centroid awal random / acak, dihasilkan tingkat akurasi
yang terdapat pada tabel 5.17 berikut.
Tabel 5. 17 Tabel Akurasi Berdasarkan Genre
Centroid Tingkat Pengujian Awal Akurasi Sewindu 1 Almost Easy 88.89% Bahtera Cinta Gajah 2 Bat Country 88.89% Judi Teman Hidup 3 Almost Easy 88.89% Puing - Puing
Dari tabel 5.17 diatas dapat disimpulkan bahwa MFCC dapat
digunakan untuk mengambil karakteristik suatu lagu berdasarkan genre.
Tingkat akurasi yang dihasilkan menjadi sangat baik, hal ini dipengaruhi
oleh lagu yang jelas karakteristiknya dari setiap genre. Selain itu,
perpindahan kunci dan tempo dari genre setiap lagu sangat berpengaruh
terhadap hasil MFCC (Tom LH. Li and Antoni B. Chan, 2011). Semakin
kuat karakterisitik suatu lagu setiap genre akan menghasilkan tingkat
akurasi yang semakin tinggi juga.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 59
BAB VI
KESIMPULAN DAN SARAN
Bagian ini memberikan kesimpulan dan saran berdasarkan hasil penelitian yang telah dilakukan.
6.1. Kesimpulan
Melalui penelitian yang dilakukan, dapat disimpulkan bahwa :
1. Dalam penelitian ini, pengelompokkan lagu daerah menggunakan fitur
MFCC dengan jAudio dan clustering dengan metode K-Means dapat
menghasilkan tingkat akurasi rata – rata keseluruhan sebesar 50.44%.
2. Tingkat akurasi rata – rata pengelompokkan lagu daerah tiap pulau
yang dihasilkan oleh metode K-Means adalah 37.67% untuk Sumatera,
44.67% untuk Jawa dan 42.59% untuk Maluku.
3. Pengambilan centroid awal secara random sangat berpengaruh
terhadap tingkat akurasi, selain itu dengan metode pengambilan
centroid awal secara random, sulit untuk mencapai global optimum
karena hasil yang berubah – ubah.
4. Metode yang digunakan untuk ekstrak fitur dalam penelitian ini adalah
MFCC. MFCC merupakan metode dalam music retrieval yang
berbasis timbral. Dalam penelitian ini, instrumen lagu daerah banyak
tidak menggunakan alat musik tradisional. Hal ini juga menyebabkan
MFCC kesulitan untuk mencari karakter lagu daerah yang sesuai
dengan pulau asalnya. Selain itu, data lagu daerah yang digunakan rata
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 60
– rata menggunakan kunci dan perpindahan kunci yang hampir sama
pada semua lagu daerah. Rata- rata tempo yang digunakan pada setiap
lagu daerah dalam penelitian ini juga hampir sama dan seharusnya
tempo lagu daerah dari tiap pulau sangatlah berbeda. Hal – hal tersebut
sangat berpengaruh terhadap tingkat akurasi karena vektor hasil proses
ekstrak fitur dengan MFCC menjadi kurang baik. Semua hal tersebut
dibuktikan dengan percobaan yang dilakukan peneliti dengan
mengelompokkan lagu berdasarkan genre dengan hasil akurasi yang
lebih tinggi yaitu 88.89% karena karakteristik lagu, instrumen dan
tempo lagu yang sangat jelas perbedaannya dari setiap lagu
berdasarkan genrenya.
6.2. Saran
1. Data yang digunakan dapat menggunakan musik dengan tingkat detail
instrumen yang lebih tinggi daripada MIDI.
2. Disarankan lagu daerah yang dipakai sebagai sumber data benar –
benar menggunakan alat musik daerah asal, selain itu kunci dan
perpindahannya serta temponya benar – benar mencerminkan karakter
asal dari lagu daerah.
3. Disarankan memakai metode clustering selain K-Means dan
menggunakan metode music retrieval selain MFCC, karena metode
MFCC lebih tepat untuk speech dan speak recognition.
4. Jika memakai metode K-Means disarankan untuk memakai metode
untuk menentukan centroid awal agar hasilnya dapat lebih optimal.
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 61
DAFTAR PUSTAKA
A.T., Hartaris (2007) Seni Musik SMA Jilid 2.
Ali, Matius (2006) Seni Musik SMA Jilid 1, ISBN: 9797344096.
B. Logan. Mel Frequency Cepstral Coefficients for Music Modeling. 2000.
B. Logan and S. Chu. Music summarization using key phrases. In IEEE Conf. on
Acoustics, Speech and Signal Processing, (2000).
J. Schuermann “Pattern Classification: A Unified View of Statistical and Neural
Approaches”, Wiley&Sons, 1996, ISBN 0-471-13534-8.
MacQueen, J. B. (1967). Some Methods for classification and Analysis of
Multivariate Observations, Proceedings of 5-th Berkeley Symposium on
Mathematical Statistics and Probability, Berkeley, University of California Press,
1: 281-297.
McEnnis, Daniel, Ichiro Fujinaga, Cory McKay, Philippe DePalle. 2005. "JAudio:
A feature extraction library". ISMIR.
Osma L Zaiane, Eli Hagen, Jiawei Han, Word taxonomy for on-line visual Asset management and mining fourth international workshop on application of natural language to information system (NLDB'99).
PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 62
Putra, Darma. Pengolahan Citra Digital, 2010.
Rabiner, L., and B. H. Juang. 1993. Fundamentals of speech recognition. Upper
Saddle River, NJ: Prentice-Hall.
Richard O. Duda, Peter E. Hart, David G. Stork (2001) “Pattern classification
(2nd edition)”, Wiley, New York, ISBN 0-471-05669-3.
Santosa, Budi, 2007, “Data Mining Teknik Pemanfaatan Data untuk Keperluan
Bisnis”, Graha Ilmu, Yogyakarta.
S. Russell and P. Norvig, Artificial Intelligence A Modern Approach. Upper
Saddle River, New Jersey 07458: Pearson Education, Inc., 3 ed., 2010.
Tom LH. Li and Antoni B. Chan. Genre Classification and The Variance of
MFCC to Key And Tempo, 2011.
W. Walker, P. Lamere, P. Kwok, B. Raj, E. Gouvea, P. Wolf, and J. Woelfel.
Sphinx-4: A Flexible Open Source Framework for Speech Recognition, 2004.
X. Wu and V. Kumar, eds., The Top Ten Algorithms in Data Mining.Chapman and Hall, 2009.
Zaiane. Introduction to Data Mining.1999