PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

KEAKURATAN METODE K-MEANS CLUSTERING DALAM PENGELOMPOKAN LAGU DAERAH BERDASARKAN PULAU ASAL DI

SKRIPSI

Diajukan Untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Komputer

Program Studi Teknik Informatika

Oleh

Theodorus Cahyo Adi Nugroho

105314109

PROGRAM STUDI JURUSAN TEKNIK INFORMATIKA

JURUSAN TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

2015

i

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

THE ACCURACY OF K-MEANS CLUSTERING METHOD TO

CLUSTERING FOLK BASED ISLAND IN INDONESIA

A THESIS

Presented as Partial Fulfillment of Requirements

To Obtain Sarjana Komputer Degree

In Informatics Engineering Department

By

Theodorus Cahyo Adi Nugroho

105314109

INFORMATICS ENGINEERING STUDY PROGRAM

INFORMATICS ENGINEERING DEPARTMENT

FACULTY OF SCIENCE AND TECHNOLOGY

SANATA DHARMA UNIVERSITY

YOGYAKARTA

2015

ii

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

iii

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

iv

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

HALAMAN PERSEMBAHAN

This thesis belongs to :

My Lord Jesus Christ, thank you so much for everything that He given to me until now…

My parent, thank you so much for all supports and guiding me…

My friends, thank you so much for all supports…

v

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa di dalam skripsi yang saya tulis ini tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.

Yogyakarta, 26 Januari 2015

Penulis

Theodorus Cahyo Adi Nugroho

vi

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH

UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma:

Nama : Theodorus Cahyo Adi Nugroho

NIM : 105314109

Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan

Universitas Sanata Dharma karya ilmiah yang berjudul:

KEAKURATAN METODE K-MEANS CLUSTERING DALAM

PENGELOMPOKAN LAGU DAERAH BERDASARKAN PULAU ASAL DI

INDONESIA

Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan kepada perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data mendistribusikan secara terbatas, dan mempublikasikannya di Internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun memberikan royalti kepada saya selama tetap mencamtumkan nama saya sebagai penulis.

Demikian pernyataan ini saya buat dengan sebenarnya.

Yogyakarta, 26 Januari 2015

Penulis

Theodorus Cahyo Adi Nugroho

vii

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

ABSTRAK

Di Indonesia, terdapat berbagai macam daerah dan setiap daerah memiliki karakteristik yang berbeda - beda, antara lain adalah baju daerah, bahasa daerah, dan yang sering kita dengar adalah lagu daerah. Terdapat 34 propinsi dengan 190 lagu daerah. Akan tetapi, masyarakat di Indonesia masih banyak yang tidak mengetahui asal lagu daerah tersebut karena jumlah lagu daerah yang sangatlah banyak dan beragam karakteristiknya.

Dari latar belakang tersebut, maka pengelompokkan lagu daerah dilakukan menggunakan algoritma K-Means. Proses ekstraksi ciri dilakukan dengan menggunakan metode MFCC yang terdapat pada jAudio.

Hasil akhir yang diperoleh adalah tingkat akurasi algoritma K-Means dalam pengelompokkan lagu daerah berdasarkan pulau asalnya. Hasil akurasi rata

– rata dari pengujian adalah 50.44% dengan tingkat akurasi paling tinggi 53.33% dan paling rendah 46.67%. Hal ini dikarenakan data yang digunakan karakteristiknya sangat rendah dan hasil MFCC menjadi kurang baik, dibuktikan dengan percobaan pengelompokan lagu berdasarkan genre.

Kata Kunci : K-Means, MFCC, jAudio, Lagu Daerah, WAV

viii

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

ABSTRACT

In Indonesia, there are many regions and each region has different characteristics, example : the local clothes, the local languages, and that we often hear is a local . There are 34 provinces with 190 folk songs. However, people in Indonesia are still do not know the origin of the song because the number of folk songs are so numerous and diverse characteristics.

From this background, the grouping of folk songs performed by using the

K-Means algorithm. The process of feature extraction is performed by using the method contained in jAudio, MFCC.

The final result obtained is the accuracy of the K-Means algorithm in clustering folk song based on the island of origin. The results of average accuration of the test is 50.44% with the highest level of accuration is 53.33% and lowest level of accuration is 46.67%. This is because the characteristics of the data used is very low and MFCC be less good results, it proved by experiment clustering songs by genre.

Keywords : K-Means, MFCC, jAudio, Folk Songs, WAV

ix

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

KATA PENGANTAR

Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus, sehingga penulis dapat menyelesaikan tugas akhir sebagai salah satu mata kuliah wajib dan merupakan syarat akademik pada jurusan Teknik Informatika Universitas Sanata

Dharma Yogyakarta.

Pada kesempatan ini, penulis ingin mengucapkan terima kasih kepada pihak-pihak yang telah membantu penulis baik selama penelitian maupun saat pengerjaan skripsi ini. Ucapan terima kasih penulis sampaikan di antaranya kepada :

1. Ibu Sri Hartati Wijono, S.Si., M.Kom., selaku dosen pembimbing

tugas akhir. Terima kasih atas bimbingan, kesabaran, waktu, dukungan

dan ilmu yang sudah diberikan kepada penulis selama mengerjakan

tugas akhir.

2. Ibu Ridowati Gunawan, S.Kom., M.T., dan Bapak Alb. Agung

Hadhiatma, S.T., M.T., selaku dosen penguji. Terima kasih atas saran

dan kritik yang telah diberikan.

3. Ibu Paulina Heruningsih Prima Rosa S.Si., M.Sc., selaku Dekan

Fakultas Sains dan Teknologi dan dosen pembimbing akademik

Teknik Informatika kelas c. Terima kasih atas dukungan, bimbingan

dan kesabarannya dalam menghadapi mahasiswa.

4. Seluruh Dosen Teknik Informatika atas ilmu yang telah diberikan

selama masa kuliah dan sangat membantu penulis dalam mengerjakan

tugas akhir. x

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

5. Orang tua, Laurentius Suwondo dan Laurentia Endang Pratiwi atas

dukungan moral, spiritual dan finansial dalam penyusunan skripsi.

6. Om Sutadi, Mas Andi, Mbak Vita, Mbak Rina, Mas Anton dan seluruh

keluarga besar Sugeng Hutomo dan Eyang Muntilan atas semangat,

dukungan dan doanya.

7. Mr. Cory McKay for the dissertation about jAudio. Thank you so

much for all the answers and helping me to understanding about

jAudio.

8. Mas Audris, Mbak Petra, Fa Febrian, Edo, Agus, Yhoga, Dita dan

Teddy atas bantuan dan semangat serta doanya selama penulis

mengerjakan tugas akhir.

9. Ougi, Ronny, Ardy, Renny, Andhini, Festi, Maria, Ria, Sepen, Novi,

Amel, Felisitas, Erlita dan Ayu atas semua dukungan dan semangat

serta doanya.

10. Seluruh teman-teman Teknik Informatika 2010 dan 2011, atas

dukungan dan doanya.

11. Semua pihak yang tidak dapat disebutkan satu per satu yang telah

membantu penulis dalam pengerjaan skripsi ini.

xi

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

Penulis menyadari masih banyak kekurangan yang terdapat

dalam laporan tugas akhir ini. Saran dan kritik sangat diharapkan

untuk hasil yang lebih baik di masa depan.

Penulis,

Theodorus Cahyo Adi Nugroho

xii

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

DAFTAR ISI

HALAMAN JUDUL BAHASA INDONESIA ...... I HALAMAN JUDUL BAHASA INGGRIS ...... II HALAMAN PERSETUJUAN ...... ERROR! BOOKMARK NOT DEFINED. HALAMAN PENGESAHAN ...... ERROR! BOOKMARK NOT DEFINED. HALAMAN PERSEMBAHAN ...... V PERNYATAAN KEASLIAN KARYA ...... VI LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS ...... VII ABSTRAK ...... VIII ABSTRACT ...... IX KATA PENGANTAR ...... X DAFTAR ISI ...... XIII DAFTAR GAMBAR ...... XV DAFTAR TABEL ...... XVI BAB I PENDAHULUAN ...... 1

1.1. LATAR BELAKANG ...... 1 1.2. RUMUSAN MASALAH ...... 3 1.3. TUJUAN PENELITIAN ...... 3 1.4. BATASAN MASALAH ...... 3 1.5. MANFAAT PENELITIAN ...... 4 1.6. METODOLOGI PENELITIAN ...... 4 1.7. SISTEMATIKA PENULISAN ...... 5 BAB II LANDASAN TEORI ...... 7

2.1. MUSIK TRADISIONAL / LAGU DAERAH ...... 7 2.2. PENGENALAN POLA ...... 11 2.3. AUDIO FEATURE EXTRACTION ...... 13 2.3.1. Aplikasi jAudio ...... 13 2.3.2. Mel-frequency Cepstral Coefficients (MFCC) ...... 14 2.4. CLUSTERING ...... 17 2.5. ALGORITMA K-MEANS ...... 18 BAB III ANALISIS DAN PERANCANGAN PENELITIAN ...... 22

3.1. PERANCANGAN PENELITIAN SECARA UMUM ...... 22 3.2. DATA PREPROCESSING ATAU PEMBUATAN DATA ...... 24 3.3. PROSES CLUSTERING ...... 25 3.4. PROSES PENGUJIAN ...... 26 3.5. SPESIFIKASI HARDWARE DAN SOFTWARE ...... 28 3.5.1. Hardware ...... 28 xiii

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

3.5.2. Software ...... 28 BAB IV ANALISIS DAN IMPLEMENTASI PENELITIAN ...... 29

4.1. IMPLEMENTASI MENENTUKAN CENTROID AWAL ...... 29 4.2. IMPLEMENTASI CLUSTERING DENGAN METODE K-MEANS ...... 30 4.3. IMPLEMENTASI PENGUJIAN AKURASI BERDASARKAN NILAI PRECISION TERTINGGI...... 34 BAB V HASIL DAN PEMBAHASAN ...... 39

5.1. HASIL PENGUKURAN ...... 39 5.2. SKENARIO PENGUJIAN ...... 41 5.3. ANALISA HASIL ...... 47 5.3.1. Kesalahan Pengelompokkan Lagu Daerah ...... 49 5.3.2. Penentuan Centroid Awal ...... 52 5.3.3. Karakteristik Lagu dan MFCC ...... 55 BAB VI KESIMPULAN DAN SARAN ...... 59

6.1. KESIMPULAN ...... 59 6.2. SARAN ...... 60 DAFTAR PUSTAKA ...... 61

xiv

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

DAFTAR GAMBAR

GAMBAR 2. 1 DIAGRAM BLOK MEL - FREKUENSI KOEFISIEN CEPSTRAL ...... 15 GAMBAR 2. 2 DIAGRAM ALGORITMA K-MEANS ...... 20

GAMBAR 3. 1 DIAGRAM BLOK PENELITIAN SECARA UMUM ...... 23 GAMBAR 3. 2 OUTPUT JAUDIO ...... 24 GAMBAR 3. 3 DATABASE HASIL JAUDIO ...... 25 GAMBAR 3. 4 DIAGRAM BLOK PROSES CLUSTERING DENGAN ALGORITMA K-MEANS ...... 26

GAMBAR 4. 1 MENENTUKAN CENTROID AWAL ...... 30 GAMBAR 4. 2 CLUSTERING DENGAN K-MEANS ...... 34 GAMBAR 4. 3 PENGUJIAN AKURASI ...... 38

xv

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI

DAFTAR TABEL

TABEL 5. 1 INISIALISASI CLUSTER TIAP PULAU ...... 39 TABEL 5. 2 LAGU DAERAH DENGAN ACTUAL CLUSTER 1 ...... 40 TABEL 5. 3 LAGU DAERAH DENGAN ACTUAL CLUSTER 2 ...... 40 TABEL 5. 4 LAGU DAERAH DENGAN ACTUAL CLUSTER 3 ...... 40 TABEL 5. 5 PERBANDINGAN CLUSTER...... 41 TABEL 5. 6 BOBOT PERBANDINGAN PREDICTED CLUSTER DENGAN ACTUAL CLUSTER ...... 42 TABEL 5. 7 PRECISION PERBANDINGAN PREDICTED CLUSTER DENGAN ACTUAL CLUSTER ...... 43 TABEL 5. 8 PRECISION TERTINGGI PERBANDINGAN PREDICTED DENGAN ACTUAL CLUSTER ...... 45 TABEL 5. 9 TOTAL BOBOT PERBANDINGAN PREDICTED CLUSTER DENGAN ACTUAL CLUSTER BERDASARKAN PRECISION TERTINGGI ...... 46 TABEL 5. 10 AKURASI BERDASARKAN PRECISION TERTINGGI ...... 46 TABEL 5. 11 HASIL PENGUJIAN AKURASI ...... 47 TABEL 5. 12 TABEL PERSENTASE LAGU ...... 50 TABEL 5. 13 TABEL PERSENTASE KESALAHAN ...... 51 TABEL 5. 14 AKURASI TIAP PULAU ...... 52 TABEL 5. 15 TABEL INISIALISASI GENRE LAGU ...... 57 TABEL 5. 16 TABEL AKURASI BERDASARKAN GENRE ...... 58

xvi

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 1

BAB I

PENDAHULUAN

1.1. Latar Belakang

Di Indonesia, terdapat berbagai macam daerah dan setiap daerah

memiliki karakteristik yang berbeda - beda, antara lain adalah baju daerah,

bahasa daerah, dan yang sering kita dengar adalah lagu daerah. Terdapat

34 propinsi dengan 190 lagu daerah. Akan tetapi, masyarakat di Indonesia

masih banyak yang tidak mengetahui asal lagu daerah tersebut karena

jumlah lagu daerah yang sangatlah banyak dan beragam karakteristiknya.

Karakteristik lagu suatu pulau jelas sangat berbeda dengan pulau lain,

misal: karakter satu lagu di pulau Jawa berbeda dengan karakter lagu di

pulau Sumatera. Akan tetapi, sebelum lagu daerah dikelompokkan

berdasarkan pulau asalnya, data tersebut harus dapat disimpan

karakteristiknya agar pengelompokkan menghasilkan hasil yang optimum.

Pengolahan lagu daerah tersebut dapat dilakukan dengan metode MFCC.

MFCC merupakan salah satu metode dalam fiture extraction

berbasis timbral. Pada penelitian Genre Classification and The Variance of

MFCC to Key And Tempo (Tom LH. Li and Antoni B. Chan, 2011)

MFCC mengkodekan baik timbral maupun kunci pada musik. Penelitian

tersebut menghasilkan akurasi 68,9% menggunakan klasifikasi Aug-Both

dengan 13 koefisien MFCC. Selain itu, genre musik klasik menghasilkan

akurasi 90% untuk semua data.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 2

Dalam kasus ini, pengelompokkan lagu daerah dapat dilakukan

dengan metode Data Clustering. Data Clustering merupakan salah satu

metode Data Mining yang bersifat tanpa arahan (unsupervised). Ada dua

jenis data clustering yang sering dipergunakan dalam proses

pengelompokan data yaitu hierarchical (hirarki) data clustering dan non-

hierarchical (non hirarki) data clustering. K-Means merupakan salah satu

metode data clustering non hirarki yang berusaha mempartisi data yang

ada ke dalam bentuk satu atau lebih cluster/kelompok.

Metode ini mempartisi data ke dalam cluster/kelompok sehingga

data yang memiliki karakteristik yang sama dikelompokkan ke dalam satu

cluster yang sama dan data yang mempunyai karakteristik yang berbeda

dikelompokkan ke dalam kelompok yang lain.

Adapun tujuan dari mengelompokkan data ini adalah untuk

meminimalisasikan objective function yang diset dalam proses clustering,

yang pada umumnya berusaha meminimalisasikan variasi di dalam suatu

cluster dan memaksimalisasikan variasi antar cluster (MacQueen, J. B.

1967).

Kelebihan metode k-means adalah dapat memecahkan berbagai

macam permasalahan. Salah satunya adalah permasalahan dalam bidang

musik, yaitu : mengelompokkan lagu daerah berdasarkan pulau asalnya.

Dalam penelitian ini, hasil tingkat akurasi dari clustering bisa

beragam karena penelitian itu dilakukan untuk mencari keakurasian

metode K-Means dalam menangani pengelompokkan lagu daerah

berdasarkan pulau asalnya di Indonesia.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 3

1.2. Rumusan Masalah

Seberapa besar tingkat akurasi metode K-Means Clustering dalam

mengelompokkan lagu daerah berdasarkan pulau asalnya di Indonesia.

1.3. Tujuan Penelitian

Penelitian ini bertujuan untuk mengetahui tingkat akurasi metode

K-Means Clustering dalam mengelompokkan lagu daerah berdasarkan

pulau asalnya di Indonesia.

1.4. Batasan Masalah

Batasan penelitian ini, antara lain :

1. Mengetahui keakuratan metode K-mean Clustering dalam

mengelompokkan lagu daerah berdasarkan pulau asalnya di

Indonesia.

2. Pengujian akurasi menggunakan metode precision.

3. Format lagu daerah adalah wave (.wav).

4. Proses extract feature menggunakan metode Mel-frequency

Cepstral Coefficient (MFCC) yang terdapat dalam aplikasi

jAudio.

5. MFCC menghasilkan banyak koefisien yang dapat dijadikan

fitur untuk penelitian. Penelitian ini menggunakan 13 koefisien

karena koefisien lebih dari 13 dianggap tidak berpengaruh

banyak.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 4

6. Hanya menggunakan 10 lagu daerah untuk mewakili setiap

pulau. Pulau yang dipakai untuk penelitian ini adalah pulau

Jawa, Sumatera dan Maluku.

7. Penelitian menggunakan software Netbeans IDE 8.0.1 dengan

bahasa pemrograman Java.

1.5. Manfaat Penelitian

Manfaat dari penelitian ini untuk mengetahui akurasi metode K-

Means Clustering dalam mengelompokkan lagu daerah berdasarkan pulau

asalnya di Indonesia.

1.6. Metodologi Penelitian

Tahapan yang dilakukan dalam pembuatan tugas akhir adalah :

1. Studi Pustaka

Pada tahap ini mempelajari informasi yang berhubungan

dengan skripsi ini. Informasi dapat diperoleh dari buku - buku

referensi atau sumber - sumber yang berkaitan dengan skripsi

ini, baik dari text book maupun internet.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 5

2. Analisis dan Perancangan Penelitian

Pada tahap ini dilakukan analisis terhadap masalah, proses,

cara kerja, dan solusi. Selain itu, dilakukan perancangan

terhadap data dan penelitian secara keseluruhan.

3. Implementasi Program

Pada tahap ini dilakukan penerapan implementasi dengan

pengkodean program perangkat lunak pengujian akurasi

dengan menggunakan bahasa pemrograman Java.

4. Pengujian dan Analisa Penelitian

Pengujian dilakukan untuk memastikan akurasi metode k-

means clustering dalam clustering lagu daerah berdasarkan

pulau asal di Indonesia. Lalu melakukan analisa tentang hasil

yang diperoleh dari pengujian penelitian.

1.7. Sistematika Penulisan

Dalam tulisan ini ada enam buah bab, sebagai berikut :

BAB I PENDAHULUAN

Berisi pendahuluan yang akan dibahas meliputi latar belakang

masalah, rumusan masalah, tujuan penelitian, batasan masalah, manfaat

penelitian, metodologi penelitian dan sistematika penulisan.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 6

BAB II LANDASAN TEORI

Berisi konsep - konsep yang akan digunakan sebagai acuan dalam

penelitian.

BAB III ANALISIS DAN PERANCANGAN PENELITIAN

Berisi analisis dan perancangan yang akan digunakan dalam

penelitian keakuratan metode k-means clustering untuk mengelompokkan

lagu daerah berdasarkan pulau asalnya di Indonesia.

BAB IV IMPLEMENTASI

Berisi implementasi dan penjelasan fungsi program dari penelitian

yang dibuat.

BAB V ANALISIS HASIL

Berisi analisis dan hasil dari pengujian yang dilakukan.

BAB VI KESIMPULAN DAN SARAN

Berisi kesimpulan dan saran dari analisis pengujian yang

dilakukan.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 7

BAB II

LANDASAN TEORI

Pada bab ini akan dijelaskan mengenai teori - teori yang menjadi landasan untuk mengembangkan penelitian beserta perangkatnya. Teori - teori yang akan dibahas antara lain musik traditional/lagu daerah, pengenalan pola, Audio Feature

Extraction, Mel-frequency Cepstral Coefficients (MFCC), Clustering, algoritma

K-Means Clustering dan aplikasi jAudio.

2.1. Musik Tradisional / Lagu Daerah

Musik tradisional adalah musik atau seni suara yang berasal dari

berbagai daerah, dalam hal ini di Indonesia. Musik tradisional adalah

musik yang lahir dan berkembang di suatu daerah tertentu dan diwariskan

secara turun temurun dari satu generasi ke generasi berikutnya. Musik ini

menggunakan bahasa, gaya, dan tradisi khas daerah setempat. Secara

umum, musik tradisional memiliki ciri khas sebagai berikut :

a) Dipelajari Secara Lisan

Sebagai bagian dari kebudayaan, musik daerah diwariskan secara

turun temurun. Proses pewarisan musik ini biasanya dilakukan secara

lisan. Generasi tua mengajarkan komposisi musik daerah kepada generasi

muda. Anak-anak itu akan meneruskannya pula kepada anak-anak mereka.

Demikian seterusnya, sehingga tradisi musik tersebut tetap dikenal oleh

masyarakat. Atau orang yang telah mahir memainkan instrumen musiknya

atau terampil menyanyikan lagu-lagu daerah akan memberikan contoh

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 8

kepada pengikutnya untuk kemudian ditirukan. Orang yang belajar harus

menghapalkannya tanpa ada catatan. Dengan terus berlatih, ia akan

menguasai semakin banyak lagu dan teknik.

b) Tidak Memiliki Notasi

Proses pembelajaran yang berlangsung secara lisan membuat

partitur (naskah musik) menjadi suatu hal yang tidak terlalu penting. Oleh

karena itu, sangat lazim jika musik tradisional daerah tidak memiliki

partitur notasi tertentu. Walau demikian, ada beberapa daerah yang

memiliki notasi musik seperti di Pulau Jawa dan Bali. Namun, notasi ini

tetap tidak memiliki partitur, tapi dipelajari secara lisan. Sebenarnya, hal

ini dikemudian hari dapat menimbulkan masalah. Jika orang-orang yang

belajar tentang kesenian itu semakin sedikit atau malah tidak ada, kesenian

tersebut bisa punah. Tanpa catatan tertulis, orang lain tidak bisa

melestarikannya.

c) Bersifat Informal

Musik Tradisional sangat lazim digunakan sebagai suatu bentuk

ekspresi masyarakat. Musik ini banyak digunakan dalam kegiatan rakyat

biasa sehingga bersifat lebih sederhana dan informal / santai. Hanya jika

digunakan di kalangan istana saja jenis musik ini menjadi lebih kompleks

dan formal / serius.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 9

d) Pemainnya Tidak Terspesialisasi

Sistem yang dikembangkan dalam proses belajar instrumen musik

daerah biasanya bersifat generalisasi. Pemain musik tradisional belajar

untuk dapat memainkan setiap instrumen yang ada dalam suatu jenis

musik daerah. Mereka akan belajar memainkan instrumen mulai dari yang

termudah sampai yang terumit. Jadi, pemain musik daerah yang sudah

mahir mempunyai kemampuan untuk memainkan semua instrumen musik

tersebut.

e) Syair Lagu Berbahasa Daerah

Selain syair yang menggunakan bahasa daerah, musik tradisional

juga menggunakan alunan melodi dan irama yang menunjukkan ciri khas

kedaerahan. Misalnya, syair lagu dari daerah Jawa . Alunan melodinya pun

menggunakan nada-nada dari tangga nada pelog dan slendro. Contoh

lainnya, syair lagu dari daerah Jakarta umumnya berbahasa Betawi dan

alunan melodinya tersusun atas tangga-tangga nada diatonis.

f) Lebih Melibatkan Alat Musik Daerah

Umumnya, permainan musik dalam lagu-lagu daerah di Indonesia

dibawakan dengan alat-alat musik khas dari daerah-daerah itu sendiri.

Contoh, lagu -lagu daerah Jawa umumnya diiringi oleh alat musik khas

Jawa, yaitu . Contoh lainnya, lagu-lagu daerah Sulawesi Utara

umumnya diiringi alat musik khas Sulawesi Utara, yaitu .

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 10

g) Merupakan Bagian dari Budaya Masyarakat

Musik tradisional merupakan salah satu bentuk kebudayaan yang

berkembang di dalam kehidupan masyarakat. Oleh karena itu, setiap ciri

kebudayaan masyarakat Sang Penciptanya pasti sudah melekat erat

didalamnya. Musik daerah merupakan salah satu bentuk gambaran

kebudayaan suatu daerah, selain tarian, pakaian, dan adat kebiasaan

lainnya. Melalui musik daerah, kita dapat mengenali daerah asal musik itu

dan ciri budaya masyarakatnya. Misalnya : ketika kita mendengarkan

permainan gamelan Jawa kita akan langsung mengetahui kalau itu adalah

musik daerah Jawa Tengah, bukan Sunda. Kita dapat mengenalinya lewat

karakter permainan gamelan terutama lewat suara, irama, dan lagunya.

Karakter inilah yang menggambarkan ciri khas adat Jawa. Salah satu

contohnya adalah irama musik gamelan Jawa yang umumnya terdengar

melantun halus dan lembut. Hal ini menunjukkan budaya orang Jawa yang

menekankan tutur kata yang halus, ramah, dan sopan.

Dari pengertian dan ciri-ciri musik tradisional tersebut, peneliti

dapat mengambil kesimpulan bahwa musik tradisi cenderung bersifat

eksklusif. Artinya, musik ini tidak dapat dinikmati secara luas oleh

masyarakat di luar kebudayaan yang melahirkan musik tersebut.

Komposisi, fungsi, nilai, dan karakteristik syair musik tradisi suatu

masyarakat sangatlah khas sehingga tidak mudah untuk dinikmati atau

diterima sebagai bagian dari kebudayaan masyarakat lain. Oleh karena itu,

musik tradisi cenderung kurang dapat berkembang sehingga musik ini

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 11

sering disebut sebagai musik tradisional. (Matius Ali, 2006 dan Hartaris

A.T., 2007)

2.2. Pengenalan Pola

Pengenalan pola bertujuan menentukan kelompok atau kategori

pola berdasarkan ciri-ciri yang dimiliki oleh pola tersebut. Dengan kata

lain, pengenalan pola membedakan suatu objek dengan objek yang lain.

Pengenalan pola sendiri merupakan cabang dari kecerdasan buatan

(Artificial Inteligence). Beberapa definisi tentang pengenalan pola, di

antaranya:

Suatu ilmu untuk mengklasifikasikan atau menggambarkan sesuatu

berdasarkan pengukuran kuantitatif fitur (ciri) atau sifat utama dari suatu

obyek. (Putra, Darma, 2010).

Penentuan suatu objek fisik atau kejadian ke dalam salah satu atau

beberapa kategori. (Duda dan Hart dalam Al Fatta, Hanif, 2009).

Berdasarkan definisi di atas, pengenalan pola dapat didefinisikan

sebagai cabang kecerdasan buatan yang menitikberatkan pada metode

pengklasifikasian objek ke dalam kelas-kelas tertentu untuk

menyelesaikan masalah tertentu.

Pengenalan pola merupakan cabang dari kecerdasan buatan yang

saat ini berkembang pesat untuk mendukung aspek keamanan suatu

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 12

sistem. Saat ini, aplikasi-aplikasi pengenalan pola juga sudah sangat

beragam, di antaranya:

a) Voice recognition yang menggunakan pengenalan suara sebagai kunci bagi

pengguna sistem.

b) Fingerprint identification yang menggunakan pengenalan sidik jari sebagai

kunci telah dipakai secara luas sebagai pengganti password atau pin untuk

mengakses sistem tertentu.

c) Face identification yang menggunakan pengenalan wajah sebagai kunci

bagi pengguna sistem, bahkan saat ini badan penegak hukum sedang

mengembangkan sistem untuk mengidenfikasi para buronan dengan

melakukan scanning pada wajah para pelaku kejahatan yang sudah di-

database-kan berdasarkan foto pelaku kejahatan tersebut.

d) Handwriting identification yang menggunakan pengenalan tulisan yang

telah secara luas digunakan oleh sistem perbankan untuk membuktikan

pelaku transaksi adalah orang yang benar-benar berhak.

e) Optical Character Recognition (OCR) yang secara luas digunakan pada

counter pengecekan barang.

f) Robot vision yang digunakan oleh aplikasi robotik dalam mengenali objek

tertentu pada lingkungan yang unik.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 13

2.3. Audio Feature Extraction

Ekstraksi fitur audio adalah proses otomatis penggalian informasi

tentang karakteristik file audio yang kemudian dapat digunakan untuk

tujuan seperti mengklasifikasikan dan menganalisis audio. Ekstraksi fitur

audio melibatkan sejumlah langkah, termasuk parsing dan berpotensi

dekompresi sampel audio dari file di mana mereka disimpan, pra

pengolahan sampel sehingga mereka secara tepat dipersiapkan untuk fitur

tertentu yang akan diekstraksi dan akhirnya, penggalian fitur sendiri, yang

dapat dihitung berdasarkan sampel dasar, fitur lain yang telah diekstraksi,

atau keduanya. Salah satu aplikasi untuk ekstraksi fitur audio adalah

jAudio (McEnnis, Daniel, Ichiro Fujinaga, Cory McKay, Philippe DePalle.

2005).

2.3.1. Aplikasi jAudio

jAudio adalah komponen jMIR dikhususkan untuk

penggalian fitur dari data audio dan melakukan semua langkah

diatas. Hal ini dirancang untuk digunakan secara langsung sebagai

audio ekstraksi fitur aplikasi perangkat lunak sederhana serta

platform iteratif untuk mengembangkan fitur baru yang kemudian

dapat dibagi di antara para peneliti. Ekstraktor fitur audio yang

meliputi implementasi dari 26 fitur inti, termasuk fitur yang terbukti

dalam penelitian MIR dan lebih eksperimental fitur bermakna

perseptual. jAudio menempatkan penekanan lebih besar pada

perpanjangan dari komponen jMIR lainnya, dan termasuk

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 14

implementasi metafeatures dan agregator yang dapat digunakan

untuk secara otomatis menghasilkan lebih banyak fitur dari fitur inti

(misalnya, standar deviasi, turunan, dan lain-lain). Sejumlah alat

untuk memfasilitasi pengembangan dan pengujian fitur baru juga

disertakan, seperti waktu dan frekuensi domain visualisasi alat;

fungsi perekaman audio; sintesis data uji; Audio konversi format

file; dan MIDI ke fungsi konversi audio. Parameter ekstraksi fitur

seperti ukuran jendela, tumpang tindih, downsampling dan

normalisasi juga dapat diatur oleh pengguna. (McEnnis, Daniel,

Ichiro Fujinaga, Cory McKay, Philippe DePalle. 2005).

2.3.2. Mel-frequency Cepstral Coefficients (MFCC)

Mel frekuensi koefisien cepstral fitur adalah spektral

berbasis jangka pendek yang digunakan oleh banyak peneliti untuk

pengenalan suara (W. Walker, P. Lamere, P. Kwok, B. Raj, E.

Gouvea, P. Wolf, and J. Woelfel, 2004), sistem pencarian (J. T.

Foote, 1997), musik summarization (B. Logan and S. Chu, 2000),

diskriminasi pidato / musik (B. Logan, 2000). Kekuatan MFCC

terletak pada kemampuannya untuk perwakilan kompak spektrum

amplitudo. Langkah-langkah untuk menghitung MFCC

sebagaimana diuraikan dalam (L. R. Rabiner and B. H. Juang,

1993) telah ditunjukkan pada gambar 2.1 dibawah ini.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 15

Gambar 2. 1 Diagram Blok Mel - Frekuensi Koefisien Cepstral

Sinyal audio pertama dibagi menjadi beberapa frame durasi

tetap. Frame dapat terdiri dari sampel yang tumpang tindih dengan

frame sebelumnya. Untuk meminimalkan diskontinuitas pada awal

dan akhir frame fungsi windowing (window Hamming adalah salah

satu yang paling banyak digunakan) yang juga diterapkan pada

frame. Spektrum amplitudo untuk masing-masing (windowed)

frame diperoleh dengan menerapkan Discrete Fourier Transform

(DFT). Sebagai hubungan antara kenyaringan yang dirasakan dan

spektrum amplitudo lebih logaritmik linear, logaritma dari

amplitudo diambil. Dengan demikian, spektrum dimensi N

diperoleh di mana N adalah ukuran frame. Spektrum ini dihaluskan

untuk membuatnya bermakna perseptual. Cara termudah untuk

melakukan hal ini untuk mempertimbangkan spektrum rata-rata

selama frekuensi bin. Tapi ditempatkan terpisah pada jarak yang

sama atas skala frekuensi tidak sesuai sistem pendengaran manusia

sebagai frekuensi dirasakan dan frekuensi sinyal tidak berhubungan

linier. Hal ini menyebabkan perkembangan frekuensi Mel. Relasi

dapat dinyatakan sebagai berikut.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 16

di mana, f dan fm adalah frekuensi sinyal dan frekuensi yang sesuai

Mel masing-masing. Pemetaan adalah sekitar linier bawah 1kHz

dan logaritma di atas. Dengan demikian, logaritma dari spektrum

amplitudo yang diperoleh setelah DFT dipetakan ke skala Mel-

frekuensi dan dihaluskan dengan mempertimbangkan sampah

selama Mel skala. Unsur-unsur di vektor Mel-spektrum yang

dihaluskan sangat berkorelasi. Untuk decorrelate dan untuk

mengurangi jumlah parameter DCT dilakukan untuk memperoleh

Mel frekuensi koefisien cepstral dan pertama 13 koefisien diambil

sebagai fitur untuk frame. Dengan demikian, koefisien c [n] dapat

direpresentasikan sebagai

di mana, 0 < n < L-1, X [k] menjadi Mel-spektrum yang dihaluskan

sinyal input x [n] dan L adalah jumlah elemen dalam vektor Mel-

spektrum yang dihaluskan.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 17

2.4. Clustering

Tujuan utama dari metode cluster adalah pengelompokan sejumlah

data/obyek ke dalam cluster (group) sehingga dalam setiap cluster akan

berisi data semirip mungkin (Santoso, 2007). Dalam clustering kita

berusaha untuk menempatkan obyek yang mirip satu sama lain dan sangat

berbeda dengan obyek dalam cluster - cluster yang lain. K-means

clustering adalah salah satu teknik unsupervised learning dimana tidak

memiliki 'label' untuk fase learning.

Clustering terbagi menjadi beberapa, yaitu (Zaiane, 1999) :

1. Partitioning Clustering

Partitioning clustering disebut juga exclusive clustering dimana

setiap data harus termasuk dalam cluster tertentu dan memungkinkan bagi

setiap data yang termasuk cluster tertentu pada suatu tahapan proses, pada

tahapan berikutnya berpindah ke cluster yang lain.

2. Hierarchical Clustering

Pada Hierarchical Clustering setiap data harus masuk ke dalam

cluster tertentu, namun suatu data yang masuk ke dalam cluster tertentu

pada suatu tahapan proses tidak dapat berpindah ke cluster lain pada

proses berikutnya.

Contoh : Single Linkage, Centroid Linkage, Complete Linkage, Average

Linkage

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 18

3. Overlapping Clustering

Overlapping Clustering mengijinkan setiap data masuk ke

beberapa cluster berbeda dan data mempunyai nilai keanggotaan pada

beberapa cluster.

Contoh : Fuzzy C-means, Gaussian Mixture

4. Hybrid

Hybrid merupakan kombinasi dari karakteristik partitioning,

overlapping dan hierarchical.

2.5. Algoritma K-Means

Ada dua jenis clustering yang sering digunakan dalam proses

pengelompokkan data, yaitu hierarchical data clustering dan non-

hierarchical data clustering. K-means clustering merupakan salah satu

metode data clustering non hirarki yang berusaha memisahkan data yang

ada ke dalam bentuk satu atau lebih cluster. Metode ini mempartisi data ke

dalam cluster sehingga data yang memiliki karakteristik yang berbeda

dikelompokkan ke dalam kelompok yang lain.

Tujuan dari data clustering ini adalah untuk meminimalisasi

objective function yang diatur dalam proses clustering, yang pada

umumnya berusaha meminimalisasikan variasi di dalam suatu cluster dan

memaksimalisasikan variasi antar cluster. Data clustering menggunakan

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 19

metode K-Means ini secara umum dilakukan dengan algoritma dasar

sebagai berikut.

1. Tentukan jumlah cluster.

2. Alokasikan data ke dalam cluster secara random.

3. Hitung centroid / rata- rata dari data yang ada di masing - masing cluster.

4. Alokasikan masing - masing data ke centroid / rata - rata terdekat.

5. Kembali ke langkah 3, apabila masih ada data yang berpindah cluster atau

apabila perubahan nilai centroid, ada yang di atas nilai threshold yang

ditentukan atau apabila perubahan nilai pada objective function yang

digunakan di atas nilai threshold yang ditentukan.

Gambar 2.2 merupakan diagram algoritma K-Means secara umum.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 20

START

Inisialisasi jumlah K

Tentukan centroid

Hitung jarak dengan centroid

Kelompokkan dengan centroid terdekat

Hitung centroid baru

F Centroid tetap?

T

FINISH

Gambar 2. 2 Diagram Algoritma K-Means

Ada beberapa kelebihan pada algoritma K-Means, yaitu (S. Russell

and P. Norvig, 2010) :

1. Mudah untuk diimplementasikan dan dijalankan.

2. Waktu yang dibutuhkan untuk menjalankan pembelajaran ini relatif cepat.

3. Mudah untuk diadaptasi.

4. Umum digunakan.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 21

Algoritma k-means memiliki beberapa kelebihan, namun ada

kekurangannya juga. Kekurangan dari algoritma tersebut yaitu :

1. Sebelum algoritma dijalankan, k buah titik diinisialisasi

secara random sehingga pengelompokkan data yang dihasilkan dapat

berbeda-beda (X. Wu and V. Kumar, eds., 2009). Jika nilai random untuk

inisialisasi kurang baik, maka pengelompokkan yang dihasilkan pun

menjadi kurang optimal.

2. Dapat terjebak dalam masalah yang disebut curse of dimensionality. Hal

ini dapat terjadi jika data pelatihan memiliki dimensi yang sangat tinggi

(Contoh jika data pelatihan terdiri dari 2 atribut maka dimensinya adalah 2

dimensi. Namun jika ada 20 atribut, maka akan ada 20 dimensi). Salah

satu cara kerja algoritma ini adalah mencari jarak terdekat antara k buah

titik dengan titik lainnya. Jika mencari jarak antar titik pada 2 dimensi,

masih mudah dilakukan. Namun bagaimana mencari jarak antar titik jika

terdapat 20 dimensi. Hal ini akan menjadi sulit.

3. Jika hanya terdapat beberapa titik sampel data, maka cukup mudah untuk

menghitung dan mencari titik terdekat dengan k titik yang diinisialisasi

secara random. Namun jika terdapat banyak sekali titik data (misalnya satu

milyar buah data), maka perhitungan dan pencarian titik terdekat akan

membutuhkan waktu yang lama. Proses tersebut dapat dipercepat, namun

dibutuhkan struktur data yang lebih rumit seperti kD-Tree atau hashing.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 22

BAB III

ANALISIS DAN PERANCANGAN PENELITIAN

Bab ini akan menjelaskan tentang rancangan penelitian yang akan dilakukan penulis. Penelitian ini berfungsi untuk menganalisa tingkat akurasi metode K-Means Clustering dalam mengelompokkan lagu daerah berdasarkan pulau asalnya di Indonesia.

3.1. Perancangan Penelitian Secara Umum

Penelitian ini digunakan untuk menganalisa tingkat akurasi metode

K-Means Clustering dalam mengelompokkan lagu daerah berdasarkan

pulau asalnya yang terdapat di Indonesia. Ekstraksi fitur lagu daerah

dilakukan dengan menggunakan aplikasi jAudio dan hasil dari ekstraksi

fitur yang berupa data numerik disimpan ke dalam database sebelum

diproses lagi. Data yang sudah disimpan di dalam database, kemudian

diproses dengan algoritma K-Means Clustering untuk mencari cluster

prediksi dari tiap - tiap lagu daerah tersebut. Setelah cluster prediksi tiap

lagu sudah didapatkan, kemudian hasil cluster prediksi tersebut

dicocokkan dengan actual cluster yang sesuai dengan pulau asal dari lagu

tersebut. Kemudian dihitung total bobot perbandingan antara cluster

prediksi dengan actual cluster. Dalam penelitian ini, pengujian dilakukan

berdasarkan precision tertinggi.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 23

Langkah - langkah penelitian secara umum dapat dilihat pada

gambar 3.1 dibawah ini.

Data lagu Data disimpan di Feature Extraction berekstensi .wav dalam database

Inisialisasi jumlah K

Tentukan centroid

Hitung jarak dengan centroid

Kelompokkan dengan centroid terdekat

Hitung centroid baru

F Centroid tetap?

T

Menghitung akurasi

Gambar 3. 1 Diagram Blok Penelitian Secara Umum

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 24

3.2. Data Preprocessing atau Pembuatan Data

Dalam penelitian ini, format lagu daerah yang digunakan adalah

MIDI yang berformat .wav dengan jumlah lagu daerah sebanyak 30 lagu

dari 3 pulau di Indonesia yaitu Sumatera, Jawa dan Maluku. Panjang data

maksimal 60s, sampling rate 44000Hz, 16 bits. Data diproses dengan

menggunakan algoritma MFCC (Mel - Frekuensi Cepstral Coefisien)

dengan menggunakan aplikasi jAudio. MFCC merupakan algoritma yang

banyak digunakan untuk speech processing dan music retrieval berbasis

timbral. Output dari aplikasi jAudio adalah merupakan data numerik

berformat .txt. jAudio memproses semua lagu daerah dengan

menggunakan algoritma MFCC dan menghasilkan 13 koefisien pada setiap

lagu daerah tersebut. Gambar 3.2 ini merupakan output dari jAudio.

Gambar 3. 2 Output jAudio

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 25

Setelah output dari jAudio didapatkan, kemudian data tersebut disimpan

dalam Microsoft Excel untuk disimpan lagi dalam database. Gambar 3.3

merupakan tabel database hasil preprocessing menggunakan jAudio.

Gambar 3. 3 Database Hasil jAudio

3.3. Proses Clustering

Pada tahap clustering akan menggunakan algoritma K-Means.

Setelah data di proses ekstraksi fitur, maka data yang siap diolah

dimasukan ke dalam database. Kemudian data tersebut dihitung

menggunakan algoritma K-Means untuk mendapatkan cluster dari setiap

lagu daerah. Gambar 3.4 di bawah menunjukkan proses dari clustering

menggunakan algoritma K-Means.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 26

Data siap diolah

Tentukan 3 centroid awal

Hitung jarak semua data dengan centroid

Kelompokkan data dengan centroid terdekat

Hitung centroid baru

F Centroid tetap?

T

Cluster Final

Gambar 3. 4 Diagram Blok Proses Clustering dengan Algoritma K-Means

3.4. Proses Pengujian

Dalam penelitian ini, pengujian akurasi dilakukan berdasarkan nilai

precision tertinggi dari perbandingan cluster prediksi dengan actual

cluster. Precision adalah jumlah kelompok dokumen relevan dari total

jumlah dokumen yang ditemukan oleh sistem (Hardi, 2006: 22). Precision

juga merupakan cara mengukur tingkat efektivitas sistem information

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 27

retrieval. Pengukuran tingkat ketepatan (precision) dalam kegiatan

penelusuran menurut Hasugian (2006: 5):

Jumlah dokumen relevan yang terambil Precision = Jumlah dokumen yang terambil dalam pencarian

Langkah - langkah dalam pengujian akurasi adalah sebagai berikut

1. Bandingkan cluster prediksi dengan actual cluster semua lagu daerah.

2. Hitung bobot dari semua perbandingan cluster prediksi dengan actual

cluster.

3. Hitung nilai precision setiap perbandingan cluster berdasarkan bobot

dari perbandingan cluster prediksi dengan actual cluster.

4. Pilih cluster berdasarkan nilai precision yang tertinggi.

5. Hitung bobot cluster yang dipilih berdasarkan nilai precision

tertinggi.

6. Hitung akurasi berdasarkan jumlah bobot cluster.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 28

3.5. Spesifikasi Hardware dan Software

Berikut adalah spesifikasi hardware dan software yang digunakan

dalam penelitian ini.

3.5.1. Hardware

1. Processor : Intel(R) Core(TM) i7-2630QM CPU @ 2.00 GHz

2. Memory (RAM) : 8.00 GB

3. System type : 64-bit Operating System

3.5.2. Software

1. Windows 7 Home Premium

2. jAudio (McEnnis, Daniel, Ichiro Fujinaga, Cory McKay,

Philippe DePalle. 2005)

3. Netbeans IDE 8.0.1

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 29

BAB IV

ANALISIS DAN IMPLEMENTASI PENELITIAN

Pada bab ini akan dijelaskan tentang implementasi penelitian.

4.1. Implementasi menentukan centroid awal

Pada langkah menentukan centroid awal, centroid diambil

berdasarkan id dari lagu daerah. Setelah id dari lagu daerah dipilih, maka

data fitur diambil berdasarkan id dari lagu daerah tersebut. Berikut ini

merupakan list code untuk menentukan centroid awal.

void setCentroidAwal(int[] idCentroid) { //method yang

digunakan untuk menentukan centroid awal berdasarkan id

centroid

centroid = new double[idCentroid.length][fitur.size()];

for (int i = 0; i < idCentroid.length; i++) {

for (int j = 0; j < fitur.size(); j++) {

centroid[i][j] = ((Double[])

fitur.get(j))[idCentroid[i]];

}

}

cluster = new int[((Double[]) fitur.get(0)).length];

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 30

System.out.println("");

}

Gambar 4. 1 Menentukan Centroid Awal

4.2. Implementasi clustering dengan metode K-Means

Program akan memproses algoritma K-Means dengan metode

proses. Data yang akan diolah dalam metode proses diambil dari database.

Berikut ini merupakan list code algortma K-Means.

void proses() throws SQLException {

int[] clusterLama = new int[((Double[])

fitur.get(0)).length];

int iterasi = 0;

List judul_musik =

DatabaseControl.getDatabaseControl().getJudulMusik();

String[] judul = judul_musik.toArray(new

String[judul_musik.size()]);

do {

iterasi++;

System.out.println("Iterasi ke - " + iterasi);

System.out.println("");

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 31

for (int i = 0; i < centroid.length; i++) {

for (int j = 0; j < centroid[i].length; j++) {

System.out.print(centroid[i][j] + " ");

}

System.out.println("");

}

System.out.println("");

System.arraycopy(cluster, 0, clusterLama, 0,

clusterLama.length);

for (int i = 0; i < ((Double[]) fitur.get(0)).length;

i++) {

double[] distance = new double[centroid.length];

for (int j = 0; j < distance.length; j++) {

distance[j] = 0.0;

for (int k = 0; k < fitur.size(); k++) {

distance[j] +=

Math.pow(((Double[])fitur.get(k))[i] - centroid[j][k],

2);//euclidian distance

//distance[j] += Math.abs(((Double[])

fitur.get(k))[i] - centroid[j][k]);//manhattan

}

distance[j] = Math.sqrt(distance[j]);

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 32

System.out.print(distance[j]+" ");

}

System.out.println("");

int indexMin = 0;

for (int j = 1; j < distance.length; j++) {

if (distance[j] < distance[indexMin]) {

indexMin = j;

}

}

cluster[i] = indexMin + 1;

}

System.out.println("");

System.out.println("CLUSTER");

System.out.println("------

------");

for (int i = 0; i < centroid.length; i++) {

int jumData = 0;

double[] newCentroid = new double[fitur.size()];

for (int j = 0; j < ((Double[]) fitur.get(0)).length;

j++) {

if (cluster[j] == i + 1) {

jumData++;

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 33

for (int k = 0; k < newCentroid.length; k++)

{

newCentroid[k] += ((Double[])

fitur.get(k))[j];

}

}

}

for (int j = 0; j < newCentroid.length; j++) {

newCentroid[j] = newCentroid[j] / jumData;

}

centroid[i] = newCentroid;

}

for (int i = 0; i < cluster.length; i++) {

System.out.println(judul[i] +" = "+ cluster[i]);

}

System.out.println("");

} while (!checkCluster(clusterLama));

}

boolean checkCluster(int[] clusterLama) {

boolean sama = true;

for (int i = 0; i < clusterLama.length; i++) {

if (cluster[i] != clusterLama[i]) {

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 34

sama = false;

break;

}

}

return sama;

}

public int[] getCluster() {

return cluster;

}

}

Gambar 4. 2 Clustering dengan K-Means

4.3. Implementasi pengujian akurasi berdasarkan nilai precision tertinggi.

Langkah terakhir dalam penelitian ini adalah pengujian akurasi.

Pengujian akurasi dalam penelitian ini menggunakan nilai precision

tertinggi dari perbandingan predicted cluster dengan actual cluster.

Berikut ini merupakan list code untuk pengujian akurasi berdasarkan nilai

precision tertinggi.

public void Uji_Precision(int[] pred, int[] act, int centroid) {

int[][] precision = new int[centroid][centroid];

int[] totBaris = new int[centroid];

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 35

for (int i = 0; i < pred.length; i++) {

precision[pred[i] - 1][act[i] - 1]++;

totBaris[pred[i] - 1]++;

}

float[][] prec = new float[centroid][centroid];

for (int i = 0; i < prec.length; i++) {

float[] persen1 = prec[i];

for (int j = 0; j < persen1.length; j++) {

prec[i][j] = ((float) precision[i][j]) / totBaris[i];

}

}

System.out.println("Precision Setiap Perbandingan

Cluster");

for (int i = 0; i < precision.length; i++) {

int[] cm1 = precision[i];

for (int j = 0; j < cm1.length; j++) {

int d = cm1[j];

// System.out.print(d+" ");

System.out.print(prec[i][j] + " ");

}

// System.out.println(totBaris[i]);

System.out.println(" ");

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 36

}

ArrayList arr1 = new ArrayList();

ArrayList arr2 = new ArrayList();

for (int i = 0; i < centroid; i++) {

int indexMax1 = 0;

int indexMax2 = 0;

float max = -1;

for (int j = 0; j < centroid; j++) {

if (arr1.contains(j)) {

continue;

}

for (int k = 0; k < centroid; k++) {

if (arr2.contains(k)) {

continue;

}

if (prec[j][k] > max) {

indexMax1 = j;

indexMax2 = k;

max = prec[j][k];

}

}

}

arr1.add(indexMax1);

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 37

arr2.add(indexMax2);

}

int jumBenar = 0;

float akurasi = 0;

System.out.println(" ");

System.out.println("Cluster yang diambil berdasarkan

precision tertinggi");

for (int i = 0; i < arr1.size(); i++) {

System.out.println((arr1.get(i) + 1) + " -> " +

(arr2.get(i) + 1 + " "));

jumBenar += precision[arr1.get(i)][arr2.get(i)];

}

int tot = 0;

for (int i = 0; i < totBaris.length; i++) {

tot += totBaris[i];

}

System.out.println("");

System.out.println("Jumlah Benar = " + jumBenar);

System.out.println("Akurasi = " + ((float)

jumBenar) / tot * 100 + "%");

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 38

}

Gambar 4. 3 Pengujian Akurasi

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 39

BAB V

HASIL DAN PEMBAHASAN

Hal yang utama dalam pembahasan bab ini adalah analisa hasil tingkat akurasi dari pengujian algoritma k-means clustering dalam mengelompokkan lagu daerah berdasarkan pulau asalnya. Pengujian tingkat akurasi dilakukan dengan melibatkan centroid yang dipilih, banyaknya iterasi, nilai precision tertinggi dan bobot cluster yang diambil berdasarkan nilai precision tertinggi.

5.1. Hasil Pengukuran

Hasil pengukuran didapatkan dengan mencocokan hasil cluster

prediksi yang dilakukan oleh sistem dengan actual cluster yang telah

ditetapkan oleh penguji berdasarkan manual book dengan cara inisialisasi.

Inisialisasi dilakukan untuk mempermudah peneliti dalam

membandingkan cluster prediksi dengan actual cluster. Dibawah ini

merupakan tabel inisialisasi cluster tiap pulau.

Tabel 5. 1 Inisialisasi Cluster Tiap Pulau

Pulau Inisialisasi Cluster Sumatra 1 Jawa 2 Maluku 3

Pada pengujian yang dilakukan, jumlah data lagu daerah terdapat 30 lagu

dari 3 pulau. Setiap pulau diwakili oleh 10 lagu daerah. Dibawah ini

merupakan tabel lagu daerah yang digunakan dalam penelitian ini

beserta inisialisasi pulau.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 40

Tabel 5. 2 Lagu Daerah dengan Actual Cluster 1

JUDUL Actual Bungong Jeumpa.wav 1 Dodoi Si Dodoi.wav 1 Gelang Sipaku Gelang.wav 1 Kampuang Nan Jauh Dimato.wav 1

Lancang Kuning.wav 1 Lisoi.wav 1 Na Sonang Do Hita Nadua.wav 1 Opio.wav 1 Sinanggar Tulo.wav 1 Soleram.wav 1

Tabel 5. 3 Lagu Daerah dengan Actual Cluster 2

JUDUL Actual Bubuy Bulan.wav 2 Cublak - Cublak Suweng.wav 2 Es Lilin.wav 2 Gambang Suling.wav 2 Gundul - Gundul Pacul.wav 2 Jaranan.wav 2 Peuyeum Bandung.wav 2 Suwe Ora Jamu.wav 2 Tokecang.wav 2 Warung Pojok.wav 2

Tabel 5. 4 Lagu Daerah dengan Actual Cluster 3

JUDUL Actual Ayo Mama.wav 3 Buka Pintu.wav 3 Burung Kakak Tua.wav 3 Burung Tantina.wav 3 Hela Rotan.wav 3 Naik - Naik Ke Puncak Gunung.wav 3 Nona Manis Siapa Yang Punya.wav 3 Rasa Sayange.wav 3 Sari Nande.wav 3 Waktu Hujan Sore - Sore.wav 3

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 41

5.2. Skenario Pengujian

Di bawah ini merupakan langkah - langkah pengujian

menggunakan centroid awal lagu Bungong Jeumpa, Gundul – Gundul

Pacul dan Waktu Hujan Sore - Sore :

1. Bandingkan predicted cluster dengan actual cluster semua lagu daerah.

Tabel dibawah merupakan tabel perbandingan antara predicted cluster

dengan actual cluster dari semua lagu daerah.

Tabel 5. 5 Perbandingan Cluster

JUDUL Predicted Actual Ayo Mama.wav 3 3 Bubuy Bulan.wav 2 2 Buka Pintu.wav 1 3 Bungong Jeumpa.wav 1 1 Burung Kakak Tua.wav 1 3 Burung Tantina.wav 3 3 Cublak - Cublak Suweng.wav 3 2 Dodoi Si Dodoi.wav 1 1 Es Lilin.wav 2 2 Gambang Suling.wav 1 2 Gelang Sipaku Gelang.wav 3 1 Gundul - Gundul Pacul.wav 2 2 Hela Rotan.wav 3 3 Jaranan.wav 2 2 Kampuang Nan Jauh Dimato.wav 1 1 Lancang Kuning.wav 2 1 Lisoi.wav 3 1 Na Sonang Do Hita Nadua.wav 1 1 Naik - Naik Ke Puncak Gunung.wav 1 3 Nona Manis Siapa Yang Punya.wav 3 3 Opio.wav 1 1 Peuyeum Bandung.wav 3 2 Rasa Sayange.wav 1 3 Sari Nande.wav 3 3

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 42

Sinanggar Tulo.wav 2 1 Soleram.wav 1 1 Suwe Ora Jamu.wav 1 2 Tokecang.wav 3 2 Waktu Hujan Sore - Sore.wav 3 3 Warung Pojok.wav 1 2

Dalam tabel perbandingan diatas, lagu Ayo Mama.wav diprediksi oleh

algoritma K-Means masuk ke dalam cluster 3 dan menurut sumbernya

(actual cluster) lagu tersebut masuk ke dalam cluster 3. Lagu Buka

Pintu.wav diprediksi oleh algoritma K-Means masuk ke dalam cluster 1,

sedangkan menurut sumbernya (actual cluster) lagu tersebut masuk ke

dalam cluster 3.

2. Hitung bobot dari semua perbandingan predicted cluster dengan actual

cluster. Tabel dibawah ini merupakan tabel pembobotan dari hasil

perbandingan cluster.

Tabel 5. 6 Bobot Perbandingan Predicted Cluster dengan Actual Cluster

Cluster Bobot Actual Predicted 1 1 6 2 1 3 3 1 4

Cluster Bobot Actual Predicted 1 2 2 2 2 4 3 2 0

Cluster Bobot Actual Predicted

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 43

1 3 2 2 3 3 3 3 6

Dari tabel pembobotan diatas, actual cluster 1 yang diprediksi oleh

algoritma K-Means sebagai cluster 1 berbobot 6. Actual cluster 2 yang

diprediksi oleh algoritma K-Means sebagai cluster 1 berbobot 3.

Actual cluster 3 yang diprediksi oleh algoritma K-Means

3. Hitung nilai precision setiap perbandingan cluster berdasarkan bobot

dari perbandingan predicted cluster dengan actual cluster. Tabel di

bawah merupakan tabel nilai precision.

Tabel 5. 7 Precision Perbandingan Predicted Cluster dengan Actual Cluster

Cluster Bobot Precision Actual Predicted 1 1 6 0.4615 2 1 3 0.2308 3 1 4 0.3077

Cluster Bobot Precision Actual Predicted 1 2 2 0.3333 2 2 4 0.6667 3 2 0 0

Cluster Bobot Precision Actual Predicted 1 3 2 0.1818 2 3 3 0.2727 3 3 6 0.5455

Pada tabel diatas nilai precision dihitung dengan menggunakan

persamaan:

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 44

Bobot tiap cluster Precision = Jumlah total bobot cluster

Actual cluster 1 yang diprediksi oleh algoritma K-Means sebagai

cluster 1 berbobot 6 dengan nilai precision 0.4615.

Actual cluster 2 yang diprediksi oleh algoritma K-Means sebagai

cluster 1 berbobot 3 dengan nilai precision 0.2308.

Actual cluster 3 yang diprediksi oleh algoritma K-Means sebagai

cluster 1 berbobot 4 dengan nilai precision 0.3077.

Actual cluster 1 yang diprediksi oleh algoritma K-Means sebagai

cluster 2 berbobot 2 dengan nilai precision 0.3333.

Actual cluster 2 yang diprediksi oleh algoritma K-Means sebagai

cluster 2 berbobot 4 dengan nilai precision 0.6667.

Actual cluster 3 yang diprediksi oleh algoritma K-Means sebagai

cluster 2 berbobot 0 dengan nilai precision 0.

Actual cluster 1 yang diprediksi oleh algoritma K-Means sebagai

cluster 3 berbobot 2 dengan nilai precision 0.1818.

Actual cluster 2 yang diprediksi oleh algoritma K-Means sebagai

cluster 3 berbobot 3 dengan nilai precision 0.2727.

Actual cluster 3 yang diprediksi oleh algoritma K-Means sebagai

cluster 3 berbobot 6 dengan nilai precision 0.5455.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 45

4. Pilih cluster berdasarkan nilai precision yang tertinggi.

Tabel 5. 8 Precision Tertinggi Perbandingan Predicted dengan Actual Cluster

Cluster Bobot Precision Actual Predicted 2 2 4 0.6667 3 3 6 0.5455 1 1 6 0.4615

Berdasarkan tabel diatas cluster dengan precision tertinggi

yang pertama terdapat pada actual cluster 2 dan predicted cluster 2

dengan bobot 4 dan precision 0.6667. Cluster dengan precision

tertinggi yang kedua terdapat pada actual cluster 3 dan predicted

cluster 3 dengan bobot 6 dan precision 0.5455. Dan cluster dengan

precision tertinggi yang terakhir terdapat pada actual cluster 1 dan

predicted cluster 1 dengan bobot 6 dan precision 0.4615.

5. Hitung total bobot cluster yang dipilih berdasarkan nilai precision

tertinggi. Total bobot cluster merupakan jumlah dari ketiga bobot yang

diambil berdasarkan precision tertinggi. Total bobot cluster dapat

dilihat pada tabel 5.9.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 46

Tabel 5. 9 Total Bobot Perbandingan Predicted Cluster dengan Actual Cluster berdasarkan Precision Tertinggi

Cluster Precision Bobot Actual Predicted 2 2 0.6667 4 3 3 0.5455 6 1 1 0.4615 6 Total Bobot Cluster 16

6. Hitung akurasi berdasarkan jumlah bobot cluster. Akurasi didapatkan

dengan rumus :

Total Bobot Akurasi = x 100 % Total Data

Jadi, pada percobaan pertama ini akurasi yang didapatkan adalah

53.33%. Dengan perhitungannya sebagai berikut

16 Akurasi = x 100 % 30

Hasil dapat dilihat pada tabel 5.10 dibawah ini.

Tabel 5. 10 Akurasi berdasarkan Precision Tertinggi

Cluster Precision Bobot Actual Predicted 2 2 0.6667 4 3 3 0.5455 6 1 1 0.4615 6 Total Bobot Cluster 16 Akurasi 53.33333

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 47

5.3. Analisa Hasil

Berdasarkan pengujian yang telah dilakukan sebanyak 30 kali,

tingkat akurasi dari berbagai centroid awal menghasilkan tingkat akurasi

terendah yaitu 46.67% dan akurasi tertinggi adalah 53.33%. Hasil

pengujian akurasi dapat dilihat pada tabel 5.11 dibawah ini.

Tabel 5. 11 Hasil Pengujian Akurasi

Tingkat Pengujian Centroid Awal Akurasi Bungong Jeumpa 1 Gundul - Gundul Pacul 53.33% Waktu Hujan Sore - Sore Bungong Jeumpa 2 Cublak - Cublak Suweng 53.33% Naik - Naik Ke Puncak Gunung Burung Kakak Tua 3 Gundul - Gundul Pacul 46.67% Soleram Kampuang Nan Jauh Dimato 4 Bubuy Bulan 46.67% Ayo Mama Dodoi Si Dodoi 5 Gambang Suling 46.67% Naik - Naik Ke Puncak Gunung Bungong Jeumpa 6 Bubuy Bulan 53.33% Ayo Mama Bungong Jeumpa 7 Cublak - Cublak Suweng 53.33% Buka Pintu Bungong Jeumpa 8 Es Lilin 46.67% Burung Kakak Tua Bungong Jeumpa 9 Gambang Suling 53.33% Burung Tantina Bungong Jeumpa 10 53.33% Gundul - Gundul Pacul

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 48

Hela Rotan Bungong Jeumpa 11 Jaranan 46.67% Naik - Naik Ke Puncak Gunung Bungong Jeumpa 12 Peuyeum Bandung 53.33% Nona Manis Siapa Yang Punya Bungong Jeumpa 13 Suwe Ora Jamu 53.33% Rasa Sayange Bungong Jeumpa 14 Tokecang 53.33% Sari Nande Bungong Jeumpa 15 Warung Pojok 53.33% Waktu Hujan Sore - Sore Dodoi Si Dodoi 16 Bubuy Bulan 46.67% Ayo Mama Dodoi Si Dodoi 17 Cublak - Cublak suweng 53.33% Buka Pintu Gelang Sipaku Gilang 18 Es Lilin 53.33% Burung Kakak Tua Gelang Sipaku Gilang 19 Gambang Suling 53.33% Burung Tantina Kampuang Nan Jauh Dimato 20 Gundul - Gundul Pacul 53.33% Hela Rotan Kampuang Nan Jauh Dimato 21 Jaranan 46.67% Naik - Naik Ke Puncak Gunung Lancang Kuning 22 Peuyeum Bandung 46.67% Nona Manis Siapa Yang Punya Lancang Kuning 23 Suwe Ora Jamu 46.67% Rasa Sayange Lisoi 24 Tokecang 53.33% Sari Nande

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 49

Lisoi 25 Warung Pojok 53.33% Waktu Hujan Sore - Sore Na Sonang Do Hita Nadua 26 Bubuy Bulan 46.67% Ayo Mama Na Sonang Do Hita Nadua 27 Cublak - Cublak Suweng 53.33% Buka Pintu Opio 28 Es lilin 46.67% Burung Kakak Tua Opio 29 Gambang Suling 46.67% Burung Tantina Sinagar Tulo 30 Gundul - Gundul Pacul 46.67% Hela Rotan

Dari tabel 5.11 diatas menghasilkan akurasi rata - rata, yaitu

sebesar 50.44%.

5.3.1. Kesalahan Pengelompokkan Lagu Daerah

Dalam penelitian ini, pengelompokkan lagu daerah menjadi

hal yang diutamakan. Kesesuaian lagu daerah berdasarkan pulau

asal diteliti dengan menggunakan metode K-Means. Dengan kata

lain, akan ada beberapa lagu daerah yang masuk ke dalam cluster

yang sesuai atau bahkan tidak sesuai.

Dalam 30 pengujian terdapat lagu daerah dengan tingkat

akurasi kebenaran yang sangat rendah. Hal ini dibuktikan dalam

tabel 5.12

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 50

Tabel 5. 12 Tabel Persentase Lagu

Jumlah Persentase JUDUL Benar Salah Benar Salah Ayo Mama 19 11 63% 37% Bubuy Bulan 21 9 70% 30% Buka Pintu 9 21 30% 70% Bungong Jeumpa 14 16 47% 53% Burung Kakak Tua 9 21 30% 70% Burung Tantina 19 11 63% 37% Cublak - Cublak Suweng 4 26 13% 87% Dodoi Si Dodoi 16 14 53% 47% Es Lilin 14 16 47% 53% Gambang Suling 5 25 17% 83% Gelang Sipaku Gelang 7 23 23% 77% Gundul - Gundul Pacul 14 16 47% 53% Hela Rotan 19 11 63% 37% Jaranan 14 16 47% 53% Kampuang Nan Jauh Dimato 16 14 53% 47% Lancang Kuning 7 23 23% 77% Lisoi 7 23 23% 77% Na Sonang Do Hita Nadua 16 14 53% 47% Naik - Naik Ke Puncak Gunung 9 21 30% 70% Nona Manis Siapa Yang Punya 19 11 63% 37% Opio 16 14 53% 47% Peuyeum Bandung 4 26 13% 87% Rasa Sayange 9 21 30% 70% Sari Nande 19 11 63% 37% Sinanggar Tulo 7 23 23% 77% Soleram 16 14 53% 47% Suwe Ora Jamu 5 25 17% 83% Tokecang 4 26 13% 87% Waktu Hujan Sore - Sore 19 11 63% 37% Warung Pojok 5 25 17% 83%

Berdasarkan tabel 5.12 maka dihasilkan tabel lagu daerah

dengan tingkat persentase kesalahan, yaitu tabel 5.13 dibawah ini.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 51

Tabel 5. 13 Tabel Persentase Kesalahan

Persentase JUDUL Kesalahan Cublak - Cublak Suweng 87% Peuyeum Bandung 87% Tokecang 87% Gambang Suling 83% Suwe Ora Jamu 83% Warung Pojok 83% Gelang Sipaku Gelang 77% Lancang Kuning 77% Lisoi 77% Sinanggar Tulo 77% Buka Pintu 70% Burung Kakak Tua 70% Naik - Naik Ke Puncak Gunung 70% Rasa Sayange 70% Bungong Jeumpa 53% Es Lilin 53% Gundul - Gundul Pacul 53% Jaranan 53% Dodoi Si Dodoi 47% Kampuang Nan Jauh Dimato 47% Na Sonang Do Hita Nadua 47% Opio 47% Soleram 47% Ayo Mama 37% Burung Tantina 37% Hela Rotan 37% Nona Manis Siapa Yang Punya 37% Sari Nande 37% Waktu Hujan Sore - Sore 37% Bubuy Bulan 30%

Pada tabel 5.13 lagu daerah Pulau Jawa yaitu Cublak –

Cublek Suweng termasuk dalam lagu daerah dengan tingkat

persentase kesalahan paling tinggi. Dalam 30 percobaan, lagu

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 52

Cublak – Cublak Suweng 26 kali tidak sesuai dengan cluster yang

seharusnya, dengan persentase kesalahan mencapai 87%.

5.3.2. Penentuan Centroid Awal

Dalam algoritma K-Means pengambilan centroid awal

sangat berpengaruh dalam pengelompokkan lagu - lagu daerah.

Dalam penelitian ini, pengambilan centroid awal dilakukan secara

random. Kelemahan dari metode penentuan centroid awal secara

random adalah hasil yang dapat berubah - ubah dan sulit untuk

mencapai global optimum. Berdasarkan tabel 5.11 salah satu

pengaruh tinggi rendahnya tingkat akurasi adalah pengambilan

centroid awal. Tabel 5.14 dibawah ini merupakan tabel tingkat

akurasi tiap pulau.

Tabel 5. 14 Akurasi Tiap Pulau

Tingkat Akurasi Pengujian Centroid Awal Sumatera Jawa Maluku Bungong Jeumpa 1 Gundul - Gundul Pacul 46.15% 66.66% 54.55% Waktu Hujan Sore - Sore Bungong Jeumpa 2 Cublak - Cublak Suweng 46.15% 27.27% 0.00% Naik - Naik Ke Puncak Gunung Burung Kakak Tua 3 Gundul - Gundul Pacul 37.50% 33.33% 54.54% Soleram Kampuang Nan Jauh Dimato 4 Bubuy Bulan 37.50% 33.33% 54.54% Ayo Mama Dodoi Si Dodoi 5 33.33% 33.33% 50.00% Gambang Suling

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 53

Naik - Naik Ke Puncak Gunung Bungong Jeumpa 6 Bubuy Bulan 46.15% 66.66% 54.54% Ayo Mama Bungong Jeumpa 7 Cublak - Cublak Suweng 46.15% 27.27% 0.00% Buka Pintu Bungong Jeumpa 8 Es Lilin 18.18% 33.33% 25.00% Burung Kakak Tua Bungong Jeumpa 9 Gambang Suling 46.15% 66.66% 54.54% Burung Tantina Bungong Jeumpa 10 Gundul - Gundul Pacul 46.15% 66.66% 54.54% Hela Rotan Bungong Jeumpa 11 Jaranan 18.18% 33.33% 25.00% Naik - Naik Ke Puncak Gunung Bungong Jeumpa 12 Peuyeum Bandung 33.33% 23.07% 54.54% Nona Manis Siapa Yang Punya Bungong Jeumpa 13 Suwe Ora Jamu 18.18% 66.66% 30.76% Rasa Sayange Bungong Jeumpa 14 Tokecang 33.33% 23.07% 54.54% Sari Nande Bungong Jeumpa 15 Warung Pojok 46.15% 66.66% 54.54% Waktu Hujan Sore - Sore Dodoi Si Dodoi 16 Bubuy Bulan 37.50% 33.33% 54.54% Ayo Mama Dodoi Si Dodoi 17 Cublak - Cublak suweng 33.33% 27.27% 30.76% Buka Pintu Gelang Sipaku Gilang 18 Es Lilin 18.18% 66.66% 30.76% Burung Kakak Tua

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 54

Gelang Sipaku Gilang 19 Gambang Suling 46.15% 66.66% 54.54% Burung Tantina Kampuang Nan Jauh Dimato 20 Gundul - Gundul Pacul 46.15% 66.66% 54.54% Hela Rotan Kampuang Nan Jauh Dimato 21 Jaranan 18.18% 33.33% 25.00% Naik - Naik Ke Puncak Gunung Lancang Kuning 22 Peuyeum Bandung 66.66% 37.50% 54.54% Nona Manis Siapa Yang Punya Lancang Kuning 23 Suwe Ora Jamu 66.66% 40.00% 50.00% Rasa Sayange Lisoi 24 Tokecang 18.18% 66.66% 30.76% Sari Nande Lisoi 25 Warung Pojok 18.18% 66.66% 30.76% Waktu Hujan Sore - Sore Na Sonang Do Hita Nadua 26 Bubuy Bulan 37.50% 33.33% 54.54% Ayo Mama Na Sonang Do Hita Nadua 27 Cublak - Cublak Suweng 33.33% 27.27% 30.76% Buka Pintu Opio 28 Es lilin 33.33% 33.33% 50.00% Burung Kakak Tua Opio 29 Gambang Suling 37.50% 33.33% 54.54% Burung Tantina Sinagar Tulo 30 Gundul - Gundul Pacul 66.66% 40.00% 50.00% Hela Rotan

Rata - Rata 37.67% 44.64% 42.59%

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 55

Berdasarkan Tabel 5.12 centroid awal yang digunakan sangat

berpengaruh terhadap tingkat akurasi. Pada percobaan 1, lagu Gundul –

Gundul Pacul merupakan centroid awal yang akurasinya tinggi, yaitu

66.66% dibandingkan 2 centroid lainnya. Pada percobaan 3, lagu Gundul –

Gundul Pacul merupakan centroid awal yang akurasi paling rendah, yaitu

33.33% dibandingkan 2 centroid lainnya. Dari 30 percobaan diatas, kita

biasa mengetahui bahwa pengambilan centroid awal sangat berpengaruh

terhadap akurasi, dan tidak ada jaminan bahwa hasil yang diperoleh akan

selalu optimal.

Berdasarkan dari data tersebut, maka penelitian ini menghasilkan

tingkat akurasi rata – rata tiap pulau :

1. Pulau Sumatera akurasi rata – ratanya adalah 37.67%.

2. Pulau Jawa akurasi rata – ratanya adalah 44.64%.

3. Pulau Maluku akurasi rata – ratanya adalah 42.59%.

5.3.3. Karakteristik Lagu dan MFCC

Dalam MFCC, terdapat beberapa hal yang perlu diperhatikan,

antara lain adalah: kunci yang digunakan beserta perpindahannya dan

tempo lagu (Tom LH. Li and Antoni B. Chan, 2011). Kedua hal tersebut

sangat berpengaruh terhadap hasil akurasi. Apabila hal tersebut tidak

diperhatikan, maka kita akan kehilangan beberapa informasi dari sumber

data tersebut.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 56

Fitur yang dihasilkan oleh MFCC adalah fitur yang berbasis

timbral, dengan kata lain untuk membedakan lagu daerah tersebut adalah

berdasarkan instrumennya atau alat musik yang digunakan (Tom LH. Li

and Antoni B. Chan, 2011). Instrumen yang digunakan dalam membuat

lagu daerah tiap daerah berbeda – beda. Berikut ini adalah instrumen yang

paling banyak digunakan dalam pembuatan lagu daerah :

1. Lagu daerah yang berasal dari pulau Sumatera sebagian besar

menggunakan instrumen biola, rebana, seruling dan gendang.

2. Lagu daerah yang berasal dari pulau Jawa sebagian besar

menggunakan instrumen berbagai macam jenis gamelan.

3. Lagu daerah yang berasal dari pulau Maluku sebagian besar

menggunakan instrumen berbagai macam jenis tifa dan .

Dalam penelitian ini, instrumen lagu daerah banyak tidak

menggunakan alat musik tradisional sehingga karakter lagu daerah kurang

akurat. Selain itu, lagu daerah yang digunakan rata – rata menggunakan

kunci dan perpindahan kunci yang hampir sama pada semua lagu daerah.

Rata- rata tempo yang digunakan pada setiap lagu daerah dalam penelitian

ini juga hampir sama dan seharusnya tempo lagu daerah dari tiap pulau

sangatlah berbeda. Hal tersebut menyebabkan MFCC kesulitan untuk

mencari karakter lagu daerah yang sesuai dengan pulau asalnya.

Untuk membuktikan bahwa perpindahan kunci, tempo dan

instrumen yang digunakan sangat penting, peneliti juga melakukan

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 57

percobaan dengan menggunakan program yang sama untuk

pengelompokkan lagu berdasarkan genre dengan inisialisasi genre lagu

seperti pada tabel 5.15 berikut ini.

Tabel 5. 15 Tabel Inisialisasi Genre Lagu

Genre Inisialisasi Lagu Cluster Pop 1 Rock 2 3

Contoh lagu dan genre yang digunakan dalam percobaan, terdapat

pada tabel 5.16 dibawah ini.

Tabel 5. 16 Tabel Judul dan Genre Lagu

Genre Judul Lagu Lagu Sewindu Pop Gajah Pop Teman Hidup Pop Almost Easy Rock Critical Acclaim Rock Bat Country Rock Bahtera Cinta Dangdut Judi Dangdut Puing - Puing Dangdut

Genre pop memiliki karakter musik yang perpindahan kunci

konsisten, musik ringan dan tempo sedang. Genre rock memiliki karakter

musik yang perpindahan kunci cepat, musik dan tempo cepat. Genre

dangdut memiliki karakter musik yang perpindahan kunci cepat, musik

mendayu – dayu dan tempo lumayan cepat.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 58

Dalam percobaan ini, peneliti melakukan 3 kali percobaan dengan

menggunakan centroid awal random / acak, dihasilkan tingkat akurasi

yang terdapat pada tabel 5.17 berikut.

Tabel 5. 17 Tabel Akurasi Berdasarkan Genre

Centroid Tingkat Pengujian Awal Akurasi Sewindu 1 Almost Easy 88.89% Bahtera Cinta Gajah 2 Bat Country 88.89% Judi Teman Hidup 3 Almost Easy 88.89% Puing - Puing

Dari tabel 5.17 diatas dapat disimpulkan bahwa MFCC dapat

digunakan untuk mengambil karakteristik suatu lagu berdasarkan genre.

Tingkat akurasi yang dihasilkan menjadi sangat baik, hal ini dipengaruhi

oleh lagu yang jelas karakteristiknya dari setiap genre. Selain itu,

perpindahan kunci dan tempo dari genre setiap lagu sangat berpengaruh

terhadap hasil MFCC (Tom LH. Li and Antoni B. Chan, 2011). Semakin

kuat karakterisitik suatu lagu setiap genre akan menghasilkan tingkat

akurasi yang semakin tinggi juga.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 59

BAB VI

KESIMPULAN DAN SARAN

Bagian ini memberikan kesimpulan dan saran berdasarkan hasil penelitian yang telah dilakukan.

6.1. Kesimpulan

Melalui penelitian yang dilakukan, dapat disimpulkan bahwa :

1. Dalam penelitian ini, pengelompokkan lagu daerah menggunakan fitur

MFCC dengan jAudio dan clustering dengan metode K-Means dapat

menghasilkan tingkat akurasi rata – rata keseluruhan sebesar 50.44%.

2. Tingkat akurasi rata – rata pengelompokkan lagu daerah tiap pulau

yang dihasilkan oleh metode K-Means adalah 37.67% untuk Sumatera,

44.67% untuk Jawa dan 42.59% untuk Maluku.

3. Pengambilan centroid awal secara random sangat berpengaruh

terhadap tingkat akurasi, selain itu dengan metode pengambilan

centroid awal secara random, sulit untuk mencapai global optimum

karena hasil yang berubah – ubah.

4. Metode yang digunakan untuk ekstrak fitur dalam penelitian ini adalah

MFCC. MFCC merupakan metode dalam music retrieval yang

berbasis timbral. Dalam penelitian ini, instrumen lagu daerah banyak

tidak menggunakan alat musik tradisional. Hal ini juga menyebabkan

MFCC kesulitan untuk mencari karakter lagu daerah yang sesuai

dengan pulau asalnya. Selain itu, data lagu daerah yang digunakan rata

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 60

– rata menggunakan kunci dan perpindahan kunci yang hampir sama

pada semua lagu daerah. Rata- rata tempo yang digunakan pada setiap

lagu daerah dalam penelitian ini juga hampir sama dan seharusnya

tempo lagu daerah dari tiap pulau sangatlah berbeda. Hal – hal tersebut

sangat berpengaruh terhadap tingkat akurasi karena vektor hasil proses

ekstrak fitur dengan MFCC menjadi kurang baik. Semua hal tersebut

dibuktikan dengan percobaan yang dilakukan peneliti dengan

mengelompokkan lagu berdasarkan genre dengan hasil akurasi yang

lebih tinggi yaitu 88.89% karena karakteristik lagu, instrumen dan

tempo lagu yang sangat jelas perbedaannya dari setiap lagu

berdasarkan genrenya.

6.2. Saran

1. Data yang digunakan dapat menggunakan musik dengan tingkat detail

instrumen yang lebih tinggi daripada MIDI.

2. Disarankan lagu daerah yang dipakai sebagai sumber data benar –

benar menggunakan alat musik daerah asal, selain itu kunci dan

perpindahannya serta temponya benar – benar mencerminkan karakter

asal dari lagu daerah.

3. Disarankan memakai metode clustering selain K-Means dan

menggunakan metode music retrieval selain MFCC, karena metode

MFCC lebih tepat untuk speech dan speak recognition.

4. Jika memakai metode K-Means disarankan untuk memakai metode

untuk menentukan centroid awal agar hasilnya dapat lebih optimal.

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 61

DAFTAR PUSTAKA

A.T., Hartaris (2007) Seni Musik SMA Jilid 2.

Ali, Matius (2006) Seni Musik SMA Jilid 1, ISBN: 9797344096.

B. Logan. Mel Frequency Cepstral Coefficients for Music Modeling. 2000.

B. Logan and S. Chu. Music summarization using key phrases. In IEEE Conf. on

Acoustics, Speech and Signal Processing, (2000).

J. Schuermann “Pattern Classification: A Unified View of Statistical and Neural

Approaches”, Wiley&Sons, 1996, ISBN 0-471-13534-8.

MacQueen, J. B. (1967). Some Methods for classification and Analysis of

Multivariate Observations, Proceedings of 5-th Berkeley Symposium on

Mathematical Statistics and Probability, Berkeley, University of California Press,

1: 281-297.

McEnnis, Daniel, Ichiro Fujinaga, Cory McKay, Philippe DePalle. 2005. "JAudio:

A feature extraction library". ISMIR.

Osma L Zaiane, Eli Hagen, Jiawei Han, Word taxonomy for on-line visual Asset management and mining fourth international workshop on application of natural language to information system (NLDB'99).

PLAGIATPLAGIAT MERUPAKAN MERUPAKAN TINDAKAN TINDAKAN TIDAK TIDAK TERPUJI TERPUJI 62

Putra, Darma. Pengolahan Citra Digital, 2010.

Rabiner, L., and B. H. Juang. 1993. Fundamentals of speech recognition. Upper

Saddle River, NJ: Prentice-Hall.

Richard O. Duda, Peter E. Hart, David G. Stork (2001) “Pattern classification

(2nd edition)”, Wiley, New York, ISBN 0-471-05669-3.

Santosa, Budi, 2007, “Data Mining Teknik Pemanfaatan Data untuk Keperluan

Bisnis”, Graha Ilmu, Yogyakarta.

S. Russell and P. Norvig, Artificial Intelligence A Modern Approach. Upper

Saddle River, New Jersey 07458: Pearson Education, Inc., 3 ed., 2010.

Tom LH. Li and Antoni B. Chan. Genre Classification and The Variance of

MFCC to Key And Tempo, 2011.

W. Walker, P. Lamere, P. Kwok, B. Raj, E. Gouvea, P. Wolf, and J. Woelfel.

Sphinx-4: A Flexible Open Source Framework for Speech Recognition, 2004.

X. Wu and V. Kumar, eds., The Top Ten Algorithms in Data Mining.Chapman and Hall, 2009.

Zaiane. Introduction to Data Mining.1999