Implementasi Algoritma Convolutional Neural Network Pada Algoritma K-Means Untuk Kategorisasi Data Teks

Rakha Paleva Kawiswara, Farid Thalib

Abstract


Internet merupakan keberlanjutan dari pesatnya perkembangan teknologi komputer. Dalam kenyataannya pengguna internet menghasilkan banyak data, khususnya data berupa teks seperti posting pada social media dan artikel-artikel. Untuk itu, diperlukan kategorisasi data untuk mengelompokkan data teks yang memiliki kategori tertentu. Bag of Words merupakan algoritma yang dapat merepresentasikan kalimat menjadi vektor. Namun Bag of Words seringkali menghasilkan dimensi data atau jumlah fitur yang sangat tinggi, sehingga memerlukan daya komputasi yang sangat tinggi. Pendekatan untuk mengatasi masalah tersebut adalah pembuatan model yang dapat merepresentasikan kalimat menjadi vektor. Model yang menggunakan algoritma Convolutional Neural Network (ConvNet) dapat dipakai untuk mempelajari kalimat dalam data teks untuk merepresentasikan kalimat dalam bentuk vektor. Pelatihan dan pengujian model menggunakan empat data teks yaitu SMS Spam, Komentar Bully, Amazon Alexa Reviews, dan Large Movie Reviews. Hasil vektor kalimat menggunakan ConvNet lebih efisien dalam waktu latih dan waktu uji dibanding dengan representasi menggunakan Bag of Words. Hasil pengujian vektor kalimat ConvNet dengan pengukuran Fowlkes-Mallow Index untuk data teks SMS Spam adalah 0.738, untuk data teks komentar Bully adalah 0.735, untuk data teks Amazon Alexa Reviews adalah 0.908 dan untuk data teks Large Movie Reviews adalah 0.680.


Full Text:

PDF


DOI: https://doi.org/10.31479/jtek.v7i2.48

Refbacks

  • There are currently no refbacks.


View My Stats