Analisis Sentimen Data Provider Layanan Internet Pada Twitter Menggunakan Support Vector Machine Dengan Penambahan Algoritma Levenshtein Distance

  • Ida Bagus Nyoman Wijana Manuaba Universitas Pendidikan Ganesha
  • Gede Rasben Dantes Unversitas Pendidikan Ganesha
  • Gede Indrawan Unversitas Pendidikan Ganesha
Keywords: Analisis Sentimen, Support Vector Machine, Levenshtein Distance, Text Preprocessing, Classification

Abstract

Komentar pada data twitter mengandung banyak opini terkait suatu objek atau topik. Dari kumpulan komentar, dapat dilakukan analisis sentimen menggunakan Support Vector Machine untuk memperoleh hasil klasifikasi positif dan negatif. Data yang digunakan berkaitan dengan provider atau penyedia jaringan internet yang ada di Indonesia. Penambahan algoritma Levenshtein Distance pada tahap text preprocessing bertujuan untuk meningkatkan hasil klasifikasi. Tahapan Proses klasifikasi meliputi, pengumpulan data menggunakan API twitter, penghapusan duplicate data, pemberian label data, tahap text preprocessing (convert emoticon, cleansing, case folding, stemming, stopword removal, and tokenizing, penerapan algoritma Levenshtein Distance, stopword removal lanjutan, convert negation), feature extraction (TF-IDF), serta proses klasifikasi menggunakan Support Vector Machine.Hasil pengujian dengan menggunakan confusion matrix, menunjukan peningkatan hasil klasifikasi yang lebih baik setelah menggunakan algoritma Levenshtein Distance pada tahap text preprocessing. Nilai accuracy mengalami peningkatan sebesar 2%, recall positif 3%, recall negatif 1%, precision positif 1%, dan precision negatif 2%. Tetapi kecepatan waktu proses pada tahap text preprocessing dengan penambahan algoritma Levenshtein Distance lebih lambat sebesar 295,606 detik, jika dibandingkan tanpa adanya penambahan algoritma Levenshtein Distance.

Published
2022-03-30