Analisis Sentimen Pengguna Mobil Listrik di Media Sosial Twitter Menggunakan Metode Klasifikasi Naïve Bayes, K-Nearest Neighbor (KNN), dan Decision Tree
DOI:
https://doi.org/10.47970/siskom-kb.v8i1.783Keywords:
Analisis Sentimen, Kendaraan Listrik, Twitter, KNN, Decision Tree, Naïve BayesAbstract
Penelitian ini bertujuan untuk menganalisis sentimen pengguna kendaraan listrik dengan menggunakan tiga algoritma klasifikasi machine learning, yaitu Naïve Bayes, Decision Tree, dan K-Nearest Neighbors. Data yang digunakan dalam penelitian ini diambil dari platform media sosial Twitter yang dikenal dengan jumlah data yang besar dan beragam. Objek penelitian adalah opini publik yang diungkapkan di Twitter, dengan subjek berupa tweet yang dikumpulkan menggunakan Twitter API, menghasilkan 2000 data, dengan 1869 data bersih setelah preprocessing. Analisis data meliputi ekstraksi teks dan preprocessing, yang mencakup pembersihan data, tokenisasi, penghilangan stopword, dan stemming. Hasil penelitian menunjukkan distribusi sentimen sebagai berikut: sentimen netral mendominasi dengan 53.5% dari total tweet, diikuti sentimen positif sebesar 35.8%, dan sentimen negatif sebesar 10.7%. Di antara model yang diuji, Decision Tree dengan embedding TF/IDF menunjukkan kinerja terbaik, mencapai akurasi 66%, sedangkan Decision Tree dengan embedding Word2Vec memiliki kinerja terendah dengan akurasi 46%. Sementara itu, KNN dengan embedding TF/IDF menunjukkan kinerja yang cukup baik dengan akurasi 58%, lebih tinggi dibandingkan KNN dengan embedding Word2Vec yang mencapai akurasi 57%. Naïve Bayes dengan embedding TF/IDF menghasilkan akurasi sebesar 53%, lebih tinggi dibandingkan Naïve Bayes dengan embedding Word2Vec yang memiliki akurasi 48%. Meskipun terdapat variasi di antara algoritma dan word embedding yang digunakan, tidak ada metode yang secara konsisten mengklasifikasikan sentimen di semua bidang. Penelitian ini memberikan kontribusi yang signifikan dalam memetakan sentimen tentang penggunaan kendaraan listrik melalui analisis data dari media sosial dan memberikan wawasan tentang efektivitas berbagai algoritma machine learning dan word embedding dalam analisis sentimen.