Perbandingan Naïve Bayes dan K-Nearest Neighbor dalam Klasifikasi Polaritas Tweet pada Cross-Domain #MakanBergiziGratis dan #Danantara
Ahmad Fadly(1*); Purnawansyah Purnawansyah(2); Herdianti Darwis(3);
(1) Universitas Muslim Indonesia
(2) Universitas Muslim Indonesia
(3) Universitas Muslim Indonesia
(*) Corresponding Author
AbstractMedia sosial seperti Twitter (X) menghasilkan data opini publik dalam jumlah besar yang dapat dimanfaatkan untuk analisis sentimen. Namun, perbedaan konteks antar topik atau hashtag sering menyebabkan terjadinya domain shift yang dapat menurunkan performa model klasifikasi. Penelitian ini bertujuan untuk menganalisis performa algoritma Naïve Bayes dan K-Nearest Neighbors (KNN) dalam skenario cross-domain menggunakan dua representasi fitur, yaitu TF-IDF dan FastText. Dataset diperoleh dari hashtag #MakanBergiziGratis sebagai domain sumber dan #Danantara sebagai domain target. Metode yang digunakan meliputi preprocessing teks, ekstraksi fitur, pemodelan, serta evaluasi menggunakan accuracy, precision, recall, dan F1-score. Hasil penelitian menunjukkan bahwa kedua model memiliki performa tinggi pada internal test dengan accuracy sebesar 0.94. Namun, pada pengujian lintas domain, Naïve Bayes dengan TF-IDF menunjukkan performa yang lebih stabil dengan accuracy sebesar 0.75, sedangkan KNN dengan FastText mengalami penurunan signifikan, terutama pada kelas negatif dengan nilai F1-score sebesar 0.00. Temuan ini menunjukkan bahwa pemilihan algoritma dan representasi fitur sangat mempengaruhi kemampuan generalisasi model dalam menghadapi domain shift
KeywordsAnalisis Sentimen; Naïve Bayes; KNN; TF-IDF; Cross-domain
|
Full Text:XML |
Article MetricsAbstract view: 0 timesXML view: 0 times |
Digital Object Identifier https://doi.org/10.33096/linier.v3i2.3632
|
Cite |
References
P. K. Tetteh dan P. K. Kankam, “The role of social media in information dissemination to improve youth interactions,” Cogent Soc. Sci., vol. 10, no. 1, Des 2024, doi: 10.1080/23311886.2024.2334480.
F. Gaisbauer, A. Pournaki, S. Banisch, dan E. Olbrich, “Ideological differences in engagement in public debate on Twitter,” PLoS One, vol. 16, no. 3, hlm. e0249241, Mar 2021, doi: 10.1371/journal.pone.0249241.
E. Purnama Harahap, H. Dwi Purnomo, A. Iriani, I. Sembiring, dan T. Nurtino, “Trends in sentiment of Twitter users towards Indonesian tourism: analysis with the k-nearest neighbor method,” Computer Science and Information Technologies, vol. 5, no. 1, hlm. 19–28, Mar 2024, doi: 10.11591/csit.v5i1.p19-28.
N. M. Damayanti, “Analisis Sentimen Publik Pada Tagar #BTSCOMEBACK di Platform X Menggunakan IndoBERTweet,” Jurnal Informatika dan Teknik Elektro Terapan, vol. 13, no. 3, Jul 2025, doi: 10.23960/jitet.v13i3.7176.
I. Iwandini, A. Triayudi, dan G. Soepriyono, “Analisa Sentimen Pengguna Transportasi Jakarta Terhadap Transjakarta Menggunakan Metode Naives Bayes dan K-Nearest Neighbor,” Journal of Information System Research (JOSH), vol. 4, no. 2, hlm. 543–550, Jan 2023, doi: 10.47065/josh.v4i2.2937.
M. A. Arsyad, T. Hasanuddin, dan M. Hasnawi, “Implementasi K-Nearest Neighbor (KNN) pada Sistem Pakar Diagnosa Penyakit Untuk Menentukan Kelayakan Sapi sebagai Hewan Qurban Berbasis Web,” Buletin Sistem Informasi dan Teknologi Islam, vol. 3, no. 3, hlm. 167–173, Agu 2022, doi: 10.33096/busiti.v3i3.632.
K. Munawaroh dan A. Alamsyah, “Performance Comparison of SVM, Naïve Bayes, and KNN Algorithms for Analysis of Public Opinion Sentiment Against COVID-19 Vaccination on Twitter,” Journal of Advances in Information Systems and Technology, vol. 4, no. 2, hlm. 113–125, Mar 2023, doi: 10.15294/jaist.v4i2.59493.
S. Fi. Nurul Fitri H, F. Fattah, dan H. Azis, “Comparative Analysis of Machine Learning Algorithm Variations in Classifying Body Shaming Topics on Social Media X,” Indonesian Journal of Data and Science, vol. 5, no. 2, Jul 2024, doi: 10.56705/ijodas.v5i2.82.
F. P. Syah, T. Hasanuddin, dan N. Kurniati, “Implementasi Naive Bayes Untuk Analisis Sentimen Pada data Twitter Tentang Isu Politik di Indonesia,” LINIER: Literatur Informatika dan Komputer, vol. 2, no. 3, hlm. 302–316, Okt 2025, doi: 10.33096/linier.v2i3.3142.
C. G. Özmen dan S. Gündüz, “Comparison of Machine Learning Models for Sentiment Analysis of Big Turkish Web-Based Data,” Applied Sciences, vol. 15, no. 5, hlm. 2297, Feb 2025, doi: 10.3390/app15052297.
L. Xiao, Q. Li, Q. Ma, J. Shen, Y. Yang, dan D. Li, “Text classification algorithm of tourist attractions subcategories with modified TF-IDF and Word2Vec,” PLoS One, vol. 19, no. 10, hlm. e0305095, Okt 2024, doi: 10.1371/journal.pone.0305095.
A. R. Sembiring dan C. K. Dewa, “Sentiment Analysis On Indonesian Tweets about the 2024 Election,” Sinkron, vol. 9, no. 1, hlm. 413–422, Jan 2025, doi: 10.33395/sinkron.v9i1.14481.
E. Zuo, A. Aysa, M. Muhammat, Y. Zhao, dan K. Ubul, “Context aware semantic adaptation network for cross domain implicit sentiment classification,” Sci. Rep., vol. 11, no. 1, hlm. 22038, Nov 2021, doi: 10.1038/s41598-021-01385-1.
I. I. Saputri, P. Purnawansyah, dan H. Herman, “Implementasi Metode Naive Bayes Pada Pengenalan Tulisan Tangan Lontara,” Buletin Sistem Informasi dan Teknologi Islam, vol. 2, no. 3, hlm. 167–175, Agu 2021, doi: 10.33096/busiti.v2i3.845.
H. Basri, P. Purnawansyah, H. Darwis, dan F. Umar, “Klasifikasi Daun Herbal Menggunakan K-Nearest Neighbor dan Convolutional Neural Network dengan Ekstraksi Fourier Descriptor,” Jurnal Teknologi dan Manajemen Informatika, vol. 9, no. 2, hlm. 79–90, Des 2023, doi: 10.26905/jtmi.v9i2.10350.
L. Geni, E. Yulianti, dan D. I. Sensuse, “Sentiment Analysis of Tweets Before the 2024 Elections in Indonesia Using Bert Language Models,” Jurnal Ilmiah Teknik Elektro Komputer dan Informatika, vol. 9, no. 3, hlm. 746–757, Agu 2023, doi: 10.26555/jiteki.v9i3.26490.
S. Wang, J. Zhou, Q. Chen, Q. Zhang, T. Gui, dan X. Huang, “Domain Generalization via Causal Adjustment for Cross-Domain Sentiment Analysis,” dalam Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), N. Calzolari, M.-Y. Kan, V. Hoste, A. Lenci, S. Sakti, dan N. Xue, Ed., Torino, Italia: ELRA and ICCL, Mei 2024, hlm. 5286–5298. [Daring]. Tersedia pada: https://aclanthology.org/2024.lrec-main.470/
M. Rostami, D. Bose, S. Narayanan, dan A. Galstyan, “Domain Adaptation for Sentiment Analysis Using Robust Internal Representations,” dalam Findings of the Association for Computational Linguistics: EMNLP 2023, H. Bouamor, J. Pino, dan K. Bali, Ed., Singapore: Association for Computational Linguistics, Des 2023, hlm. 11484–11498. doi: 10.18653/v1/2023.findings-emnlp.769.
Y. Zhang, Y. Zhang, W. Guo, X. Cai, dan X. Yuan, “Learning Disentangled Representation for Multimodal Cross-Domain Sentiment Analysis,” IEEE Trans. Neural Netw. Learn. Syst., vol. 34, no. 10, hlm. 7956–7966, Okt 2023, doi: 10.1109/TNNLS.2022.3147546.
A. Novanto, D. Indra, dan W. Astuti, “Analisis Pre-processing Sentimen Terhadap Komentar Layanan Indihome Pada Twitter,” Buletin Sistem Informasi dan Teknologi Islam, vol. 5, no. 1, hlm. 30–36, Feb 2024, doi: 10.33096/busiti.v5i1.2066.
Muh. R. Zulkifli, Purnawansyah, dan H. Darwis, “Indonesian Cross-Platform Sentiment Analysis: DANN Transfer from General Applications to TradingView,” Indonesian Journal of Data and Science, vol. 6, no. 3, hlm. 481–491, Des 2025, doi: 10.56705/ijodas.v6i3.318.
M. Mujahid dkk., “Data oversampling and imbalanced datasets: an investigation of performance for machine learning and feature engineering,” J. Big Data, vol. 11, no. 1, hlm. 87, Jun 2024, doi: 10.1186/s40537-024-00943-4.
K. Pawluszek-Filipiak dan A. Borkowski, “On the Importance of Train–Test Split Ratio of Datasets in Automatic Landslide Detection by Supervised Classification,” Remote Sens. (Basel)., vol. 12, no. 18, hlm. 3054, Sep 2020, doi: 10.3390/rs12183054.
N. Marchelo, T. N. Fatyanosa, dan R. S. Perdana, “Klasifikasi Sentimen Lintas Domain pada Komentar Media Sosial Menggunakan IndoBERT dengan Fine-Tuning dan Data Augmentation,” Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 9, no. 12, 2025.
L. Afuan, “Sentiment Analysis of the Kampus Merdeka Program on Twitter Using Support Vector Machine and a Feature Extraction Comparison: TF-IDF vs. FastText,” Journal of Applied Data Sciences, vol. 5, no. 4, hlm. 1738–1753, Des 2024, doi: 10.47738/jads.v5i4.436.
H. Basri, P. Purnawansyah, H. Darwis, dan F. Umar, “Klasifikasi Daun Herbal Menggunakan K-Nearest Neighbor dan Convolutional Neural Network dengan Ekstraksi Fourier Descriptor,” Jurnal Teknologi dan Manajemen Informatika, vol. 9, no. 2, hlm. 79–90, Des 2023, doi: 10.26905/jtmi.v9i2.10350.
A. Amelia, L. N. Hayati, dan H. Darwis, “Analisis Sentimen Masyarakat Terhadap Sistem Pembayaran Mypertamina dengan Metode Random Forest, SVM, dan Naïve Bayes,” LINIER: Literatur Informatika dan Komputer, vol. 1, no. 1, hlm. 28–44, Nov 2024, doi: 10.33096/linier.v1i1.2269.
R. Puspitasari, T. Amaliah, dan H. Darwis, “Comparative Machine Learning Models for Dementia Prediction Using SMOTE,” International Journal of Artificial Intelligence in Medical Issues, vol. 3, no. 2, hlm. 79–90, Nov 2025, doi: 10.56705/ijaimi.v3i2.351.
D. Pratmanto, F. F. D. Imaniawan, dan V. Maarif, “Analisis Sentimen Pada Ulasan Pengguna Aplikasi Identitas Kependudukan Digital Dengan Metode Naive Bayes Dan K-Nearest,” Computatio : Journal of Computer Science and Information Systems, vol. 7, no. 2, hlm. 155–166, Des 2023, doi: 10.24912/computatio.v7i2.26322.
H. Azis, M. S. Andini, Herman, L. Syafie, A. R. Manga’, dan L. B. Ilmawan, “A Comparative Study of SGD, Adam, AdamW, and RMSprop Optimizers for VGG19-Based Rupiah Banknote Classification,” dalam 2025 9th International Conference On Electrical, Electronics And Information Engineering (ICEEIE), IEEE, Sep 2025, hlm. 1–6. doi: 10.1109/ICEEIE66203.2025.11251942.
Refbacks
- There are currently no refbacks.
Copyright (c) 2026 Ahmad Fadly, Purnawansyah Purnawansyah, Herdianti Darwis

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Linier: Literatur Informatika dan Komputer indexed by
ISSN 3063-2218
Published by Prodi Teknik Informatika FIK Universitas Muslim Indonesia
Website : https://jurnal.fikom.umi.ac.id/index.php/LINIER/
Email : linier@umi.ac.id
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0

