Implementasi Fitur Vector Bag Of Word Dan TF IDF untuk Analisis Sentiment
Muhammad Salman Al Markas(1*); Siska Anraeni(2); Lutfi Budiman Ilmuwan(3);
(1) Universitas Muslim Indonesia
(2) Universitas Muslim Indonesia
(3) Universitas Muslim Indonesia
(*) Corresponding Author
AbstractPenggunaan internet dengan media sosial mempengaruhi masyarakat terhadap kegiatan yang dilakukan saat ini. Salah satu media sosial yang sekarang ini sedang populer digunakan oleh masyarakat adalah X. Informasi yang disebarkan dapat merupakan berita, opini, komentar, serta kritikan. Data yang didapat dari tweet ini dapat menjelaskan tanggapan masyarakat terhadap pelayanan pajak dari X. Maka dari itu penelitian ini sangat efisien jika X menjadi media untuk pengambilan data mengenai komentar Masyarakat sehingga dapat memberikan efektivitas perubahan yang diberikan kepada instansi pemerintah. Analisis sentimen menjadi proses yang sangat penting dalam memahami isi data dengan tujuan mengolah komentar yang diberikan oleh pengguna melalui tweet di X mengenai sebuah produk, layanan, dan instansi. Karya ilmiah ini bertujuan untuk membandingkan fitur Vector Bag Of Word dan TF IDF untuk mengevaluasi seberapa penting suatu term dalam sebuah dokumen pada dokumen yang lebih besar. Seperti diketahui bahwa komputer hanya mampu memproses input yang numerik sehingga data opini public berupa teks perlu direpresentasikan sebagai nilai numerik yang dikenal dengan ekstraksi fitur dan dapat dilakukan menggunakan model Binary Bag of Words (BOW), Count BOW dan Term Frequency-Inverse Document Frequency (TF-IDF) dikarenakan kedua teknik tersebut sangat berperan baik dan sama-sama digunakan untuk merepresentasikan numerik dari data teks serta memiliki kekurangan dan kelebihan masing masing. Berdasarkan hasil analisis maka dapat disimpulkan dengan menganalisis statement dengan menggunakan Bag Of Word dan TF-IDF dapat mengetahui jumlah tiap kemunculan kata di setiap kalimat dan dari hasil yang didapatkan bahwa kata yang sering diucapkan dalam sentimen yaitu dengan bobot nilai TF-IDF sebesar 0.1403. KeywordsBag Of Word; Informasi; Komentar; Sentiment; Term Frequency-Inverse Document Frequency
|
Full Text:PDF |
Article MetricsAbstract view: 52 timesPDF view: 21 times |
Digital Object Identifier![]() |
Cite |
References
N. H. F. Mulyani, “Analisis perkembangan ilmu pengetahuan dan teknologi (IPTEK) dalam pendidikan,” 2021, academia.edu. doi: 10.31004/jpdk.v3i1.1432.
K. T. Putra and M. A. Hariyadi, “Perbandingan Feature Extraction Tf-Idf Dan Bow Untuk Analisis Sentimen Berbasis Svm,” J. Cahaya MAndalika 1449, 2023.
I. R. Putri and E. Pratiwi, “Aktivisme digital dan pemanfaatan media baru sebagai pendekatan pemberdayaan masyarakat atas isu lingkungan,” Bricol. J. Magister Ilmu Komun., 2022, doi: 10.30813/bricolage.v8i2.3303.
A. A. Rahmawati, Metha Binety Maharani, and M. N. F. Al Amin, “Peran Media Sosial Dalam Proses Pengambilan Keputusan Politik Melalui Pendekatan Problem Tree Analysis,” ARIMA J. Sos. Dan Hum., vol. 1, no. 4 SE-Articles, pp. 112–121, Apr. 2024, doi: 10.62017/arima.v1i4.1043.
M. Jurnal, “Sumber Daya Sektor Pelayanan Publik Era Revolusi Industri 4.0: Profesional Dan Komunikatif Sebuah Tantangan,” J. MSDA (Manajemen Sumber Daya Apar., 2020, doi: 10.33701/jmsda.v8i2.1404.
M. F. Alfajri, V. Adhiazni, and Q. Aini, “Pemanfaatan Social Media Analytics Pada Instagram Dalam Peningkatan,” Interak. J. Ilmu Komun., 2019, doi: https://dx.doi.org/10.14710/interaksi.8.1.34-42.
S. Juanita, “Analisis sentimen persepsi masyarakat terhadap pemilu 2019 pada media sosial twitter menggunakan naive bayes,” 2020, academia.edu. doi: 10.30865/mib.v4i3.2140.
K. Kartini, J. Syahrina, N. Siregar, and N. Harahap, “Penelitian Tentang Instagram,” 2022.
L. B. Ilmawan and M. A. Mude, “Perbandingan metode klasifikasi Support Vector Machine dan Naïve Bayes untuk analisis sentimen pada ulasan tekstual di Google Play Store,” 2020, academia.edu. doi: 10.33096/ilkom.v12i2.597.154-161.
H. Darwis, A. N. P. Pagala, and S. Anraeni, “Analysis of Public Sentiment about Childfree in Indonesia using Support Vector Machine Methods,” 2025 19th Int. Conf. Ubiquitous Inf. Manag. Commun. IMCOM 2025, 2025, doi: 10.1109/IMCOM64595.2025.10857551.
A. A. Firdaus and A. I. Hadiana, “Klasifikasi Sentimen pada Aplikasi Shopee Menggunakan Fitur Bag of Word dan Algoritma Random Forest,” Ranah Res. J. Multidiscip. Res. Dev., 2024, doi: 10.38035/rrj.v6i5.994.
A. Susanto and I. A. Dzulkarnain, “Analisis Sentimen Data Twitter Topik Ekonomi Dan Industri Dengan Metode Naive Bayes Dan Random Forest,” J. Ilm. Wahana Pendidik., 2023, doi: https://doi.org/10.5281/zenodo.8398895.
M. I. Fikri, T. S. Sabrila, and Y. Azhar, “Perbandingan metode naïve bayes dan support vector machine pada analisis sentimen twitter,” SMATIKA J. STIKI Inform. J., 2020, doi: 10.32664/smatika.v10i02.455.
T. Sabri, O. El Beggar, and M. Kissi, “Comparative study of Arabic text classification using feature vectorization methods,” Procedia Comput. Sci., 2022, doi: 10.1016/j.procs.2021.12.239.
D. Sugiarto, E. Utami, and A. Yaqin, “Perbandingan Kinerja Model TF-IDF dan BOW untuk Klasifikasi Opini Publik Tentang Kebijakan BLT Minyak Goreng,” J. Tek. Ind., 2022, doi: 10.25105/jti.v12i3.15669.
A. P. Pimpalkar and R. J. R. Raj, “Influence of pre-processing strategies on the performance of ML classifiers exploiting TF-IDF and BOW features,” ADCAIJ Adv. Distrib. Comput. Artif. Intell. J., 2020, doi: 10.14201/adcaij2020924968.
A. N. Dzulhijjah, S. Anraeni, and S. Sugiarti, “Klasifikasi kematangan citra labu siam menggunakan metode KNN (K-Nearest Neighbor) dengan ekstraksi fitur HSV (Hue, Saturation, Value),” Bul. Sist. Inf. dan Teknol. Islam, 2021, doi: 10.33096/busiti.v2i2.808.
H. Darwis, N. Wanaspati, and S. Anraeni, “Support Vector Machine untuk Analisis Sentimen Masyarakat Terhadap Penggunaan Antibiotik di Indonesia,” Indones. J. Comput. Sci., 2023, doi: https://doi.org/10.33022/ijcs.v12i4.3320.
W. T. H. Putri and R. Hendrowati, “Penggalian Teks Dengan Model Bag of Words Terhadap Data Twitter,” 2018, academia.edu.
D. Septiani and I. Isabela, “Analisis term frequency inverse document frequency (tf-idf) dalam temu kembali informasi pada dokumen teks,” 2022.
V. Analytics, “Term frequency inverse document frequency (TF-IDF),” 2023.
N. A. Supriadi, A. R. Manga, R. Adawiyah, and ..., “Application of Ensemble Machine Learning for DDoS Detection in Complex Network Environments,” Proc. 2025 19th Int. Conf. Ubiquitous Inf. Manag. Commun. IMCOM 2025, 2025, doi: 10.1109/IMCOM64595.2025.10857516.
Refbacks
- There are currently no refbacks.
Copyright (c) 2025 Muhammad Salman Al Markas, Siska Anraeni, Lutfi Budiman Ilmuwan

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Literatur Informatika dan Komputer
Diterbitkan oleh Fakultas Ilmu Komputer
Website : https://jurnal.fikom.umi.ac.id/index.php/LINIER/
Email : linier@umi.ac.id
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0