Damerau Levenshtain Distance dengan Metode Empiris untuk Koreksi Ejaan Bahasa Indonesia


Aji Prasetya Wibawa(1*); Pundhi Yuliawati(2); Puji Santoso(3); Ridwan Shalahuddin(4); I Made Wirawan(5);

(1) Universitas Negeri Malang
(2) Universitas Negeri Malang
(3) Universitas Negeri Malang
(4) Universitas Negeri Malang
(5) Universitas Negeri Malang
(*) Corresponding Author

  

Abstract


Damerau Levenshtein Distance (DLD) adalah algoritma untuk koreksi kesalahan penulisan. Kesalahan terjadi karena penyisipan, penghapusan, pertukaran, dan penggantian alfabet dalam sebuah kata. Ini mungkin terjadi karena hilangnya spasi di antara dua kata. DLD tidak dapat mengatasi masalah kehilangan spasi. Karenanya, makalah ini bertujuan untuk menggabungkan DLD dengan Metode Empiris untuk memperbaiki kesalahan ini. Alhasil, algoritma kombinasi dapat mengungguli DLD asli dalam memeriksa kesalahan ejaan Teks Bahasa Indonesia dengan akurasi 97%.

Keywords


Damerau Levenshtain Distance; Metode Empiris; Ejaan; Koreksi; Bahasa Indonesia

  
  

Full Text:

PDF
  

Article Metrics

Abstract view: 556 times
PDF view: 293 times
     

Digital Object Identifier

doi  https://doi.org/10.33096/ilkom.v12i3.600.176-182
  

Cite

References


A. I. Fahma, I. Cholissodin, and R. S. Perdana, Identifikasi Kesalahan Penulisan Kata (Typographical Error) pada Dokumen Berbahasa Indonesia Menggunakan Metode N-gram dan Leven shtein Distance, J. Pengemb. Teknol. Inf. dan Ilmu Kompute, vol. 2, no. 1, pp. 5362, 2018.

A. Pahdi, Koreksi Ejaan Istilah Komputer Berbasis Kombinasi Algoritma Damerau- Levenshtein dan Algoritma Soundex, Sentra Penelit. Eng. dan Edukasi, vol. 8, no. 2, pp. 18, 2016.

G. V. Bard, Spelling-error tolerant, order-independent pass-phrases via the Damerau-Levenshtein string-edit distance metric, in the fifth Australasian symposium on ACSW frontiers, 2007, pp. 117124.

A. S. Lhoussain and Y. O. U. S. F. I. Hicham, G.U.E.D.D.A.H. Abdellah, Adaptating the levenshtein distance to contextual spelling correction, Int. J. Comput. Sci. Appl., vol. 12, no. 12, pp. 127133, 2015.

H. Hyyr, A bit-vector algorithm for computing Levenshtein and Damerau edit distances, Nord. J. Comput, vol. 10, no. 1, pp. 2939, 2003.

P. Santoso, P. Yuliawati, R. Shalahuddin, and I. A. E. Zaeni, Penghapusan kolom dan baris pertama pada matriks distance untuk optimasi spell checker damerau-levenshtein distance, Sains, Apl. Komputasi dan Teknol. Inf., vol. 2, no. 2, pp. 5763, 2020.

A. Kutuzov, Improving English-Russian sentence alignment through POS tagging and Damerau-Levenshtein distance, in Proceedings of the 4th Biennial International Work, 2013, pp. 6368.

G. Veena and G. Jalaja, No TitleLevenshtein Distance based Information Retrieval., Int. J. Sci. Eng. Res., vol. 6, no. 5, 2015.

S. Y. Yuliani, S. Sahib, M. F. Abdollah, Y. S. Wijaya, and N. H. M. Yusoff, Hoax news validation using similarity algorithm, J. Phys. Conf. Ser., vol. 1524, no. 1, p. 012035, 2020.

P. Santoso, P. Yuliawati, R. Shalahuddin, and A. P. Wibawa, Damerau Levenshtein Distance for Indonesian Spelling Correction, J. Inform., vol. 13, no. 2, p. 11, 2019.

N. M. M. Adriyani, I. W. Santiyasa, and A. Muliantara, Implementasi Algoritma Levenshtein Distance dan Metode Empiris untuk Menampilkan Saran Perbaikan Kesalahan Pengetikan Dokumen Berbahasa Indonesia, JELIKU (Jurnal Elektron. Ilmu Komput. Udayana), vol. 1, no. 1, 2012.

N. Gupta and P. Mathur, Spell checking techniques in NLP: a survey, Int. J. Adv. Res. Comput. Sci. Softw. Eng., vol. 2, no. 12, pp. 217221, 2012.

V. V. Bhaire, A. A. Jadhav, and P. G. Pasthe, Pradnya A. Magdum, Spell checker, Int. J. Sci. Res. Publ., vol. 5, no. 4, pp. 13, 2015.

F. J. Damerau, A technique for computer detection and correction of spelling errors, Commun. ACM, vol. 7, no. 3, pp. 171176, 1964.

R. Gabrys, E. Yaakobi, and O. Milenkovic, Codes in the Damerau distance for DNA storage, in 2016 IEEE International Symposium on Information Theory (ISIT), 2016, pp. 26442648.


Refbacks

  • There are currently no refbacks.


Copyright (c) 2020 Aji Prasetya Wibawa

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.