ANALISIS METODE K NEAREST NEIGHBOR IMPUTATION (KNNI) UNTUK MENGATASI DATA HILANG PADA ESTIMASI DATA SURVEY

  • Euis Sartika

Abstract

Ketidaklengkapan suatu data survey (missing data) akan menyebabkan  inferensi statistik tidak dapat dilakukan. Penghilangan data yang tidak lengkap akan menyebabkan berkurangnya informasi yang dibutuhkan sehingga kurang menggambarkan kondisi yang seenarnya. Terdapat beberapa cara  untuk mengatasi missing data tersebut, salah satu adalah dengan mengganti data yang hilang (missing data) tersebut. Penelitian ini bertujuan mengkaji analisis k Nearest Neighbor sebagai salah satu cara untuk mengimputasi data yang hilang. Metode ini didasarkan pada konsep jarak terdekat dari observasi (k), kemudian pada observasi tersebut diberi pembobotan. Software yang digunakan adalah R versi 3.4.3. Pada penelitian ini digunakan juga metode imputasi yang lain yaitu Series Mean dan metode Algoritma EM sebagai pembanding. Untuk membandingkan ketiga metode tersebut digunakan nilai RMSE. Hasil menunjukkan bahwa metode Series Mean menunjukkan nilai RMSE terkecil. Kelebihan lain dari k Nearest Neighbor adalah dapat digunakan untuk imputasi data berskala numerik dan kategorik.
 
Kata kunci: missing data, k Nearest Neighbor, Series Mean, Algoritma EM, RMSE

Downloads

Download data is not yet available.
Published
Aug 29, 2019
How to Cite
SARTIKA, Euis. ANALISIS METODE K NEAREST NEIGHBOR IMPUTATION (KNNI) UNTUK MENGATASI DATA HILANG PADA ESTIMASI DATA SURVEY. Jurnal TEDC, [S.l.], v. 12, n. 3, p. 219-227, aug. 2019. ISSN 2776-723X. Available at: <http://ejournal.poltektedc.ac.id/index.php/tedc/article/view/154>. Date accessed: 14 june 2026.
Section
Articles