ANALISIS METODE K NEAREST NEIGHBOR IMPUTATION (KNNI) UNTUK MENGATASI DATA HILANG PADA ESTIMASI DATA SURVEY

Euis Sartika

ANALISIS METODE K NEAREST NEIGHBOR IMPUTATION (KNNI) UNTUK MENGATASI DATA HILANG PADA ESTIMASI DATA SURVEY

Euis Sartika

Abstract

Ketidaklengkapan suatu data survey (missing data) akan menyebabkan inferensi statistik tidak dapat dilakukan. Penghilangan data yang tidak lengkap akan menyebabkan berkurangnya informasi yang dibutuhkan sehingga kurang menggambarkan kondisi yang seenarnya. Terdapat beberapa cara untuk mengatasi missing data tersebut, salah satu adalah dengan mengganti data yang hilang (missing data) tersebut. Penelitian ini bertujuan mengkaji analisis k Nearest Neighbor sebagai salah satu cara untuk mengimputasi data yang hilang. Metode ini didasarkan pada konsep jarak terdekat dari observasi (k), kemudian pada observasi tersebut diberi pembobotan. Software yang digunakan adalah R versi 3.4.3. Pada penelitian ini digunakan juga metode imputasi yang lain yaitu Series Mean dan metode Algoritma EM sebagai pembanding. Untuk membandingkan ketiga metode tersebut digunakan nilai RMSE. Hasil menunjukkan bahwa metode Series Mean menunjukkan nilai RMSE terkecil. Kelebihan lain dari k Nearest Neighbor adalah dapat digunakan untuk imputasi data berskala numerik dan kategorik.

Kata kunci: missing data, k Nearest Neighbor, Series Mean, Algoritma EM, RMSE

Downloads

Download data is not yet available.

PDF (Bahasa Indonesia)

Published

Aug 29, 2019

How to Cite

SARTIKA, Euis. ANALISIS METODE K NEAREST NEIGHBOR IMPUTATION (KNNI) UNTUK MENGATASI DATA HILANG PADA ESTIMASI DATA SURVEY. Jurnal TEDC, [S.l.], v. 12, n. 3, p. 219-227, aug. 2019. ISSN 2776-723X. Available at: <http://ejournal.poltektedc.ac.id/index.php/tedc/article/view/154>. Date accessed: 14 june 2026.

Citation Formats