Penerapan Named Entity Recognition (NER) Untuk Ekstraksi Otomatis Entitas Pada Teks Berita Online Pemerintah Daerah
Abstract
Berita pemerintah daerah memiliki peran penting sebagai sumber informasi publik, namun umumnya masih disajikan dalam bentuk teks tidak terstruktur sehingga menyulitkan proses pencarian dan analisis informasi. Penelitian ini bertujuan menerapkan metode Named Entity Recognition (NER) untuk mengekstraksi entitas penting sekaligus membangun sistem berbasis web yang mengintegrasikan proses scraping berita, prapemrosesan teks, ekstraksi entitas, dan penyajian hasil secara terstruktur. Metode yang digunakan memanfaatkan model spaCy pretrained berbasis multilingual dan IndoBERT pretrained untuk mengenali entitas PER, ORG, LOC, dan DATE pada berita Detik.com. Sistem dikembangkan menggunakan framework Flask dan dievaluasi dengan membandingkan hasil ekstraksi terhadap data ground truth menggunakan metrik precision, recall, dan F1- score. Hasil pengujian menunjukkan nilai precision sebesar 67%, recall sebesar 76,2%, dan F1-score sebesar 71,2%. Kinerja terbaik diperoleh pada entitas PER dan DATE, sementara entitas LOC dan ORG masih menunjukkan hasil yang kurang optimal. Secara keseluruhan, sistem ini dapat dimanfaatkan sebagai alat bantu awal dalam analisis berita pemerintah daerah secara lebih efisien dan sistematis.
Downloads

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

