BRIN Logo
Sign In
Main Product Image

IndoBugis 10K - Dataset Kalimat Paralel Bahasa Indonesia Dan Bahasa Bugis

Agenda Riset: Penguatan Ketahanan Sosial dan Masyarakat
Sektor: Sosial Humaniora

Deskripsi

Dataset ini berisi kumpulan kalimat paralel bahasa Indonesia dan bahasa Bugis sejumlah 10.296 kalimat. Dataset ini dapat digunakan untuk riset-riset dalam bidang pemrosesan bahasa alami (natural language processing; NLP). Dataset ini telah diuji melalui pengembangan model mesin penerjemah dengan menggunakan metode LSTM dan Bi-LSTM.

Kata Kunci

Dataset
  • Menyediakan 10.296 kalimat paralel Bahasa Indonesia–Bugis untuk riset pemrosesan bahasa alami (NLP)
  • Telah diuji dengan model LSTM dan Bi-LSTM untuk pengembangan mesin penerjemah
  • Mendukung penelitian linguistik, AI, dan penerjemahan bahasa daerah secara digital
  • Menjadi sumber data terbuka yang memperkuat preservasi bahasa Bugis melalui teknologi modern