Bagaimana Perangkat Lunak Terjemahan Mesin Bekerja?

Mesin dapat menerjemahkan kata-kata di layar Kamu dalam sekejap mata, tetapi pernahkah Kamu bertanya-tanya bagaimana penerjemah dalam browser melakukan tugas yang begitu rumit?

Kebanyakan orang tidak berpikir dua kali ketika mereka mengklik opsi ini, tetapi ada banyak hal yang terjadi di balik layar. Perangkat lunak ini bergantung pada algoritme kuat yang dibangun berdasarkan aturan bahasa sehingga dapat mengubah teks dari satu bahasa ke bahasa lain.

Rata-rata penerjemah dalam browser hanyalah salah satu contoh tren yang lebih besar dalam industri layanan terjemahan. Bisnis dan firma hukum membutuhkan layanan terjemahan profesional untuk menerjemahkan sejumlah besar dokumen.

Karena teknologi memungkinkan algoritma yang semakin kompleks, cara kerja MT telah berkembang dari waktu ke waktu. Berikut adalah tiga jenis MT.

1. MT Berbasis Aturan

MT Berbasis Aturan (RBMT) dibangun di sekitar kamus yang luas dan aturan tata bahasa dari bahasa asli dan bahasa target. Data ini menyediakan kerangka kerja tentang bagaimana seharusnya mengkonversi teks dari satu bahasa ke bahasa berikutnya.

Dengan RBMT, perangkat lunak akan menganalisis dokumen asli untuk menentukan kata-kata individual dan mengidentifikasi aturan struktur kalimatnya. Dengan menggunakan informasi ini, ia kemudian menemukan istilah dan aturan yang cocok dalam bahasa target untuk mengubah setiap kalimat ke dalam bahasa baru.

Karena menguraikan setiap kata dan kalimat dengan cara ini menyeluruh, ini bisa menjadi metode yang lebih lambat dan lebih mahal. Namun, itu dapat menghasilkan beberapa MT yang paling benar secara teknis, karena para insinyur dapat mengedit aturannya untuk mengakomodasi terjemahan yang tidak mungkin secara statistik.

2. MT Berbasis Statistik

Sementara RBMT mengandalkan mempelajari kosakata dan aturan tata bahasa setiap bahasa, MT Berbasis Statistik (SBMT) belajar melalui contoh.

Insinyur memberi makan perangkat lunak ini dengan semua terjemahan yang ada yang sudah selesai dalam bahasa asli dan bahasa target. Ini kemudian mendasarkan terjemahannya di masa depan pada apa yang ditetapkan oleh contoh-contoh ini, memilih kata dan frasa yang paling mungkin secara statistik menurut kumpulan data ini.

Tidak seperti RBMT, yang menghasilkan salinan terjemahan dengan berpindah dari kata ke kata, MT Berbasis Statistik (SBMT) berfokus pada frasa. Meskipun sering kali benar saat memilih frasa yang paling umum, ada kemungkinan kesalahan terjadi saat topik yang tidak biasa, slang, dan istilah khusus industri dilibatkan.

3. MT saraf

MT saraf (NMT) mirip dengan SBMT, dalam hal itu belajar bagaimana menerjemahkan dari terjemahan yang ada dalam bahasa asli dan bahasa target. Insinyur perangkat lunak memberi makan perangkat lunak NMT dengan volume besar data yang dikumpulkan dari kedua bahasa, termasuk terjemahan yang ada, sehingga dapat membuat terjemahan frasa demi frasa yang paling mungkin secara statistik menurut data ini.

Tapi cara menghasilkan terjemahan ini menempatkannya di bidangnya sendiri. NMT menggunakan algoritme canggih yang dibangun berdasarkan pembelajaran mendalam untuk meniru cara otak manusia belajar, memproses, dan menyimpan bahasa. Hal ini memungkinkan NMT untuk mempelajari bahasa baru lebih cepat daripada metode MT lainnya, bahkan jika datanya tidak terstruktur atau tidak berlabel.

Intinya

MT adalah istilah umum yang menjelaskan tiga cara berbeda suatu algoritma dapat mengubah teks dari satu bahasa ke bahasa lain. RBMT, SBMT, dan NMT mungkin mendekati terjemahan secara berbeda, tetapi semuanya bekerja tanpa perlu pengawasan manusia di luar pengkodean awal.

Ini dapat menghasilkan terjemahan yang lebih cepat dan lebih murah daripada yang dilakukan dengan tangan. Tapi sebanyak MT telah maju dalam sepuluh tahun terakhir, masih memiliki jalan panjang untuk datang. Untuk proyek-proyek penting, tidak ada yang mengalahkan ahli bahasa manusia yang dapat mengenali konteks unik, bahasa gaul, dan istilah khusus industri.

Rate this post
Share Jika Bermanfaat Ya 🙂

Leave a Comment