Lompat ke konten Lompat ke sidebar Lompat ke footer

Meta Mengenalkan SeamlessM4T, Inovator Terjemahan AI Multibahasa untuk Semua Teks dan Ucapan

Meta Mengenalkan SeamlessM4T, Inovator Terjemahan AI Multibahasa untuk Semua Teks dan Ucapan


Di era di mana keterhubungan semakin meluas, mengatasi rintangan bahasa telah menjadi salah satu tantangan utama. Dalam upaya mengatasi hal tersebut, Meta, perusahaan teknologi raksasa yang sebelumnya dikenal sebagai Facebook, telah memperkenalkan model baru kecerdasan buatan generatif. Dikenal dengan sebutan SeamlessM4T, model ini bertujuan memungkinkan akses yang lebih mudah terhadap beragam konten multibahasa yang sebelumnya belum pernah terwujud, dengan menyediakan kemampuan terjemahan multimodal (berupa suara dan teks) serta kemampuan multibahasa dalam satu platform.

Meta serta upaya mereka dalam pengembangan penerjemah linguistik universal


SeamlessM4T, yang singkatan dari Massively Multilingual and Multimodal Machine Translation, merepresentasikan lompatan signifikan dalam tekad Meta untuk memajukan konsep penerjemah bahasa universal. Langkah ini diambil setelah diperkenalkannya model terjemahan mesin dari teks ke teks bernama "No Language Left Behind," yang menyediakan dukungan untuk 200 bahasa.

SpeechMatrix merupakan sekumpulan data yang digunakan untuk menerjemahkan ucapan secara multibahasa, serta Pidato Multibahasa Besar-besaran yang secara khusus difokuskan pada pengenalan ucapan. Yang terakhir adalah Universal Speech Translator, sebuah inovasi yang membawa bahasa Hokkien — bahasa yang umum digunakan di Tiongkok namun tidak memiliki aksara resmi — ke dalam terjemahan bahasa Inggris.

Berbeda dengan sistem konvensional untuk penerjemahan ucapan-ke-teks dan teks-ke-teks yang memiliki keterbatasan dalam cakupan bahasanya, SeamlessM4T telah dirancang dengan tujuan untuk memahami serta menerjemahkan interaksi antara ucapan-ke-teks dan teks-ke-teks dalam jangkauan hampir 100 bahasa. Tambahan pula, dalam hal terjemahan dari ucapan ke teks (speech-to-text) dan dari teks ke ucapan (text-to-speech), sistem ini mendukung hampir 100 bahasa sebagai bahasa masukan dan 35 bahasa sebagai bahasa keluaran.

Dalam upaya memberikan pendekatan komprehensif yang mengurangi kesalahan dan penundaan, SeamlessM4T telah meningkatkan efisiensi serta kualitas proses penerjemahan. Ini memungkinkan individu dari berbagai latar belakang linguistik untuk terlibat dalam percakapan multibahasa dengan kelancaran.

Namun, kemampuannya mungkin juga terhadap alih kode, yaitu saat penutur dengan lancar beralih antara dua bahasa atau lebih dalam satu kalimat. Video demonstratif dari Meta menunjukkan perbedaan langsung antara pola bahasa dalam bahasa Hindi, Telugu, dan Inggris.

Ada peluang yang terbuka untuk bahasa-bahasa yang kurang umum digunakan, memberikan kekuatan kepada para peneliti dan pengembang. Pentingnya penerjemahan bahasa semakin meningkat bagi perusahaan seperti Meta, yang memiliki banyak tenaga kerja untuk mengelola beragam konten di Facebook dan Instagram dalam berbagai bahasa. Seringkali, bahasa-bahasa minor ditangani oleh tim yang lebih kecil, bergantung pada sistem moderasi otomatis yang memiliki kelemahan dalam pelaksanaannya. Dengan memberikan akses kepada kecerdasan buatan (AI) ke dalam kumpulan data yang mencakup bahasa-bahasa yang jarang digunakan ini, Meta membayangkan pengembangan alat yang dapat meningkatkan upaya moderasi mereka.

Lebih lanjut, tekad Meta terhadap promosi ilmu pengetahuan terbuka tercermin dalam keputusannya untuk merilis SeamlessM4T melalui lisensi Creative Commons CC BY-NC 4.0. Mirip dengan pendekatan yang diambil untuk model Llama 2 yang substansial, langkah ini mengundang peneliti dan pengembang untuk memanfaatkan teknologi AI yang mutakhir, mendorong semangat inovasi dalam ranah terjemahan bahasa. Di samping SeamlessM4T, Meta juga berbagi metadata dari SeamlessAlign, koleksi besar data terjemahan multimodal yang mencakup lebih dari 270.000 jam rekaman ucapan dan penyelarasan teks.

Lapisan Perlindungan Kecerdasan Buatan terhadap Toksisitas dan Bias


Selain dari kemampuan terjemahannya yang mengesankan, SeamlessM4T merefleksikan komitmen Meta dalam membentuk lingkungan digital yang aman dan inklusif. Saat merancang SeamlessM4T, Meta telah menciptakan sistem yang dapat mengidentifikasi kata-kata yang bersifat toksik. Menurut perusahaan, hal ini mencakup contoh di mana konten yang diterjemahkan memiliki potensi untuk memicu sikap kebencian, tindakan kekerasan, penggunaan bahasa kasar, atau bahkan pelecehan. Untuk menyeimbangkan adanya toksisitas dalam data pelatihan, Meta telah melakukan penghapusan pada urutan kata-kata yang memiliki tingkat toksisitas yang bervariasi, baik pada input maupun output.

Salah satu inovasi utama terletak pada kemampuan model untuk mendeteksi serta mengukur bias gender dalam bahasa. Pendekatan ini menghitung situasi di mana kata-kata yang berhubungan dengan gender dimasukkan dalam terjemahan, walaupun tidak ada perbedaan dalam bahasa aslinya. Contohnya adalah anggapan otomatis terhadap konotasi maskulin untuk kata "dokter" dalam bahasa Inggris. Melalui penyaringan kata-kata toksik dan pengatasi atas konstruksi linguistik yang bersifat gender, SeamlessM4T bertujuan untuk memastikan bahwa konten yang dihasilkan dari proses terjemahan tetap mempertahankan rasa hormat dan netralitas tanpa memihak.

Posting Komentar untuk "Meta Mengenalkan SeamlessM4T, Inovator Terjemahan AI Multibahasa untuk Semua Teks dan Ucapan"