متا مدل ترجمه گفتار چندزبانه را منتشر کرد – تی ام گیم
متا مدل ترجمه گفتار چندزبانه را منتشر کرد – تی ام گیم
به گزارش تی ام گیم و به نقل از ورج، به گفته این شرکت، SeamlessM4T که مخفف عبارت «ترجمه ماشینی انبوه چندزبانه و چندوجهی» است میتواند گفتار به متن و متن به متن را برای نزدیک به 100 زبان ترجمه کند. این ابزار برای عملکردهای گفتار به گفتار و متن به گفتار، 100 زبان ورودی را تشخیص داده و آنها را به 35 زبان خروجی تبدیل میکند.
این ابزار تحت مجوز Creative Commons CC BY-NC 4.0 منتشر شده است و به محققان اجازه میدهد تا بر روی آن بازتولید داشته باشند.
همراه با SeamlessM4T، متا همچنین متادیتا برای دیتاست ترجمه باز خود، موسوم به SeamlessAlign، را منتشر کرد.
متا اعلام کرد: «ساخت یک مترجم زبان جهانی، مانند Babel Fish تخیلی در کتاب «راهنمای مسافر مجانی کهکشان» چالشبرانگیز است زیرا سیستمهای گفتار به گفتار و گفتار به نوشتار موجود تنها بخش کوچکی از زبانهای جهان را تحت پوشش قرار میدهند».
راهنمای سفر به بابل ماهی، همانطور که توسط نویسنده داگلاس آدامز طراحی شده است، ماهی است که میتوانید آن را در گوش خود قرار دهید تا فوراً هر زبانی را بفهمید. اگر از طرفداران Doctor Who هستید، میتوانید این ابزار متا را با یک ماتریس ترجمه در TARDIS مقایسه کنید که حتی کلمات موجودات فضایی را به انگلیسی تبدیل میکرد.
متا میگوید که SeamlessM4T نشاندهنده «پیشرفت قابلتوجه» است زیرا این مدل جدید کل کار ترجمه را یکجا انجام میدهد، برخلاف سایر مدلهای ترجمه بزرگ که ترجمه را در میان سیستمهای مختلف تقسیم میکنند.
یکی از قابلیتهای جالب SeamlessM4T، اگر بتواند به درستی عمل کند، توانایی آن در تشخیص زمانی است که یک سخنران در حال تغییر کد است یا زمانی که شخصی بین دو یا چند زبان در یک جمله سوئیچ میکند. به عنوان مثال، متا در یک ویدیو نشان داد که این مدل بلافاصله بین هندی، تلوگو و انگلیسی تفاوت قائل میشود.