ترجمه متن عکس‌ها توسط مترجم فیسبوک

مترجم ۲۴ زبانه فیسبوک موسوم به "روزتا" می‌تواند متون میلیون‌ها عکس را استخراج و آنها را ترجمه کند.

به گزارش ایسنا و به نقل از انگجت، افراد در دنیای مجازی تمایل دارند نه فقط با کلمات بلکه با تصاویر نیز ارتباط برقرار کنند. این امر برای یک پلتفرم مانند فیسبوک با بیش از 2 میلیارد کاربر فعال ماهانه، بدان معنی است که تعداد زیادی از تصاویر هر روز در این بستر ارسال می‌شوند.

فیسبوک برای نظارت بر این تصاویر که شامل متن هستند و برای آن که مطمئن شود حاوی سخنان مستهجن یا نفرت‌پراکنانه و نژادپرستانه نیستند و در چهارچوب قوانین فیسبوک قرار دارند، یک سیستم یادگیری ماشین بزرگ به نام "روزتا"(Rosetta) ایجاد کرده است.

فیسبوک نیاز به یک سیستم تشخیص کاراکتر نوری داشت که بتواند به طور منظم حجم زیادی از محتواها را پردازش کند. بنابراین باید فناوری مخصوص خود را توسعه می‌داد.

با توجه به هویت این شبکه اجتماعی، "روزتا" متون بیش از یک میلیارد تصویر و فریم‌های ویدیویی را که به زبان‌های متنوع نوشته شده‌اند در زمان واقعی استخراج و ترجمه می‌کند.

فیسبوک در یک پست جدید نحوه کار روزتا را اینگونه توضیح داد: روزتا با تشخیص قاب‌های مستطیلی که قابلیت حاوی متن بودن را دارند، آغاز می‌کند. سپس با استفاده از یک شبکه عصبی به شناسایی و رونویسی آنچه که در آن منطقه نوشته شده، حتی کلمات غیرانگلیسی یا حروف غیر لاتین مانند عربی و هندی می‌پردازد.

فیسبوک برای آموزش این سیستم، از ترکیب تصاویر به اشتراک گذاشته شده توسط انسان‌ها و ماشین‌ها استفاده کرد.

تیم‌های مختلف در فیسبوک و اینستاگرام در حال حاضر از روزتا استفاده می‌کنند تا محتوای بیشتری را بررسی و سیستم عامل خود را کنترل کنند.

این شرکت قصد دارد تا تعداد زبان‌هایی را که روزتا می‌تواند درک کند، افزایش دهد و کاری کنند تا در استخراج متن از فریم‌های ویدئویی بهتر عمل کند.

فیسبوک به تازگی 24 زبان جدید از جمله صربستانی، بلاروسی، مَراتی، سینهالی، تلوگو، نپالی، کانارا، اردو، پنجابی، کامبوجی، پشتو، مغولی، زولو، خوسایی و سومالیایی به سرویس ترجمه خودکار خود اضافه کرده است.

فیسبوک تایید کرد که ترجمه برای این زبان‌ها در مرحله اولیه است، بنابراین آنها هنوز هم خطاهای زیادی خواهند داشت. با این وجود، در نظر دارد تا آنها را بهبود بخشد و زبان‌های بیشتری را در آینده معرفی کند.