همانطور که می دانید یوتوب از سال 2009 میلادی سرویس اتوماسیون زیرنویس ویدیوهایش را راه اندازی کرده؛ سیستمی که به صورت خودکار محتوای گفتاری ویدیو را زیرنویس می کند و طی سال های اخیر پیشرفت های قابل توجهی به خود دیده، تا جایی که این روزها کمتر پیش می آید با غلط املایی یا تشخیص اشتباه عبارات در بخش زیرنویس روبرو شویم.
اما با این حال یوتوب دست از توسعه آن برنداشته و حالا خبر می دهد که از این پس تمام اصوات و صداهای غیر گفتاری نیز شامل زیرنویس می شوند؛ مثل (صدای خنده)، (پخش موسیقی) یا (تشویق جمعیت).
گفتنی است یوتوب مدعی شده این بخش هنوز در مراحل ابتدایی توسعه قرار دارد و به مرور زمان با ارتقائاتی همراه خواهد بود که حتی به افراد ناشنوا و یا کم شنوا نیز کمک شایانی خواهد کرد.
در آینده نزدیک مکانیزم شناخت صداهایی مانند (زنگ خوردن تلفن)، (پارس کردن سگ نگهبان) و (در زدن) نیز به پایگاه داده هوش مصنوعی زیرنویس خودکار اضافه خواهند شد. ناگفته نماند که این سیستم از همین حالا در اختیار میلیون ها کاربر یوتوب قرار گرفته است.
خبرهای بیشتر در رابطه با یوتوب